Sau cơn địa chấn ChatGPT nổ ra, các công ty công nghệ Việt Nam nhanh chóng tuyên bố cuộc đua phát triển mô hình ngôn ngữ lớn tiếng Việt chẳng hạn như PhởGPT của VinAI - công ty con của Vingroup hay Zalo AI của VNG.
Nổi bật lên trong số đó, FPT tuyên bố bắt tay với tập đoàn Nvidia để xây dựng nhà máy AI trị giá 200 triệu USD, tham vọng biến Việt Nam thành một "cường quốc AI".
Sự hợp tác này được đánh giá có thể khiến ý tưởng mô hình ngôn ngữ lớn "Make in Vietnam" thực tế hơn khi nhà máy được trang bị hàng ngàn siêu chip GPU H100 - loại chip được đánh giá là kẻ thay đổi cuộc chơi trong lĩnh vực này.
FPT AI Factory - nhà máy AI đầu tiên của Việt Nam - sẵn sàng cung cấp dịch vụ vào tháng 1/2025, cổng thông tin điện tử Chính phủ đưa tin hôm 7/12/2024.
Tập đoàn Nvidia và chính phủ Việt Nam cũng dự định sẽ thành lập một trung tâm nghiên cứu và phát triển trí thông minh nhân tạo (AI) và một trung tâm dữ liệu AI tại Việt Nam, theo thỏa thuận được ký kết vào hôm 5/12 năm ngoái.
Nhân chuyến thăm các quốc gia Đông Nam Á của ông Jensen Huang, trang web chính thức của Nvidia cũng đăng tải bài viết nhan đề Thái Lan và Việt Nam áp dụng AI Chủ quyền để thúc đẩy tăng trưởng kinh tế.
AI chủ quyền (Sovereign AI), hay còn gọi là AI tự chủ, là một khái niệm mà Nvidia tích cực quảng bá trong những năm gần đây. Cả ông Jensen Huang nói riêng lẫn Nvidia nói chung thường xuyên nhắc đến tầm quan trọng của AI chủ quyền, và tất nhiên, quảng cáo cả các loại chip của Nvidia có thể giúp các quốc gia xây dựng mô hình AI này.
Chính phủ Việt Nam tin rằng FPT AI sẽ đặt nền móng để phát triển AI chủ quyền tại Việt Nam, tức trí tuệ nhân tạo của Việt Nam được xử lý tại Việt Nam, xây dựng và vận hành trong nước, phục vụ người dân và ngành công nghiệp của Việt Nam, theo cổng thông tin điện tử Chính phủ.
Siêu chip Nvidia GPU H100 đã được trang bị tại nhà máy FPT AI là một trong những chip đồ họa mạnh nhất hiện nay trên thị trường, được nhiều chuyên gia đánh giá là "kẻ thay đổi cuộc chơi AI".
"Tuy nhiên, việc tiếp cận các chip này tại Việt Nam vẫn rất hạn chế đối với cá nhân hoặc các tổ chức nhỏ, do chi phí đầu tư cao và tài nguyên không đồng đều. Điều này cản trở khả năng nghiên cứu và phát triển sâu rộng AI trong nước,'' kỹ sư AI cao cấp Hiếu Ngô tại một công ty công nghệ tài chính nhận định với BBC News Tiếng Việt vào ngày 25/12.
"Việc hợp tác với Nvidia để sở hữu hàng ngàn GPU H100 theo tôi là một cú hích lớn. Đây là loại chip tối tân, rất phù hợp để phát triển các mô hình ngôn ngữ lớn (LLM). Điều này không chỉ giúp Việt Nam bắt kịp các nước mạnh về công nghệ mà còn mở ra cơ hội xây dựng các nền tảng AI mang dấu ấn riêng," vị kỹ sư AI cho biết.
Những mô hình ngôn ngữ lớn phổ biến hiện nay có thể nhắc đến ChatGPT, Gemini hay Llama.
Trong khi AI chủ quyền hấp dẫn và đã được nhiều quốc gia theo đuổi, một số bên cũng đặt câu hỏi về khả năng AI chủ quyền có thể có tác động xấu.
AI chủ quyền là gì?
"Khái niệm AI chủ quyền chỉ mới xuất hiện vào khoảng năm ngoái (2023)," Chris Gow, giám đốc chính sách công EU của tập đoàn công nghệ Cisco, trả lời CNBC hồi tháng 11/2024.
Khái niệm về dữ liệu và chủ quyền công nghệ là một vấn đề trước đây đã nằm trong chương trình nghị sự của châu Âu. Phản ứng của các doanh nghiệp đối với các quy định mới về dữ liệu cũng phần nào khai sinh ra khái niệm này, theo CNBC.
Theo Nvidia, AI chủ quyền liên quan đến khả năng của một quốc gia trong việc sản xuất trí tuệ nhân tạo bằng cách sử dụng hạ tầng, dữ liệu, nguồn nhân lực, mạng lưới kinh doanh và cả văn hóa của riêng mình.
Tiến sĩ Muath Alduhishy chuyên về chuyển đổi số viết trên trang web của Diễn đàn Kinh tế Thế giới (WEF) vào tháng 4/2024 rằng theo thời gian, AI chủ quyền giúp một đất nước dần giảm sự phụ thuộc vào công nghệ AI nước ngoài bằng cách phát triển năng lực AI trong nước và đảm bảo quyền truy cập vào dữ liệu, công nghệ, chuyên môn và cơ sở hạ tầng quan trọng trên toàn quốc.
Điều này có thể bảo vệ đất nước khỏi những gián đoạn tiềm ẩn trong chuỗi cung ứng, do đó, củng cố chủ quyền quốc gia.
Một bài viết khác trên trang của WEF vào tháng 11/2024 cho rằng sức hấp dẫn của AI chủ quyền trở nên mạnh mẽ khi AI ngày càng trở nên quan trọng trong cuộc sống khắp toàn cầu và nhiều người đồng tình với việc không một quốc gia nào được độc quyền AI.
Hiện tại, nhiều LLM lớn nhất thế giới, như ChatGPT của OpenAI và Claude của Anthropic, sử dụng các trung tâm dữ liệu đặt tại Mỹ cho mục đích lưu trữ và xử lý yêu cầu thông qua đám mây (cloud).
Bên cạnh đó, AI chủ quyền có thể phần nào xóa tan nỗi sợ mất đi bản sắc trong bối cạnh toàn cầu hóa. Đây cũng chính là nỗi sợ đã tiếp thêm năng lượng cho phong trào chính trị dân túy đang trỗi dậy trong những năm trở lại đây.
Ngoài ra, các AI tạo sinh (generative AI) đang bùng nổ mạnh mẽ, điển hình như ChatGPT, Gemini hay Copilot đang trở thành công cụ được sử dụng nhiều trong đời sống thường nhật.
Theo một bài viết trên WEF vào tháng 11/2024, có lẽ nhiều chính phủ không muốn người dân mình tiếp nhận nội dung từ các công cụ được phát triển, lập trình ở những nơi có văn hóa, tư tưởng chính trị khác biệt.
"Trước tiên, đây là vấn đề an ninh quốc gia. Việc phụ thuộc vào công nghệ AI nước ngoài trong các lĩnh vực nhạy cảm như quốc phòng hay tài chính có thể tạo ra những rủi ro về an ninh. Thứ hai là yếu tố kinh tế. AI được xem là chìa khóa của nền kinh tế số trong tương lai, nên việc làm chủ công nghệ này sẽ giúp các nước tự chủ hơn và tăng sức cạnh tranh. Cuối cùng là vấn đề dữ liệu và văn hóa. Khi phát triển AI trong nước, các quốc gia có thể bảo vệ tốt hơn dữ liệu người dân, đồng thời xây dựng các hệ thống phù hợp với ngôn ngữ và văn hóa bản địa," Kỹ sư Hiếu Ngô bình luận.
"Một trong những thách thức lớn nhất của ngành AI tại Việt Nam hiện nay là dữ liệu chất lượng cao, đặc biệt là dữ liệu tiếng Việt. Hiện tại, phần lớn các bộ dữ liệu được sử dụng trong AI, đặc biệt các loại dữ liệu lập luận (reasoning) cho LLM, vẫn thiên về tiếng Anh."
"Dữ liệu tiếng Việt, dù đã có một số tiến bộ, nhưng vẫn còn hạn chế về số lượng lẫn chất lượng, dẫn đến khó khăn trong việc xây dựng các mô hình AI thực sự tối ưu cho ngôn ngữ và văn hóa Việt Nam," vị kỹ sư AI nói thêm.
Những năm gần đây, một số quốc gia tích cực đầu tư vào các mô hình dựa trên khái niệm AI chủ quyền.
Đài Loan vào năm 2023 đã khởi động phát triển TAIDE - một mô hình ngôn ngữ lớn nhằm chống lại ảnh hưởng của các chatbot AI vốn tuân thủ các giá trị "xã hội chủ nghĩa cốt lõi" của Trung cộng, theo một bài viết của Viện Nghiên cứu Lawfare (Mỹ) vào tháng 11/2024.
Một số ví dụ nổi bật khác có thể kể tới GPT-NL của Hà Lan, SEA-LION của Singapore và GPT-SW3 của Thụy Điển. Điểm chung của các mô hình này là đều sử dụng chip của Nvidia.
Trên trang web chính thức, Nvidia cho rằng sáng kiến Quốc gia AI (AI Nations) của họ đã giúp các quốc gia ở mọi khu vực trên toàn cầu xây dựng năng lực AI chủ quyền.
Mặt trái của AI chủ quyền
"AI Chủ quyền có tiềm năng cho các mục đích tích cực, nhưng nếu rơi vào tay các chế độ độc tài, nó có khả năng tạo ra những mối đe dọa lớn đối với sự tự do, quyền riêng tư và nhân quyền," Giáo sư Ahmed Banafa chuyên về khoa học máy tính tại Đại học Tiểu bang San Jose nhận định vào hôm 22/12.
Ông Banafa bình luận rằng tại những quốc gia chuyên chế như Việt Nam, mô hình AI chủ quyền có thể đem đến các rủi ro điển hình như tăng cường sự giám sát và quản lý; gia tăng sự đàn áp phe bất đồng chính kiến; xâm phạm quyền riêng tư; thao túng ý kiến công chúng; xâm hại nhân quyền; hạn chế sự tự do và sáng tạo.
Reuters vào tháng 4/2022 cho hay hàng chục công ty Trung cộng đã phát triển AI để phân loại dữ liệu thu thập được về cư dân nhằm đáp ứng nhu cầu nâng cấp công cụ giám sát của các cơ quan chính quyền.
AI đang hỗ trợ chính phủ Trung cộng hiệu quả trong việc kiểm duyệt nội dung trên mạng xã hội.
"Khi chính phủ chuyên chế kiểm soát AI, họ có thể dễ dàng tạo ra nhiều chiến dịch tuyên truyền hơn, nhằm ảnh hưởng đến nhận thức công chúng. Bên cạnh đó, AI cũng giúp gia tăng hiệu ứng buồng dội thông tin (echo chamber) cho các chiến dịch tuyên truyền này hơn nữa," Giáo sư Banafa nói.
Buồng dội thông tin ngăn người đọc tiếp nhận các ý kiến, nguồn tin đối lập, qua đó hạn chế việc mở rộng góc nhìn.
Diễn đàn Kinh tế Thế giới đưa ra ví dụ về mặt trái khác của AI chủ quyền: một quốc gia sử dụng các hệ thống AI được đào tạo trên một tập hợp các giá trị địa phương cho mục đích an ninh của mình có thể gắn thẻ cho hành vi không đồng bộ với các giá trị đó là một mối đe dọa.
Liên hệ tới xã hội Việt Nam, khi các hội, nhóm yêu nước cực đoan thời gian qua liên tục đấu tố những cá nhân, đoàn thể mà họ cho rằng đang thể hiện quan điểm ngược lại với chính quyền, liệu hình ảnh lá cờ vàng ba sọc đỏ hay những ngôn từ phê bình Đảng Cộng sản sẽ bị gắn thẻ "mối đe dọa an ninh quốc gia" hay không?
Việc gắn thẻ này, theo ông Banafa, có thể cổ xúy cho những động thái phân biệt đối xử đối với cá nhân bị gắn thẻ ngay cả khi họ chưa vi phạm pháp luật.
Cùng với hiệu ứng buồng dội thông tin đề cập ở trên, những người yêu nước cực đoan có thể chỉ tiếp nhận được những ý kiến chung chiều hướng với mình.
Như Nvidia thường quảng cáo, AI chủ quyền xây dựng theo văn hóa, bản sắc của một địa phương. Ở Việt Nam, người Kinh áp đảo về mặt dân số, có sức ảnh hưởng văn hóa và ngôn ngữ mạnh mẽ hơn so với toàn bộ 53 dân số thiểu số khác.
Việc không có đồng thuận có thể càng khiến các định kiến xã hội trở nên sâu sắc hơn, "gây hại cho các cộng đồng nhất định", theo lời ông Banafa.
Một bài viết trên Diễn đàn Kinh tế Thế giới cho rằng khó để tưởng tượng mô hình AI chủ quyền sẽ dùng văn hóa, bản sắc nào để đại diện cho Mỹ, đặc biệt khi quốc gia này đã chứng minh sự phân cực rõ rệt qua cuộc bầu cử vừa rồi.
Tổ chức Hội đồng Đại Tây Dương (Mỹ) nhận định AI chủ quyền có thể vô tình tạo điều kiện cho các chính phủ độc tài phá vỡ hình thức quản trị đa bên đối với công nghệ kỹ thuật số vốn giúp duy trì mạng internet toàn cầu cởi mở và có tính tương tác.
AI chủ quyền sẽ giúp nhà nước có toàn quyền định nghĩa, đảm bảo hoặc từ chối quyền lợi trong không gian kỹ thuật số, Hội đồng Đại Tây Dương nhận định.
Sự minh bạch trong quá trình nhập liệu để huấn luyện AI cũng là một mối quan ngại khác.
"Đối với các chính quyền chuyên chế, đảm bảo tính minh bạch trong các quá trình đào tạo AI đặt ra những thách thức đáng kể. Trong khi tính minh bạch là điều cần thiết để xây dựng lòng tin của công chúng và giảm thiên kiến, các chế độ này thường ưu tiên sự kiểm soát hơn là sự cởi mở," ông Banafa nhận xét.
Liên quan đến việc ngăn thiên kiến trong việc huấn luyện AI, Kỹ sư Hiếu Ngô trả lời:
"Việc AI tạo sinh cho ra các kết quả mang thiên kiến là điều hoàn toàn có thể xảy ra, và đây cũng là một trong những thách thức lớn nhất khi áp dụng AI ở quy mô toàn quốc. Nếu dữ liệu đầu vào không đa dạng hoặc phản ánh các định kiến xã hội, mô hình sẽ học theo các thiên kiến này."
Để giải quyết vấn đề đó thì cần củng cố sự minh bạch trong quá trình huấn luyện AI, và việc minh bạch dữ liệu là yếu tố quan trọng hàng đầu. Cần công khai rõ ràng nguồn gốc, cách thu thập và xử lý dữ liệu, đồng thời đảm bảo dữ liệu được đa dạng hóa và đại diện tốt cho toàn bộ dân số. Bên cạnh đó, cần thực hiện các bài kiểm tra định kỳ để đánh giá và kiểm soát thiên kiến, giúp phát hiện và giảm thiểu những sai lệch không mong muốn trong mô hình."
Giáo sư Banafa cảnh báo rằng các chính phủ chuyên chế có thể tự lập ra các cơ quan giám sát vừa để củng cố câu chuyện mà họ tuyên truyền trong nước vừa giữ hình ảnh minh bạch trước quốc tế. Nhưng tính minh bạch mà các quốc gia độc tài thể hiện hiếm khi sánh được với trách nhiệm giải trình được thấy trong các hệ thống dân chủ.
No comments:
Post a Comment
Note: Only a member of this blog may post a comment.