Return to site

5 điều cần biết về xu thế mới nhất trong AI: Mô hình Nền tảng (Foundation Models) 

Story by The Conversation

April 25, 2022

Các mô hình nền tảng hiện đang là cơ sở cho DALLE-2, GPT-3 và các AI thế hệ tiếp theo.

Nếu bạn đã xem qua những bức ảnh về một ấm trà trong hình dạng quả bơ hoặc đọc một bài báo hay nhưng bạn có cảm giác ngờ ngợ, bạn có thể đã tiếp xúc với một xu thế mới của trí tuệ nhân tạo (AI). Các hệ thống máy học được gọi là DALL-E, GPT và PaLM đang gây chú ý với khả năng thực thi những công việc sáng tạo một cách đáng kinh ngạc.

Những hệ thống này được gọi là “mô hình nền tảng” (foundation models), và đây không phải là một chiêu trò marketing. Vậy cách tiếp cận mới này đối với AI hoạt động như thế nào? Liệu đây có phải là dấu chấm hết cho sự sáng tạo của con người và là khởi đầu của một cơn ác mộng deep-fake trong tương lai?

1. Mô hình nền tảng là gì?

Các mô hình nền tảng hoạt động bằng cách huấn luyện một hệ thống khổng lồ dựa trên lượng lớn dữ liệu cơ bản, sau đó áp hệ thống này vào để giải quyết các vấn đề mới (trong khi đó các mô hình AI trước có xu hướng bắt đầu giải quyết lại từ đầu mỗi khi gặp vấn đề mới).

Ví dụ, DALL-E 2 đã được huấn luyện để tìm bức ảnh (chẳng hạn như ảnh một chú mèo) cho phù hợp với chú thích (“Ông Fuzzyboots chú mèo mướp đang thư giãn dưới ánh nắng mặt trời”) bằng cách quét hàng trăm triệu ví dụ. Sau khi được huấn luyện, mẫu AI này đã biết nhận ra mèo (và những thứ khác) trông như thế nào trong bức tranh.

Nhưng mô hình này cũng có thể được sử dụng cho nhiều tác vụ AI thú vị khác, chẳng hạn như tự tạo ra hình ảnh mới chỉ từ chú thích (“Cho tôi xem một con gấu túi đang ném bóng rổ”) hoặc chỉnh sửa hình ảnh dựa trên hướng dẫn bằng văn bản (“Làm cho nó trông giống như con khỉ ”).

2. Chúng hoạt động như thế nào?

Các mô hình nền tảng chạy trên “mạng thần kinh sâu” (deep neural networks) được lấy cảm hứng từ cách thức hoạt động của não bộ - hoạt động này liên quan đến toán học phức tạp và một lượng lớn sức mạnh tính toán - sau đó chúng được cô đọng thành một tổ hợp các mẫu.

Ví dụ: bằng cách xem xét hàng triệu hình ảnh, một mạng lưới thần kinh sâu có thể liên kết từ "mèo" với các mẫu pixel thường xuất hiện trong hình ảnh của mèo - như các đốm màu mềm, mờ, có lông. Mô hình càng nhìn thấy nhiều ví dụ (càng hiển thị nhiều dữ liệu) và mô hình càng lớn (càng có nhiều “lớp” hoặc “độ sâu”), thì chúng càng phức tạp và cho ta sự tương quan càng chính xác hơn.

Theo một nghĩa nào đó, các mô hình nền tảng chỉ là một phần mở rộng của mô hình “học sâu” (deep learning) đã thống trị nghiên cứu AI trong thập kỷ qua. Tuy nhiên, mô hình nền tảng có khả năng thể hiện những hành vi không được lập trình hoặc “xuất hiện ngoài dự đoán” có thể gây ra nhiều ngạc nhiên cho chúng ta.

Ví dụ: mô hình ngôn ngữ PaLM của Google dường như có thể đưa ra lời giải thích cho các phép ẩn dụ và câu chuyện cười phức tạp. Điều này không chỉ đơn giản là bắt chước các loại dữ liệu có sẵn mà AI đã được đào tạo ban đầu để xử lý dữ liệu.

3. Tiếp cận Công nghệ này còn đang rất hạn chế

Rất khó để xác định được quy mô của những hệ thống AI này. PaLM có 540 tỷ tham số, có nghĩa là ngay cả khi mọi người trên hành tinh này mỗi người đều ghi nhớ 50 con số, chúng ta vẫn sẽ không có đủ bộ nhớ để tái tạo mô hình.

Các mô hình rất lớn nên việc đào tạo chúng đòi hỏi một lượng lớn tài nguyên tính toán và các nguồn lực khác nhau. Một ước tính đưa ra chi phí đào tạo mô hình ngôn ngữ GPT-3 của OpenAI vào khoảng 5 triệu đô la Mỹ.

Do đó, chỉ có các công ty công nghệ lớn như OpenAI, Google và Baidu mới đủ khả năng xây dựng các mô hình nền tảng vào lúc này. Các công ty này giới hạn những người có thể truy cập vào hệ thống vì lí do kinh tế.

Các hạn chế sử dụng có thể mang lại cho chúng ta một chút an tâm nào đó khi các hệ thống này sẽ sớm không bị sử dụng cho các mục đích bất chính (chẳng hạn như tạo tin tức giả mạo hoặc nội dung phỉ báng). Nhưng điều này cũng có nghĩa là các nhà nghiên cứu độc lập không thể tham gia thẩm vấn các hệ thống này và chia sẻ kết quả một cách cởi mở và chính xác. Vì vậy, hiện tại chúng ta vẫn chưa biết đầy đủ ý nghĩa của việc sử dụng chúng.

4. Những mô hình này sẽ có ý nghĩa gì đối với các ngành công nghiệp ‘sáng tạo’?

Nhiều mô hình nền tảng sẽ được sản xuất trong những năm tới. Các mô hình nhỏ hơn đã được xuất bản dưới dạng mã nguồn mở, các công ty công nghệ đang bắt đầu thử nghiệm cấp phép và thương mại hóa các công cụ này và các nhà nghiên cứu AI đang làm việc để làm công nghệ hiệu quả hơn và dễ tiếp cận hơn.

Tính sáng tạo đáng chú ý được thể hiện bởi các mô hình như PaLM và DALL-E 2 chứng tỏ rằng các công việc chuyên về sáng tạo có thể bị tác động bởi công nghệ này sớm hơn dự kiến ​​ban đầu. Mọi người thường luôn cho rằng robot sẽ thay thế những công việc giản đơn trước tiên và công việc văn phòng phức tạp hơn sẽ tương đối an toàn trước làn sóng tự động hóa - đặc biệt là những công việc chuyên môn đòi hỏi sự sáng tạo và học hỏi.

Các mô hình AI học sâu đã thể hiện độ chính xác siêu phàm trong các tác vụ như xem xét tia X và phát hiện tình trạng thoái hóa điểm vàng của mắt. Các mô hình nền tảng có thể sớm cung cấp khả năng sáng tạo với giá rẻ hơn và “đủ tốt” trong các lĩnh vực như quảng cáo, viết bài quảng cáo, kiếm hình ảnh hoặc thiết kế đồ họa.

Tương lai của công việc chuyên môn cao và sáng tạo có thể khác một chút so với những gì chúng ta tưởng tượng.

5. Điều này mang ý nghĩa như thế nào về mặt pháp lý, tin tức và truyền thông

Các mô hình nền tảng chắc chắn sẽ ảnh hưởng đến luật pháp trong các lĩnh vực như sở hữu trí tuệ và những công việc liên quan đến chứng cứ, vì một lẽ chúng ta sẽ không thể quy cho một cách hiển nhiên rằng những nội dung sáng tạo là kết quả của hoạt động do con người.

Chúng ta cũng sẽ phải đối mặt với thách thức về tin tức giả và thông tin sai lệch do các hệ thống này tạo ra. Thực tế chúng ta đã đang phải đối mặt với những vấn đề to lớn về thông tin sai lệch, như cách chúng ta đang thấy trong cuộc chiến Ukraine vs Nga với những vấn đề hình ảnh và video giả mạo, nhưng các mô hình nền tảng đã sẵn sàng để giải quyết những thách thức này.

Giờ là lúc sẵn sàng

Là những nhà nghiên cứu nghiên cứu tác động của AI đối với xã hội, chúng tôi nghĩ rằng các mô hình nền tảng sẽ mang lại những biến đổi lớn. Chúng đang được kiểm soát chặt chẽ (tại thời điểm hiện tại), vì vậy chúng ta có thể có một chút thời gian để tìm hiểu trước khi chúng trở thành một vấn đề lớn.