Trong một động thái được xem là cú quay xe của OpenAI, công ty vốn nổi tiếng với các mô hình AI đóng và độc quyền, đã vừa chính thức tung ra hai mô hình suy luận AI có trọng số mở (open-weight). Đây là lần đầu tiên họ thực sự mở lòng với cộng đồng kể từ khi phát hành GPT-2 hơn 5 năm trước.
Đây không chỉ là một bản cập nhật sản phẩm. Nó là một nước đi mang tính địa chính trị, một lời đáp trả cho các đối thủ và là một sự thay đổi trong triết lý của chính OpenAI. Hãy cùng tôi phân tích sâu về ý nghĩa đằng sau động thái này.
Mô Hình AI mở của OpenAI
OpenAI đã ra mắt hai mô hình mới với tên gọi gpt-oss-120b và gpt-oss-20b. Điểm đặc biệt của chúng là:
- gpt-oss-120b: Một mô hình lớn và mạnh mẽ, nhưng được tối ưu để có thể chạy trên một GPU Nvidia duy nhất.
- gpt-oss-20b: Một phiên bản nhẹ hơn, có thể chạy trên một chiếc laptop thông thường với 16GB RAM.
Cả hai mô hình này đều được cung cấp miễn phí để tải về trên nền tảng Hugging Face. Điều này có nghĩa là các nhà phát triển, nhà nghiên cứu và thậm chí cả những người đam mê công nghệ cá nhân giờ đây cũng có thể sở hữu và tùy chỉnh một phần công nghệ của OpenAI ngay trên máy tính của mình.
Tuy nhiên, cần phải làm rõ: đây là mô hình trọng số mở chứ không phải mã nguồn mở hoàn toàn. OpenAI không công bố dữ liệu đã dùng để huấn luyện chúng, một động thái dễ hiểu trong bối cảnh các vụ kiện về bản quyền đang diễn ra.
Tại sao OpenAI lại bất ngờ thay đổi?
Động thái này không phải là ngẫu nhiên. Nó xuất phát từ ba áp lực chính:
- Áp lực cạnh tranh từ Trung Quốc: Các phòng thí nghiệm AI của Trung Quốc như DeepSeek, Qwen (của Alibaba), và Moonshot AI đã và đang thống trị không gian AI mở với những mô hình cực kỳ mạnh mẽ và phổ biến. OpenAI nhận ra rằng họ không thể bỏ trống mặt trận quan trọng này.
- Lời kêu gọi từ chính phủ Mỹ: Chính quyền của Tổng thống Trump đã kêu gọi các nhà phát triển AI của Mỹ mở hơn nữa công nghệ của mình để thúc đẩy việc áp dụng AI trên toàn cầu theo các giá trị của Mỹ. Việc phát hành gpt-oss là một cách để OpenAI nhận được sự ủng hộ từ cả cộng đồng phát triển lẫn chính phủ.
- Sự thay đổi trong tư duy của Sam Altman: Chính CEO Sam Altman đã thừa nhận vào tháng 1 rằng ông tin OpenAI đã “đứng sai phía của lịch sử” khi nói đến việc mở nguồn công nghệ. Động thái này là một bước đi cụ thể để sửa chữa điều đó.
Sức mạnh thực sự đến đâu?
OpenAI tuyên bố các mô hình này là tiên tiến nhất trong số các mô hình mở, và các benchmark đã chứng minh điều đó… một phần.
- Điểm mạnh: Trên các bài kiểm tra về lập trình và kiến thức tổng quát, cả hai mô hình gpt-oss đều vượt trội hơn các mô hình mở hàng đầu hiện nay như R1 của DeepSeek hay Qwen.
- Điểm yếu: Chúng vẫn kém hơn đáng kể so với các mô hình đóng của chính OpenAI như o3 hay o4-mini.
- Điểm yếu chí mạng (Hallucination): Đây là vấn đề lớn nhất. Các mô hình này có tỷ lệ ảo giác (đưa ra thông tin sai lệch) cực kỳ cao. Trên bài kiểm tra PersonQA, tỷ lệ này lên tới 49% cho bản 120b và 53% cho bản 20b. Con số này cao hơn gấp 3 lần so với mô hình o1 của OpenAI.
OpenAI giải thích rằng điều này là có thể lường trước, vì các mô hình nhỏ hơn có ít kiến thức về thế giới hơn và có xu hướng ảo giác nhiều hơn.
Tính năng lai độc đáo và giấy phép Apache 2.0
Một trong những điểm thông minh nhất trong lần ra mắt này là khả năng lai của các mô hình. Nếu một mô hình gpt-oss không thể thực hiện một tác vụ phức tạp (ví dụ: xử lý hình ảnh), các nhà phát triển có thể kết nối nó với một mô hình đóng mạnh mẽ hơn của OpenAI trên đám mây.
Về giấy phép, OpenAI sử dụng Apache 2.0, một trong những giấy phép cho phép sử dụng tự do nhất. Điều này cho phép các doanh nghiệp thương mại hóa các mô hình này mà không cần trả phí hay xin phép OpenAI.
Một nước đi hai mang đầy khôn ngoan
Đây là một nước đi chiến lược cực kỳ khôn ngoan và có phần hai mang.
- Một con ngựa thành Troy: OpenAI đang tung ra một món quà hấp dẫn để lôi kéo các nhà phát triển vào hệ sinh thái của mình. Các mô hình này đủ mạnh để thu hút, nhưng cũng có những hạn chế (như ảo giác cao) và thiếu sót (chỉ xử lý văn bản) để khuyến khích các nhà phát triển phải sử dụng đến các API trả phí mạnh mẽ hơn của họ. Tính năng lai chính là sợi dây kết nối đó.
- Định nghĩa lại cuộc chơi mở: OpenAI đang cố gắng định hình lại khái niệm AI mở. Thay vì là sự minh bạch hoàn toàn về dữ liệu, “mở” trong mắt họ là việc cung cấp một nền tảng mạnh mẽ để cộng đồng xây dựng, nhưng vẫn giữ OpenAI ở vị trí trung tâm.
Một bài học về sự cân bằng: Sự ra mắt này cho thấy một sự thật quan trọng: có một sự đánh đổi lớn giữa khả năng tiếp cận (chạy trên phần cứng yếu) và độ tin cậy (tỷ lệ ảo giác). Đây là một lời cảnh tỉnh cho những ai muốn vội vàng ứng dụng các mô hình này vào các lĩnh vực nhạy cảm.
Việc OpenAI phát hành gpt-oss-120b và gpt-oss-20b là một cột mốc quan trọng, đánh dấu sự trở lại của họ trên mặt trận AI mở. Đây là một động thái chiến lược thông minh để cạnh tranh, thu hút cộng đồng và đáp ứng các yêu cầu địa chính trị.
Tuy nhiên, người dùng và các nhà phát triển cần phải tỉnh táo. Đây là những công cụ mạnh mẽ nhưng cũng đầy “tì vết”. Cuộc đua AI giờ đây không chỉ diễn ra ở phân khúc cao cấp nhất, mà còn ở cả sân chơi của những mô hình mở, nơi sự cân bằng giữa sức mạnh, chi phí và độ tin cậy sẽ quyết định người chiến thắng.