OpenAI tuyên bố tìm thấy bằng chứng cho thấy DeepSeek dùng mô hình của họ để đào tạo AI

Đăng bởi

lightmark
30/01/2025

OpenAI vừa gây bão khi tuyên bố có bằng chứng cho thấy DeepSeek – startup AI đang gây chấn động từ Trung Quốc – đã sử dụng đầu ra từ các mô hình của OpenAI để huấn luyện AI cạnh tranh trực tiếp. Nếu đúng như vậy, đây không chỉ là một vụ vi phạm điều khoản sử dụng, mà còn đặt ra câu hỏi lớn về sở hữu trí tuệ trong ngành AI.

Trong phát biểu với Financial Times, OpenAI tiết lộ rằng họ phát hiện dấu hiệu của phương pháp distillation trong cách DeepSeek đào tạo mô hình AI. Distillation (hay 'chưng cất') là một kỹ thuật phổ biến, giúp mô hình nhỏ hơn học lại từ mô hình lớn hơn để đạt hiệu suất tương tự với chi phí thấp hơn. Tuy nhiên, nếu DeepSeek thực sự sử dụng distillation từ GPT-4 để xây dựng AI riêng, điều này có thể vi phạm điều khoản của OpenAI, trong đó nghiêm cấm việc dùng đầu ra từ sản phẩm của họ để phát triển mô hình cạnh tranh.

OpenAI và Microsoft đã từng điều tra các tài khoản bị nghi ngờ liên quan đến DeepSeek vào năm ngoái. Khi phát hiện dấu hiệu vi phạm, các tài khoản này đã bị chặn truy cập API của OpenAI. Động thái này cho thấy căng thẳng giữa các công ty AI đang leo thang, nhất là khi DeepSeek tuyên bố chỉ tốn 5,6 triệu USD và 2.048 GPU Nvidia H800 để huấn luyện mô hình V3 với 671 tỷ tham số – một con số gây sốc khi so sánh với mức đầu tư khổng lồ của OpenAI và Google vào các mô hình tương đương.

Thậm chí, David Sacks, cựu cố vấn AI của chính quyền ông Donald Trump, cũng đưa ra quan điểm: "Có bằng chứng cho thấy DeepSeek đã 'hút cạn' tri thức từ mô hình của OpenAI." Tuy nhiên, ông không đưa ra bất kỳ bằng chứng cụ thể nào để chứng minh điều này.

DeepSeek chưa phản hồi về cáo buộc, một phần có thể do thông tin này xuất hiện vào dịp Tết Nguyên Đán tại Trung Quốc. Trong khi đó, giới phân tích nhận định rằng việc học hỏi từ đầu ra của mô hình AI lớn đã trở thành "chuyện bình thường" trong ngành. Ritwik Gupta, nghiên cứu sinh tiến sĩ tại Đại học Berkeley, cho rằng "việc tận dụng phản hồi từ mô hình AI thương mại như GPT-4 là cách nhiều startup và viện nghiên cứu tiết kiệm chi phí đào tạo mô hình."

Tuy nhiên, OpenAI khẳng định họ đã và đang thực hiện các biện pháp đối phó để bảo vệ công nghệ của mình. Trong tuyên bố mới nhất, công ty nhấn mạnh rằng Trung Quốc và nhiều đối thủ khác liên tục tìm cách 'hút' trí tuệ từ các mô hình AI hàng đầu của Mỹ. Vì vậy, OpenAI đang phối hợp chặt chẽ với chính phủ Mỹ để bảo vệ những công nghệ AI tiên tiến nhất khỏi "bàn tay của đối thủ."

Trớ trêu thay, OpenAI cũng đang đối mặt với các vụ kiện về vi phạm bản quyền, khi nhiều tờ báo lớn như The New York Times và các tác giả nổi tiếng cáo buộc họ sử dụng nội dung của mình để đào tạo mô hình AI mà không xin phép.

Vụ việc này cho thấy AI đang trở thành mặt trận cạnh tranh khốc liệt, nơi mà cả những ông lớn như OpenAI cũng không thể tránh khỏi cáo buộc "sao chép". Liệu OpenAI có thể bảo vệ công nghệ của mình trước DeepSeek, hay đây chỉ là một phần trong "cuộc chiến chất xám" của ngành AI?

Tham khảo Financial Times