- OpenAI nói với Financial Times rằng họ đã phát hiện bằng chứng cho thấy startup AI Trung Quốc DeepSeek đã sử dụng các mô hình độc quyền của OpenAI để huấn luyện một mô hình cạnh tranh mã nguồn mở
- Có nghi vấn DeepSeek đã sử dụng kỹ thuật "chưng cất tri thức (distillation)", tức tận dụng đầu ra của các mô hình lớn để huấn luyện hiệu quả các mô hình nhỏ hơn
- Chưng cất là phương pháp phổ biến trong ngành AI, nhưng OpenAI cho rằng việc DeepSeek dùng cách này để phát triển mô hình riêng là hành vi vi phạm điều khoản dịch vụ của họ
- Theo điều khoản của OpenAI, người dùng không được sao chép đầu ra của OpenAI hoặc dùng chúng để phát triển các mô hình cạnh tranh
Hiệu năng mô hình của DeepSeek và phản ứng thị trường
- Việc ra mắt mô hình suy luận R1 của DeepSeek đã khiến giới công nghệ và nhà đầu tư bất ngờ
- DeepSeek đang thu hút sự chú ý của ngành khi xây dựng được các mô hình có hiệu năng cao với chi phí tương đối thấp
- Cổ phiếu Nvidia giảm 17% vào thứ Hai, làm bốc hơi 589 tỷ USD vốn hóa thị trường, nhưng đã phục hồi 9% vào thứ Ba
- Nguyên nhân đợt giảm của Nvidia là lo ngại nhu cầu đối với phần cứng AI có thể suy yếu
Phản ứng của OpenAI và Microsoft
- OpenAI và Microsoft năm ngoái đã điều tra và chặn các tài khoản bị nghi DeepSeek dùng API của OpenAI để thử thực hiện chưng cất
- Bloomberg là đơn vị đầu tiên đưa tin về sự việc này
- Microsoft từ chối bình luận về vấn đề này, còn OpenAI cũng không đưa ra bình luận thêm
Ý kiến của các chuyên gia
- David Sacks, người từng phụ trách AI và tiền mã hóa trong chính quyền Trump, cho rằng "có thể đã xảy ra hành vi đánh cắp IP"
- Một số nhà nghiên cứu AI phân tích rằng mô hình của DeepSeek cho thấy dấu hiệu đã học từ đầu ra của GPT-4
- Ritwik Gupta, nghiên cứu sinh tiến sĩ AI tại UC Berkeley, giải thích rằng trong ngành AI, việc dùng đầu ra từ các LLM thương mại để huấn luyện mô hình là thông lệ phổ biến
Phản ứng của OpenAI và triển vọng sắp tới
- OpenAI cảnh báo rằng nhiều công ty, bao gồm cả các công ty ở Trung Quốc, đang cố gắng chưng cất các mô hình của những công ty AI Mỹ
- Công ty nhấn mạnh rằng để bảo vệ IP, họ đang thận trọng trong việc quyết định công bố các tính năng tiên tiến nhất của mô hình, đồng thời việc hợp tác với chính phủ Mỹ để ngăn rò rỉ công nghệ là điều quan trọng
- Tuy nhiên, bản thân OpenAI cũng đang đối mặt với tranh cãi bản quyền riêng, bao gồm các vụ kiện từ The New York Times cùng nhiều cơ quan báo chí và chủ sở hữu bản quyền về cáo buộc sử dụng dữ liệu trái phép
2 bình luận
OpenAI đang kiện tụng với New York Times, vậy nếu thế này thì DeepSeek có được tự do khỏi vụ kiện đó không? :)
Ý kiến Hacker News
Có ý kiến cho rằng việc DeepSeek dùng dữ liệu của OpenAI để huấn luyện là không công bằng, nhưng lập luận này không phù hợp vì chính OpenAI cũng thu thập dữ liệu từ internet để huấn luyện
Có ý kiến rằng việc DeepSeek công khai mã nguồn mở và giấy phép MIT sẽ là cơ hội để thu hút nhân tài lớn
r1 được tạo ra trong bối cảnh sau o1, và các mô hình khác cũng có thể chưng cất từ r1
Nếu DeepSeek đã được huấn luyện dựa trên OpenAI, thì đây không phải là việc được huấn luyện từ đầu với "pennies on the dollar", và có thể cũng không phải là một đột phá kỹ thuật
OpenAI hiện đang ở thế yếu và không thể tận dụng nguồn lực pháp lý như Google hay Microsoft
Tương tự ngành đường sắt, AI cũng có thể là lĩnh vực mà cạnh tranh làm giảm chi phí, và phần lớn các khoản đầu tư có thể sẽ không tạo ra khối tài sản lớn
Có chỉ trích rằng OpenAI sử dụng nội dung không xin phép và chi nhiều tiền để vượt qua các script chống AI scraping
Mô hình của OpenAI đã được huấn luyện dựa trên lượng lớn ebook thu thập từ các tracker torrent ebook cá nhân