OpenAI cho biết đã có bằng chứng DeepSeek sử dụng mô hình của mình để huấn luyện

(ft.com)

5 điểm bởi GN⁺ 2025-01-30 | 2 bình luận | Chia sẻ qua WhatsApp

OpenAI nói với Financial Times rằng họ đã phát hiện bằng chứng cho thấy startup AI Trung Quốc DeepSeek đã sử dụng các mô hình độc quyền của OpenAI để huấn luyện một mô hình cạnh tranh mã nguồn mở
Có nghi vấn DeepSeek đã sử dụng kỹ thuật "chưng cất tri thức (distillation)", tức tận dụng đầu ra của các mô hình lớn để huấn luyện hiệu quả các mô hình nhỏ hơn
Chưng cất là phương pháp phổ biến trong ngành AI, nhưng OpenAI cho rằng việc DeepSeek dùng cách này để phát triển mô hình riêng là hành vi vi phạm điều khoản dịch vụ của họ
Theo điều khoản của OpenAI, người dùng không được sao chép đầu ra của OpenAI hoặc dùng chúng để phát triển các mô hình cạnh tranh

Hiệu năng mô hình của DeepSeek và phản ứng thị trường

Việc ra mắt mô hình suy luận R1 của DeepSeek đã khiến giới công nghệ và nhà đầu tư bất ngờ
DeepSeek đang thu hút sự chú ý của ngành khi xây dựng được các mô hình có hiệu năng cao với chi phí tương đối thấp
Cổ phiếu Nvidia giảm 17% vào thứ Hai, làm bốc hơi 589 tỷ USD vốn hóa thị trường, nhưng đã phục hồi 9% vào thứ Ba
Nguyên nhân đợt giảm của Nvidia là lo ngại nhu cầu đối với phần cứng AI có thể suy yếu

Phản ứng của OpenAI và Microsoft

OpenAI và Microsoft năm ngoái đã điều tra và chặn các tài khoản bị nghi DeepSeek dùng API của OpenAI để thử thực hiện chưng cất
Bloomberg là đơn vị đầu tiên đưa tin về sự việc này
Microsoft từ chối bình luận về vấn đề này, còn OpenAI cũng không đưa ra bình luận thêm

Ý kiến của các chuyên gia

David Sacks, người từng phụ trách AI và tiền mã hóa trong chính quyền Trump, cho rằng "có thể đã xảy ra hành vi đánh cắp IP"
Một số nhà nghiên cứu AI phân tích rằng mô hình của DeepSeek cho thấy dấu hiệu đã học từ đầu ra của GPT-4
Ritwik Gupta, nghiên cứu sinh tiến sĩ AI tại UC Berkeley, giải thích rằng trong ngành AI, việc dùng đầu ra từ các LLM thương mại để huấn luyện mô hình là thông lệ phổ biến

Phản ứng của OpenAI và triển vọng sắp tới

OpenAI cảnh báo rằng nhiều công ty, bao gồm cả các công ty ở Trung Quốc, đang cố gắng chưng cất các mô hình của những công ty AI Mỹ
Công ty nhấn mạnh rằng để bảo vệ IP, họ đang thận trọng trong việc quyết định công bố các tính năng tiên tiến nhất của mô hình, đồng thời việc hợp tác với chính phủ Mỹ để ngăn rò rỉ công nghệ là điều quan trọng
Tuy nhiên, bản thân OpenAI cũng đang đối mặt với tranh cãi bản quyền riêng, bao gồm các vụ kiện từ The New York Times cùng nhiều cơ quan báo chí và chủ sở hữu bản quyền về cáo buộc sử dụng dữ liệu trái phép

2 bình luận

botplaysdice 2025-02-01

OpenAI đang kiện tụng với New York Times, vậy nếu thế này thì DeepSeek có được tự do khỏi vụ kiện đó không? :)

GN⁺ 2025-01-30

Ý kiến Hacker News

Có ý kiến cho rằng việc DeepSeek dùng dữ liệu của OpenAI để huấn luyện là không công bằng, nhưng lập luận này không phù hợp vì chính OpenAI cũng thu thập dữ liệu từ internet để huấn luyện
- Khẳng định rằng DeepSeek đã tái tạo hiệu năng ở mức o1 ngay từ đầu có thể không đúng, và điều này đặt ra nghi vấn về hiệu quả huấn luyện
- Bài báo R1 của DeepSeek cho thấy chưng cất mạnh mẽ đến mức nào, và nếu DeepSeek đã dùng đầu ra của o1 để huấn luyện mô hình thì điều đó có thể làm dấy lên nghi vấn về hiệu quả huấn luyện
Có ý kiến rằng việc DeepSeek công khai mã nguồn mở và giấy phép MIT sẽ là cơ hội để thu hút nhân tài lớn
- Việc mã nguồn mở các công nghệ mới từ trước đến nay luôn thúc đẩy sự phát triển
- OpenAI đang hợp tác với chính phủ Mỹ để bảo vệ IP, và cũng có khả năng DeepSeek sẽ bị cấm như TikTok
r1 được tạo ra trong bối cảnh sau o1, và các mô hình khác cũng có thể chưng cất từ r1
- Có ý kiến cho rằng việc chưng cất từ o1 không làm suy yếu tuyên bố về chi phí của DeepSeek
- Có nghi vấn liệu OpenAI có thực sự nắm giữ ưu thế về đạo đức hay luân lý hay không
Nếu DeepSeek đã được huấn luyện dựa trên OpenAI, thì đây không phải là việc được huấn luyện từ đầu với "pennies on the dollar", và có thể cũng không phải là một đột phá kỹ thuật
- Tuy nhiên điều này hiện vẫn chưa được xác nhận là sự thật
OpenAI hiện đang ở thế yếu và không thể tận dụng nguồn lực pháp lý như Google hay Microsoft
- Có ý kiến cho rằng chiến lược dùng vấn đề pháp lý để đè đối thủ của OpenAI sẽ không hiệu quả
Tương tự ngành đường sắt, AI cũng có thể là lĩnh vực mà cạnh tranh làm giảm chi phí, và phần lớn các khoản đầu tư có thể sẽ không tạo ra khối tài sản lớn
- Các ông lớn như Nvidia, OpenAI, DeepSeek đang đầu tư vào AI nhưng có thể sẽ không tạo ra lợi nhuận thực chất
Có chỉ trích rằng OpenAI sử dụng nội dung không xin phép và chi nhiều tiền để vượt qua các script chống AI scraping
- Nếu DeepSeek chỉ tái sử dụng dữ liệu của OpenAI thì đó không phải là đột phá về kỹ thuật mà chỉ là tái chế
Mô hình của OpenAI đã được huấn luyện dựa trên lượng lớn ebook thu thập từ các tracker torrent ebook cá nhân
- Các ebook đã được chuyển đổi sang định dạng epub, sắp xếp lại và lưu trữ trên kho dữ liệu công khai