5 điểm bởi GN⁺ 2025-01-30 | 2 bình luận | Chia sẻ qua WhatsApp
  • OpenAI nói với Financial Times rằng họ đã phát hiện bằng chứng cho thấy startup AI Trung Quốc DeepSeek đã sử dụng các mô hình độc quyền của OpenAI để huấn luyện một mô hình cạnh tranh mã nguồn mở
  • Có nghi vấn DeepSeek đã sử dụng kỹ thuật "chưng cất tri thức (distillation)", tức tận dụng đầu ra của các mô hình lớn để huấn luyện hiệu quả các mô hình nhỏ hơn
  • Chưng cất là phương pháp phổ biến trong ngành AI, nhưng OpenAI cho rằng việc DeepSeek dùng cách này để phát triển mô hình riêng là hành vi vi phạm điều khoản dịch vụ của họ
  • Theo điều khoản của OpenAI, người dùng không được sao chép đầu ra của OpenAI hoặc dùng chúng để phát triển các mô hình cạnh tranh

Hiệu năng mô hình của DeepSeek và phản ứng thị trường

  • Việc ra mắt mô hình suy luận R1 của DeepSeek đã khiến giới công nghệ và nhà đầu tư bất ngờ
  • DeepSeek đang thu hút sự chú ý của ngành khi xây dựng được các mô hình có hiệu năng cao với chi phí tương đối thấp
  • Cổ phiếu Nvidia giảm 17% vào thứ Hai, làm bốc hơi 589 tỷ USD vốn hóa thị trường, nhưng đã phục hồi 9% vào thứ Ba
  • Nguyên nhân đợt giảm của Nvidia là lo ngại nhu cầu đối với phần cứng AI có thể suy yếu

Phản ứng của OpenAI và Microsoft

  • OpenAI và Microsoft năm ngoái đã điều tra và chặn các tài khoản bị nghi DeepSeek dùng API của OpenAI để thử thực hiện chưng cất
  • Bloomberg là đơn vị đầu tiên đưa tin về sự việc này
  • Microsoft từ chối bình luận về vấn đề này, còn OpenAI cũng không đưa ra bình luận thêm

Ý kiến của các chuyên gia

  • David Sacks, người từng phụ trách AI và tiền mã hóa trong chính quyền Trump, cho rằng "có thể đã xảy ra hành vi đánh cắp IP"
  • Một số nhà nghiên cứu AI phân tích rằng mô hình của DeepSeek cho thấy dấu hiệu đã học từ đầu ra của GPT-4
  • Ritwik Gupta, nghiên cứu sinh tiến sĩ AI tại UC Berkeley, giải thích rằng trong ngành AI, việc dùng đầu ra từ các LLM thương mại để huấn luyện mô hình là thông lệ phổ biến

Phản ứng của OpenAI và triển vọng sắp tới

  • OpenAI cảnh báo rằng nhiều công ty, bao gồm cả các công ty ở Trung Quốc, đang cố gắng chưng cất các mô hình của những công ty AI Mỹ
  • Công ty nhấn mạnh rằng để bảo vệ IP, họ đang thận trọng trong việc quyết định công bố các tính năng tiên tiến nhất của mô hình, đồng thời việc hợp tác với chính phủ Mỹ để ngăn rò rỉ công nghệ là điều quan trọng
  • Tuy nhiên, bản thân OpenAI cũng đang đối mặt với tranh cãi bản quyền riêng, bao gồm các vụ kiện từ The New York Times cùng nhiều cơ quan báo chí và chủ sở hữu bản quyền về cáo buộc sử dụng dữ liệu trái phép

2 bình luận

 
botplaysdice 2025-02-01

OpenAI đang kiện tụng với New York Times, vậy nếu thế này thì DeepSeek có được tự do khỏi vụ kiện đó không? :)

 
GN⁺ 2025-01-30
Ý kiến Hacker News
  • Có ý kiến cho rằng việc DeepSeek dùng dữ liệu của OpenAI để huấn luyện là không công bằng, nhưng lập luận này không phù hợp vì chính OpenAI cũng thu thập dữ liệu từ internet để huấn luyện

    • Khẳng định rằng DeepSeek đã tái tạo hiệu năng ở mức o1 ngay từ đầu có thể không đúng, và điều này đặt ra nghi vấn về hiệu quả huấn luyện
    • Bài báo R1 của DeepSeek cho thấy chưng cất mạnh mẽ đến mức nào, và nếu DeepSeek đã dùng đầu ra của o1 để huấn luyện mô hình thì điều đó có thể làm dấy lên nghi vấn về hiệu quả huấn luyện
  • Có ý kiến rằng việc DeepSeek công khai mã nguồn mở và giấy phép MIT sẽ là cơ hội để thu hút nhân tài lớn

    • Việc mã nguồn mở các công nghệ mới từ trước đến nay luôn thúc đẩy sự phát triển
    • OpenAI đang hợp tác với chính phủ Mỹ để bảo vệ IP, và cũng có khả năng DeepSeek sẽ bị cấm như TikTok
  • r1 được tạo ra trong bối cảnh sau o1, và các mô hình khác cũng có thể chưng cất từ r1

    • Có ý kiến cho rằng việc chưng cất từ o1 không làm suy yếu tuyên bố về chi phí của DeepSeek
    • Có nghi vấn liệu OpenAI có thực sự nắm giữ ưu thế về đạo đức hay luân lý hay không
  • Nếu DeepSeek đã được huấn luyện dựa trên OpenAI, thì đây không phải là việc được huấn luyện từ đầu với "pennies on the dollar", và có thể cũng không phải là một đột phá kỹ thuật

    • Tuy nhiên điều này hiện vẫn chưa được xác nhận là sự thật
  • OpenAI hiện đang ở thế yếu và không thể tận dụng nguồn lực pháp lý như Google hay Microsoft

    • Có ý kiến cho rằng chiến lược dùng vấn đề pháp lý để đè đối thủ của OpenAI sẽ không hiệu quả
  • Tương tự ngành đường sắt, AI cũng có thể là lĩnh vực mà cạnh tranh làm giảm chi phí, và phần lớn các khoản đầu tư có thể sẽ không tạo ra khối tài sản lớn

    • Các ông lớn như Nvidia, OpenAI, DeepSeek đang đầu tư vào AI nhưng có thể sẽ không tạo ra lợi nhuận thực chất
  • Có chỉ trích rằng OpenAI sử dụng nội dung không xin phép và chi nhiều tiền để vượt qua các script chống AI scraping

    • Nếu DeepSeek chỉ tái sử dụng dữ liệu của OpenAI thì đó không phải là đột phá về kỹ thuật mà chỉ là tái chế
  • Mô hình của OpenAI đã được huấn luyện dựa trên lượng lớn ebook thu thập từ các tracker torrent ebook cá nhân

    • Các ebook đã được chuyển đổi sang định dạng epub, sắp xếp lại và lưu trữ trên kho dữ liệu công khai