Sự cần thiết của việc mã nguồn mở DeepSeek
(getlago.com)-
Lý do DeepSeek mã nguồn mở
- DeepSeek là một viện nghiên cứu AI của Trung Quốc, đã phát triển mô hình suy luận mã nguồn mở mang tên R1.
- Họ đã phát triển một mô hình có hiệu năng tương tự OpenAI với chi phí thấp hơn, nhờ vào các phương pháp huấn luyện mang tính đột phá.
- Với tư cách là một công ty Trung Quốc, DeepSeek cần mã nguồn mở để giành được niềm tin tại thị trường phương Tây.
- Mã nguồn mở không chỉ là một hành động kỹ thuật mà còn là một hành động mang tính văn hóa.
-
Thương mại hóa mô hình
- Các mô hình LLM đang ngày càng bị hàng hóa hóa, và chênh lệch hiệu năng giữa chúng không quá lớn.
- OpenAI vẫn là bên dẫn đầu, nhưng các mô hình mã nguồn mở như DeepSeek R1 cung cấp chi phí thấp hơn.
- Trong lĩnh vực hạ tầng, mã nguồn mở có xu hướng chiến thắng về lâu dài.
-
Ưu điểm của mã nguồn mở trong hạ tầng
- Mã nguồn mở rẻ hơn và có thể tùy biến, nhưng cần được bảo trì.
- Hạ tầng luôn cần tùy biến, và sản phẩm càng mang tính kỹ thuật thì các kỹ sư càng ưu tiên mã nguồn mở.
- Lý do các công ty mã nguồn mở như Lago thành công là vì các kỹ sư có thể trực tiếp quản lý những hệ thống billing phức tạp.
-
Tương lai của OpenAI
- OpenAI vẫn giữ vị trí quan trọng trên thị trường và tiếp tục dẫn đầu trong các mô hình LLM và suy luận.
- Có ý kiến cho rằng các mô hình như DeepSeek R1 có thể thay thế OpenAI, nhưng nếu không có những đổi mới của OpenAI thì các mô hình như vậy cũng đã không tồn tại.
- R1 có thể thúc đẩy các tập đoàn lớn hiện nay tìm ra những phương pháp hiệu quả hơn.
1 bình luận
Ý kiến trên Hacker News
Trong số các startup mô hình lớn của Trung Quốc, chỉ DeepSeek chọn mã nguồn mở thay vì cân nhắc thương mại hóa. Điều này giúp họ nhận được sự quảng bá tự nhiên từ người dùng trong cộng đồng.
Các API AI của Trung Quốc nhiều khả năng sẽ bị đón nhận với sự hoài nghi ở phương Tây. Điều này có những lý do hợp lý về mặt lịch sử.
Theo một bản ghi nhớ nội bộ của Google, mã nguồn mở đang phát triển nhanh hơn và hiệu quả hơn các đội ngũ đóng kín.
Có ý kiến cho rằng một công ty mang tên "Open" thì dù không chia sẻ mọi thứ, ít nhất cũng nên chia sẻ những phần quan trọng.
Cũng như Linux đã thành công về lâu dài, các mô hình LLM mạnh mẽ được kỳ vọng sẽ đi theo con đường tương tự.
DeepSeek là một dự án phụ của một quỹ phòng hộ, và nếu bán khống cổ phiếu NVIDIA rồi công khai mọi thứ, họ có khả năng thu được lợi nhuận lớn.
Lý do DeepSeek mã nguồn mở là vì các nhà phát triển muốn khoe thứ tuyệt vời mà họ đã tạo ra.