- Đã tạo một ứng dụng khám phá nghề nghiệp dựa trên AI, nhưng khi tăng trưởng bùng nổ, chi phí GPT-4 bắt đầu vượt quá 100 USD mỗi ngày
- Cách đã dùng để giảm chi phí AI tới 99% trong khi vẫn giảm độ trễ và giữ nguyên chất lượng
- Trước tiên dùng mô hình mạnh nhất (GPT-4) để tạo ra kết quả, sau đó dùng chính các kết quả đó để fine-tune một mô hình nhỏ hơn
- Lưu lại để có thể dễ dàng export các yêu cầu/phản hồi AI. Sử dụng Helicone AI. Chỉ cần thay nguyên OpenAI API là các yêu cầu AI sẽ được lưu vào bảng
- Khi đã lưu được khoảng 100~500 cặp yêu cầu/phản hồi, export ra và tinh lọc dữ liệu để đạt chất lượng tốt
- Dùng bộ dữ liệu này để fine-tune Mixtral 8x7B thông qua các dịch vụ hosting như Together/Anyscale
- Thay GPT-4 bằng mô hình mới đã được fine-tune
4 bình luận
Vậy là như thế này thì có nghĩa là đã vi phạm cả điều khoản của GPT-4 lẫn giấy phép của Mixtral đúng không...? @_@
Chắc là vậy. Có lẽ nhiều người cũng nghĩ thế vì chuyện này không phải kiểu lộ rõ ra bên ngoài.
Trước đây cũng có những trường hợp âm thầm dùng nội bộ hoặc công khai cho mục đích nghiên cứu,
nhưng kiểu quảng bá thẳng thừng rằng “chúng tôi đã dùng nó đây!” như thế này thì đúng là hơi... lạ thật.
Không biết có bị nói gì không nhỉ...?
Ý kiến Hacker News