- OpenAI đã công bố các cập nhật về tinh chỉnh và API cho GPT-3.5 Turbo, cho phép các nhà phát triển tùy biến mô hình theo các trường hợp sử dụng cụ thể.
- Dự kiến khả năng tinh chỉnh cho GPT-4 sẽ có vào mùa thu.
- Các thử nghiệm ban đầu cho thấy GPT-3.5 Turbo sau khi tinh chỉnh có thể vượt qua hoặc đạt hiệu năng ngang với GPT-4 cơ bản trong một số tác vụ cụ thể.
- Dữ liệu được gửi qua API tinh chỉnh thuộc sở hữu của khách hàng và sẽ không được OpenAI hay tổ chức nào khác dùng để huấn luyện các mô hình khác.
- Tinh chỉnh đã được sử dụng để cải thiện hiệu năng mô hình trong các trường hợp sử dụng phổ biến như tăng khả năng điều khiển, định dạng đầu ra đáng tin cậy và giọng điệu tùy chỉnh.
- Tinh chỉnh giúp doanh nghiệp rút ngắn prompt mà vẫn đảm bảo hiệu năng tương tự, đồng thời xử lý được 4k token, gấp đôi các mô hình đã tinh chỉnh trước đó.
- Tinh chỉnh phát huy hiệu quả nhất khi kết hợp với các kỹ thuật như prompt engineering, truy xuất thông tin và function calling.
- Chi phí tinh chỉnh được chia thành hai phần: chi phí huấn luyện ban đầu và chi phí sử dụng.
- OpenAI cũng cung cấp
babbage-002 và davinci-002 như các lựa chọn thay thế cho các mô hình nền GPT-3 ban đầu, và có thể tinh chỉnh chúng qua các API endpoint mới.
- API endpoint
/v1/fine-tunes hiện tại sẽ ngừng hoạt động vào ngày 4 tháng 1 năm 2024.
- OpenAI cũng đang nỗ lực đảm bảo an toàn cho việc triển khai tinh chỉnh; dữ liệu huấn luyện tinh chỉnh được kiểm tra qua Moderation API của họ và hệ thống kiểm duyệt dựa trên GPT-4 để phát hiện dữ liệu huấn luyện không an toàn.
- Trong tương lai gần, giao diện người dùng cho tinh chỉnh sẽ được phát hành, giúp các nhà phát triển dễ dàng truy cập thông tin về các tác vụ tinh chỉnh đang chạy và các ảnh chụp mô hình đã hoàn tất.
1 bình luận
Ý kiến Hacker News