1 điểm bởi GN⁺ 2023-08-23 | 1 bình luận | Chia sẻ qua WhatsApp
  • OpenAI đã công bố các cập nhật về tinh chỉnh và API cho GPT-3.5 Turbo, cho phép các nhà phát triển tùy biến mô hình theo các trường hợp sử dụng cụ thể.
  • Dự kiến khả năng tinh chỉnh cho GPT-4 sẽ có vào mùa thu.
  • Các thử nghiệm ban đầu cho thấy GPT-3.5 Turbo sau khi tinh chỉnh có thể vượt qua hoặc đạt hiệu năng ngang với GPT-4 cơ bản trong một số tác vụ cụ thể.
  • Dữ liệu được gửi qua API tinh chỉnh thuộc sở hữu của khách hàng và sẽ không được OpenAI hay tổ chức nào khác dùng để huấn luyện các mô hình khác.
  • Tinh chỉnh đã được sử dụng để cải thiện hiệu năng mô hình trong các trường hợp sử dụng phổ biến như tăng khả năng điều khiển, định dạng đầu ra đáng tin cậy và giọng điệu tùy chỉnh.
  • Tinh chỉnh giúp doanh nghiệp rút ngắn prompt mà vẫn đảm bảo hiệu năng tương tự, đồng thời xử lý được 4k token, gấp đôi các mô hình đã tinh chỉnh trước đó.
  • Tinh chỉnh phát huy hiệu quả nhất khi kết hợp với các kỹ thuật như prompt engineering, truy xuất thông tin và function calling.
  • Chi phí tinh chỉnh được chia thành hai phần: chi phí huấn luyện ban đầu và chi phí sử dụng.
  • OpenAI cũng cung cấp babbage-002davinci-002 như các lựa chọn thay thế cho các mô hình nền GPT-3 ban đầu, và có thể tinh chỉnh chúng qua các API endpoint mới.
  • API endpoint /v1/fine-tunes hiện tại sẽ ngừng hoạt động vào ngày 4 tháng 1 năm 2024.
  • OpenAI cũng đang nỗ lực đảm bảo an toàn cho việc triển khai tinh chỉnh; dữ liệu huấn luyện tinh chỉnh được kiểm tra qua Moderation API của họ và hệ thống kiểm duyệt dựa trên GPT-4 để phát hiện dữ liệu huấn luyện không an toàn.
  • Trong tương lai gần, giao diện người dùng cho tinh chỉnh sẽ được phát hành, giúp các nhà phát triển dễ dàng truy cập thông tin về các tác vụ tinh chỉnh đang chạy và các ảnh chụp mô hình đã hoàn tất.

1 bình luận

 
GN⁺ 2023-08-23
Ý kiến Hacker News
  • OpenAI đã phát hành tinh chỉnh GPT-3.5 đúng như đã hứa, vài tháng sau khi mở quyền truy cập API GPT-4.
  • Bất chấp những chỉ trích rằng họ chưa đủ cởi mở, OpenAI vẫn được ghi nhận vì đổi mới nhanh chóng, vượt lên trước các AI mã nguồn mở khác như Llama và Bard.
  • Chi phí tạo nội dung bằng GPT-3.5 Turbo đã tinh chỉnh cao gấp 8 lần mô hình cơ bản, nên chỉ hiệu quả về chi phí với những ai có thể giảm đáng kể kích thước prompt.
  • Có yêu cầu so sánh giữa GPT-3.5 Turbo đã tinh chỉnh và mô hình Llama2, trong đó mô hình sau cần hạ tầng thuê riêng.
  • Một số người dùng cảm thấy GPT-3.5 Turbo lặp lại và thiếu chính xác, không phù hợp cho viết lách và lập trình, trong khi những người khác cho rằng GPT-4 tốt hơn nhiều và hữu ích như một công cụ hỗ trợ học tập hoặc giải quyết vấn đề.
  • Tính năng mà người dùng mong muốn là khả năng chia nhỏ prompt tích hợp sẵn để loại bỏ nhu cầu dùng công cụ bên thứ ba.
  • Quyết định của OpenAI về việc không cung cấp các mô hình “không an toàn” đã được chú ý, và cả davinci-002 lẫn babbage-002 đều rơi vào vòng lặp vô hạn với các phần hoàn thành “không an toàn”.
  • Dữ liệu huấn luyện để tinh chỉnh sẽ đi qua Moderation API của OpenAI và hệ thống kiểm duyệt dựa trên GPT-4; có suy đoán rằng hệ thống này chỉ được dùng khi “độ an toàn” còn mơ hồ do chi phí cao.
  • Đã có câu hỏi được đặt ra về cách tính số token cần cho tác vụ tinh chỉnh, và thường cần bao nhiêu dữ liệu tinh chỉnh để tác động hiệu quả đến hành vi của mô hình cơ bản.
  • Khả năng tinh chỉnh các mô hình “Chat” được xem là thú vị, đồng thời cũng xuất hiện câu hỏi về khả năng dùng mô hình đã tinh chỉnh để vượt qua các trình phát hiện AI hiện nay.
  • Đã có lo ngại về quyền riêng tư, cùng câu hỏi OpenAI hoặc Microsoft lưu trữ văn bản từ các lệnh gọi API trong bao lâu.
  • Nhìn chung, việc phát hành tinh chỉnh GPT-3.5 được xem là một bước tiến tích cực, và có kỳ vọng dành cho tinh chỉnh 16k.