- Trên HN, sự quan tâm đến việc tinh chỉnh các LLM mã nguồn mở đang tăng mạnh (ví dụ: bài viết của Anyscale)
- Chia sẻ kinh nghiệm và hiểu biết tích lũy trong nhiều năm về việc tinh chỉnh mô hình, cùng với mã thực tiễn
- Cung cấp một bộ notebook bao gồm gán nhãn dữ liệu, tinh chỉnh, chạy suy luận hiệu quả và đánh giá chi phí/hiệu năng
- Huấn luyện một mô hình 7B đạt mức khớp 95% với nhãn của GPT-4 trên tập kiểm thử
- Tinh chỉnh là gì? Một hình thức prompting mạnh hơn so với việc viết chỉ dẫn bằng văn bản
- Huấn luyện mô hình hiện có bằng các cặp đầu vào/đầu ra mẫu để phục vụ việc học của mô hình được tinh chỉnh
- Ưu và nhược điểm của prompting và tinh chỉnh
- Ưu điểm lớn của tinh chỉnh: hiệu quả hơn nhiều trong việc định hướng hành vi của mô hình, nên các mô hình nhỏ hơn nhiều cũng có thể xử lý đủ tốt
- Mô hình Llama 7B đã tinh chỉnh rẻ hơn GPT-3.5 tới 50 lần trên mỗi token, đồng thời cho kết quả tương đương hoặc tốt hơn trong nhiều trường hợp sử dụng
- Ví dụ: phân loại 2 triệu công thức nấu ăn bằng GPT-4 tốn $23k, nhưng mô hình chúng tôi đã tinh chỉnh cho hiệu năng tương tự GPT-4 và chỉ tốn $19 để chạy toàn bộ tập dữ liệu
- Đang phát triển một sản phẩm mã nguồn mở tên là OpenPipe
- Sản phẩm OpenPipe giúp các kỹ sư có thể áp dụng tinh chỉnh một cách đơn giản nhất có thể
- Bài viết hiện tại nhằm chia sẻ những điều đã học được về tinh chỉnh
1 bình luận
Ý kiến trên Hacker News