Llama 2 Chat 70B vượt ChatGPT (3.5) trong đánh giá mô hình

xguru · 2023-07-31T10:17:01+09:00

Theo bảng xếp hạng AlpacaEval dành cho việc đánh giá tự động các mô hình ngôn ngữ làm theo chỉ dẫn GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37% AlpacaEval tiến hành đánh giá tự động bằng cách sử dụng bộ đánh giá AlpacaFarm và so sánh với nội dung phản hồi của GPT-4

(tatsu-lab.github.io)

10 điểm bởi xguru 2023-07-31 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Theo bảng xếp hạng AlpacaEval dành cho việc đánh giá tự động các mô hình ngôn ngữ làm theo chỉ dẫn
GPT-4 95.28% > Llama Chat 70B 92.66% > Claude 2 91.36% > ChatGPT 89.37%
AlpacaEval tiến hành đánh giá tự động bằng cách sử dụng bộ đánh giá AlpacaFarm và so sánh với nội dung phản hồi của GPT-4

Llama 2 Chat 70B vượt ChatGPT (3.5) trong đánh giá mô hình

Bài viết liên quan

Chưa có bình luận nào.