13 điểm bởi xguru 2024-04-29 | 3 bình luận | Chia sẻ qua WhatsApp
  • Sau khi mô hình Llama 3 được công bố vào ngày 18/4, phản ứng từ cộng đồng nhà phát triển là vô cùng mạnh mẽ
    • Mô hình đã được tải xuống hơn 1,2 triệu lần, và các nhà phát triển trên Hugging Face đã chia sẻ hơn 600 mô hình phái sinh
    • Kho lưu trữ GitHub của Llama 3 đã nhận được hơn 17.000 sao
    • Trên bảng xếp hạng LMSYS Chatbot Arena, mô hình Llama 3 70B Instruct đứng số 1 trong đánh giá chỉ dành cho tiếng Anh, và xếp thứ 6 toàn bảng, trở thành mô hình mở có thứ hạng cao nhất (chỉ sau các mô hình độc quyền khép kín)

Các trường hợp ứng dụng ban đầu của Llama 3

  • Các đối tác cung cấp silicon, phần cứng và đám mây đã bắt đầu triển khai Llama 3 cho người dùng
  • Trường Y Đại học Yale, cùng với Trường Khoa học Máy tính và Truyền thông của EPFL, đã tinh chỉnh Llama 3 chỉ trong vòng 24 giờ sau khi ra mắt và giới thiệu Llama-3[8B]-MeditronV1.0, mô hình Llama 3 8B đầu tiên cho lĩnh vực y học
    • Mô hình mới này đã vượt qua tất cả các mô hình mở mới nhất cùng hạng tham số trên các benchmark tiêu chuẩn như MedQA, MedMCQA
    • Có thể xem thêm chi tiết tại liên kết tương ứng về cách Đại học Yale và EPFL đã xây dựng phiên bản đầu tiên của Meditron dựa trên Llama 2
    Quảng cáo

Kế hoạch sắp tới của Llama 3

  • Trong vài tháng tới, dự kiến sẽ công bố các mô hình với những tính năng mới như đa phương thức, hội thoại đa ngôn ngữ, cửa sổ ngữ cảnh dài hơn và cải thiện năng lực tổng thể
  • Sẽ sớm chia sẻ thêm nhiều nội dung hơn và kỳ vọng được chứng kiến làn sóng đổi mới tiếp theo do cộng đồng dẫn dắt

3 bình luận

 
gcback 2024-04-29

Càng lúc các LLM của các tập đoàn lớn trong nước càng mất sức cạnh tranh. Nếu chiến lược là mô hình đóng thì ít nhất phải đủ sức cạnh tranh về hiệu năng, hoặc nếu chiến lược là mở rộng phạm vi ứng dụng dù hiệu năng kém hơn thì đừng lấy tiếng Hàn làm trọng tâm để quảng bá, nhưng tình hình hiện tại lại đang đi hoàn toàn theo hướng ngược lại.

 
cosine20 2024-04-30

Chỉ toàn chạy đua trọng số vô nghĩa trên bảng xếp hạng tiếng Hàn, rồi còn lấy đó đánh bóng tin tức để đỡ giá cổ phiếu nữa chứ haha

 
[Bình luận này đã bị ẩn.]