10 điểm bởi ninebow 2023-10-03 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Meta đã công bố mô hình LLaMA 2 Long thông qua bài báo Effective Long-Context Scaling of Foundation Models
  • Hỗ trợ độ dài context window lên tới 32K (32.768) token
  • Phiên bản 70B đã vượt hiệu năng tổng thể của gpt-3.5-turbo-16k trên bộ tác vụ ngữ cảnh dài
  • Vẫn giữ nguyên kiến trúc mô hình hiện có, đồng thời áp dụng RoPE (Rotary Positional Embedding) cho positional encoding để tạo ra phản hồi tốt hơn với ít thông tin hơn

Chưa có bình luận nào.

Chưa có bình luận nào.