7 điểm bởi xguru 2023-07-03 | 1 bình luận | Chia sẻ qua WhatsApp
  • Bản triển khai mã nguồn mở của mô hình Flamingo từ DeepMind
  • Công bố các mô hình 3B, 4B, 9B
    • Dựa trên MPT-1B/7B và RedPajama-3B
  • Đạt hơn 80% hiệu năng của chính mô hình Flamingo
  • Cải thiện mã huấn luyện và đánh giá
    • Hỗ trợ Fully Sharded Data Parallel (FSDP)
    • Bổ sung các bộ dữ liệu mới vào bộ đánh giá (TextVQA, VizWiz, HatefulMemes, Flickr30k)