9 điểm bởi xguru 2022-12-10 | 1 bình luận | Chia sẻ qua WhatsApp
  • Được công bố âm thầm thông qua một commit trên GitHub
  • Được huấn luyện qua nhiều epoch* hơn cùng với quá trình chuẩn hóa, và cho thấy hiệu năng được cải thiện so với mô hình trước đó
  • Kiến trúc vẫn như cũ
  • Khi gọi load_model("large"), mô hình "large-v2" sẽ được tải
  • Dự kiến sẽ sớm công bố bài báo liên quan đến mô hình này
  • Epoch: toàn bộ dữ liệu trong tập dữ liệu huấn luyện đi qua mô hình một lần (Forward Pass/Backward Pass). Tức là một đơn vị học toàn bộ tập dữ liệu một lần