Facebook mã nguồn mở mô hình có thể dịch 100 ngôn ngữ mà không phụ thuộc vào tiếng Anh
(about.fb.com)M2M-100 là mô hình MMT (Multilingual Machine Translation),
lần đầu tiên có thể dịch qua lại giữa 100 cặp ngôn ngữ mà không phụ thuộc vào dữ liệu tiếng Anh.
Phần lớn bản dịch hiện nay đi qua tiếng Anh, ngôn ngữ có nhiều dữ liệu huấn luyện, nhưng mô hình này dịch trực tiếp nên bảo toàn ý nghĩa tốt hơn.
Mô hình cho kết quả tốt hơn hơn 10% theo điểm BLEU (Bilingual Evaluation Understudy).
Mô hình được huấn luyện trên tổng cộng 2.200 hướng ngôn ngữ, nhiều gấp 10 lần so với mô hình đa ngôn ngữ lấy tiếng Anh làm trung tâm ở đẳng cấp hàng đầu trước đây.
Với M2M-100, chất lượng dịch thuật cho người dùng các ngôn ngữ ít tài nguyên sẽ được cải thiện.
Bài viết này chia sẻ chi tiết về bộ dữ liệu huấn luyện MMT và cách xây dựng mô hình,
đồng thời công bố cả mô hình, phương pháp huấn luyện và đánh giá để các nhà nghiên cứu khác có thể tái tạo và phát triển các mô hình đa ngôn ngữ tốt hơn.
Có thể tải xuống tệp mô hình được huấn luyện với 12 tỷ tham số (136GB)
Chưa có bình luận nào.