- Meta AI đã công bố SeamlessM4T, một mô hình đa ngôn ngữ và đa tác vụ nền tảng có thể dịch và phiên âm liền mạch giữa giọng nói và văn bản
- Hỗ trợ nhận dạng giọng nói tự động cho nhiều ngôn ngữ, dịch giọng nói sang văn bản, dịch giọng nói sang giọng nói, dịch văn bản sang văn bản và dịch văn bản sang giọng nói
- Nhận dạng giọng nói tự động cho hơn 100 ngôn ngữ
- Dịch giọng nói sang văn bản cho hơn 100 ngôn ngữ đầu vào và đầu ra
- Dịch giọng nói sang giọng nói hỗ trợ hơn 100 ngôn ngữ đầu vào và 35 ngôn ngữ đầu ra (+ tiếng Anh)
- Dịch văn bản sang văn bản cho hơn 100 ngôn ngữ
- Chuyển văn bản thành giọng nói, hỗ trợ hơn 100 ngôn ngữ đầu vào và 35 ngôn ngữ đầu ra (+ tiếng Anh)
- Mô hình SeamlessM4T được phát hành theo giấy phép CC BY-NC 4.0 dành cho các nhà nghiên cứu và nhà phát triển
- Đồng thời cũng công bố SeamlessAlign, bộ dữ liệu dịch đa phương thức dài 27 giờ
1 bình luận
Đọc thêm