- Kitten TTS là mô hình TTS (text-to-speech) mã nguồn mở theo đuổi đồng thời sự gọn nhẹ và chất lượng âm thanh cao
- Chỉ sử dụng 15 triệu tham số nên kích thước mô hình dưới 25MB
- Khác với các TTS cỡ lớn khác, điểm nổi bật là có thể chạy trong mọi môi trường như di động, hệ thống nhúng, v.v.
- Ngay cả không có GPU, vẫn có thể xử lý tổng hợp giọng nói chất lượng cao trên mọi thiết bị
- Cung cấp nhiều tùy chọn giọng nói cao cấp, hỗ trợ tổng hợp giọng nói chất lượng cao gần giống giọng thật
- Có thể suy luận giọng nói với tốc độ nhanh, được tối ưu cho tổng hợp thời gian thực
- Hiện đã công bố mô hình developer preview, và trong tương lai sẽ lần lượt phát hành đầy đủ trọng số mô hình sau khi huấn luyện xong, mobile SDK, phiên bản web, v.v.
Chưa có bình luận nào.