34 điểm bởi xguru 2024-04-29 | 1 bình luận | Chia sẻ qua WhatsApp
  • Ra mắt v2 với chất lượng âm thanh tốt hơn, hỗ trợ đa ngôn ngữ bao gồm cả tiếng Hàn, và miễn phí cho cả mục đích thương mại
  • Có thể sao chép giọng nói chỉ từ một đoạn audio ngắn của người nói và tạo giọng nói bằng nhiều ngôn ngữ
  • Không chỉ sao chép âm sắc của người nói tham chiếu mà còn cho phép điều khiển chi tiết phong cách giọng nói như cảm xúc, ngữ điệu, nhịp điệu, khoảng ngắt và cách nhấn giọng
  • Thực hiện nhân bản giọng nói xuyên ngôn ngữ zero-shot ngay cả với những ngôn ngữ không có trong tập huấn luyện
  • Cung cấp hiệu năng vượt trội với chi phí tính toán thấp hơn hàng chục lần so với các API có thể dùng thương mại
  • Những thay đổi của V2 (ra mắt 04/2024), bao gồm toàn bộ tính năng của V1
    • Chất lượng âm thanh tốt hơn: V2 áp dụng chiến lược huấn luyện khác để mang lại chất lượng âm thanh tốt hơn
    • Hỗ trợ đa ngôn ngữ gốc: tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Trung, tiếng Nhật và tiếng Hàn được hỗ trợ sẵn trong OpenVoice V2
    • Miễn phí cho mục đích thương mại: từ tháng 4/2024, cả V2 và V1 đều được phát hành theo giấy phép MIT nên có thể dùng miễn phí cho mục đích thương mại

1 bình luận

 
xguru 2024-04-29

GN⁺: OpenVoice: công nghệ sao chép giọng nói tức thì đa năng
GN⁺: OpenVoice - công nghệ sao chép giọng nói tức thì đa năng

Đã từng được đăng vài lần qua GN+, và lần này khi V2 ra mắt thì đã hỗ trợ đa ngôn ngữ, đồng thời cũng bổ sung tiếng Hàn.