9 điểm bởi vulcanidic 2024-12-08 | 1 bình luận | Chia sẻ qua WhatsApp

Voice-Pro là một Gradio WebUI hỗ trợ nhận dạng giọng nói, dịch thuật và tổng hợp giọng nói.

Các tính năng chính:

  • Nhân bản giọng nói zero-shot. Chỉ cần một mẫu giọng nói dài 15 giây. Cung cấp hơn 50 giọng người nổi tiếng
  • Tải xuống âm thanh từ YouTube
  • Tách giọng hát
  • Chuyển văn bản thành giọng nói đa ngôn ngữ (Edge-TTS, F5-TTS)
  • Dịch đa ngôn ngữ
  • Hỗ trợ nhiều engine Whisper khác nhau (Whisper, Faster-Whisper, Whisper-Timestamped)

Demo video:

GitHub:
https://github.com/abus-aikorea/voice-pro

1 bình luận

 
yangeok 2024-12-16

Chắc là do một người Hàn Quốc tạo ra.