Voice-Pro – Gradio WebUI hỗ trợ nhận dạng giọng nói, dịch thuật và tổng hợp giọng nói
(github.com/abus-aikorea)Voice-Pro là một Gradio WebUI hỗ trợ nhận dạng giọng nói, dịch thuật và tổng hợp giọng nói.
Các tính năng chính:
- Nhân bản giọng nói zero-shot. Chỉ cần một mẫu giọng nói dài 15 giây. Cung cấp hơn 50 giọng người nổi tiếng
- Tải xuống âm thanh từ YouTube
- Tách giọng hát
- Chuyển văn bản thành giọng nói đa ngôn ngữ (Edge-TTS, F5-TTS)
- Dịch đa ngôn ngữ
- Hỗ trợ nhiều engine Whisper khác nhau (Whisper, Faster-Whisper, Whisper-Timestamped)
Demo video:
-
Hướng dẫn sử dụng Voice-Pro: https://youtu.be/z8g8LMhoh_o
-
Demo tạo podcast bằng Voice-Cloning: https://youtu.be/Wfo7vQCD4no
-
Các video demo và mẫu: https://youtube.com/playlist/?list=PLwx5dnMDVC9Y7dAjm9r26CZUw1uU5VIeq
1 bình luận
Chắc là do một người Hàn Quốc tạo ra.