Voice-Pro – Gradio WebUI hỗ trợ nhận dạng giọng nói, dịch thuật và tổng hợp giọng nói

(github.com/abus-aikorea)

9 điểm bởi vulcanidic 2024-12-08 | 1 bình luận | Chia sẻ qua WhatsApp

Voice-Pro là một Gradio WebUI hỗ trợ nhận dạng giọng nói, dịch thuật và tổng hợp giọng nói.

Các tính năng chính:

Nhân bản giọng nói zero-shot. Chỉ cần một mẫu giọng nói dài 15 giây. Cung cấp hơn 50 giọng người nổi tiếng
Tải xuống âm thanh từ YouTube
Tách giọng hát
Chuyển văn bản thành giọng nói đa ngôn ngữ (Edge-TTS, F5-TTS)
Dịch đa ngôn ngữ
Hỗ trợ nhiều engine Whisper khác nhau (Whisper, Faster-Whisper, Whisper-Timestamped)

Demo video:

1 bình luận

yangeok 2024-12-16

Chắc là do một người Hàn Quốc tạo ra.