- Cung cấp trải nghiệm trò chuyện mượt mà với AI bằng cách kết nối với Mistral LLM dựa trên các tính năng của WhisperLive và WhisperSpeech
- WhisperLive: hiện thực hóa OpenAI Whisper để hoạt động gần như theo thời gian thực, chuyển giọng nói thành văn bản
- WhisperSpeech: hệ thống TTS được xây dựng bằng cách đảo ngược Whisper
- Cả LLM và Whisper đều được tối ưu để chạy hiệu quả bằng engine TensorRT, qua đó tối đa hóa hiệu năng và khả năng xử lý thời gian thực, còn WhisperSpeech được tối ưu bằng
torch.compile
3 bình luận
Nếu có thể dịch theo thời gian thực thì sẽ rất nhanh và tuyệt.
WhisperSpeech – Hệ thống tổng hợp giọng nói mã nguồn mở được xây dựng ngược từ Whisper
Ý kiến trên Hacker News
huggingface_cli, cho rằng đã có sẵn cách tải thứ gì đó bằng tên (như chỉ mục PyPi), và có lẽ nên áp dụng cách đó cho mô hình thì tốt hơn.