WaaS - Whisper dưới dạng dịch vụ
(github.com/schibsted)- GUI và API mã nguồn mở để dễ dàng sử dụng cục bộ cho OpenAI Whisper (mô hình nhận dạng giọng nói)
- Cung cấp các chức năng như transcribe/detect/download dưới dạng REST API
- Có thể tải lên tệp âm thanh/video trên trang web để bắt đầu xử lý
- Chạy bằng docker-compose để sử dụng (khởi chạy 3 container Docker gồm redis/api/worker)
- Mô hình nhỏ nhất là
tinycần khoảng 1GB VRAM (mô hình lớn nhấtlargecần 10GB)
1 bình luận
Whisper - hệ thống nhận dạng giọng nói đa ngôn ngữ (ASR) mà OpenAI đã công bố mã nguồn mở
OpenAI công bố mô hình Whisper v2