11 điểm bởi xguru 2023-02-15 | 1 bình luận | Chia sẻ qua WhatsApp
  • GUI và API mã nguồn mở để dễ dàng sử dụng cục bộ cho OpenAI Whisper (mô hình nhận dạng giọng nói)
  • Cung cấp các chức năng như transcribe/detect/download dưới dạng REST API
  • Có thể tải lên tệp âm thanh/video trên trang web để bắt đầu xử lý
  • Chạy bằng docker-compose để sử dụng (khởi chạy 3 container Docker gồm redis/api/worker)
  • Mô hình nhỏ nhất là tiny cần khoảng 1GB VRAM (mô hình lớn nhất large cần 10GB)