WaaS - Whisper dưới dạng dịch vụ

xguru · 2023-02-15T10:47:02+09:00

GUI và API mã nguồn mở để dễ dàng sử dụng cục bộ cho OpenAI Whisper (mô hình nhận dạng giọng nói) Cung cấp các chức năng như transcribe/detect/download dưới dạng REST API Có thể tải lên tệp âm thanh/video trên trang web để bắt đầu xử lý Chạy bằng docker-compose để sử dụng (khởi chạy 3 container Docker gồm redis/api/worker) Mô hình nhỏ nhất là tiny cần khoảng 1GB VRAM (mô hình lớn nhất large cần 10GB)

(github.com/schibsted)

11 điểm bởi xguru 2023-02-15 | 1 bình luận | Chia sẻ qua WhatsApp

GUI và API mã nguồn mở để dễ dàng sử dụng cục bộ cho OpenAI Whisper (mô hình nhận dạng giọng nói)
Cung cấp các chức năng như transcribe/detect/download dưới dạng REST API
Có thể tải lên tệp âm thanh/video trên trang web để bắt đầu xử lý
Chạy bằng docker-compose để sử dụng (khởi chạy 3 container Docker gồm redis/api/worker)
Mô hình nhỏ nhất là tiny cần khoảng 1GB VRAM (mô hình lớn nhất large cần 10GB)

1 bình luận

xguru 2023-02-15

Whisper - hệ thống nhận dạng giọng nói đa ngôn ngữ (ASR) mà OpenAI đã công bố mã nguồn mở
OpenAI công bố mô hình Whisper v2

WaaS - Whisper dưới dạng dịch vụ

Bài viết liên quan

1 bình luận