Cách dùng nhanh ElevenLabs Realtime Speech to Text vừa ra mắt
Mình đã triển khai chức năng chuyển giọng nói thành văn bản ở mức đơn giản nhất có thể 🙏
git clone https://github.com/lee-lou2/ai-note.git- Truy cập
Speech to Texttại https://elevenlabs.io/app/developers/api-keys để lấy API key - Trên thư mục dự án đã clone, sao chép
.env.sampleđể tạo file.env - Đăng ký ElevenLabs API Key vừa tạo vào
ELEVENLABS_API_KEY, đồng thời điền thông tin tài khoản sẽ dùng khi truy cập trang vàoBASIC_AUTH_USERNAME,BASIC_AUTH_PASSWORD - Cài gói:
pip install -r requirements.txt - Chạy:
uvicorn main:app --reload --port 8000
Sau đó chỉ cần truy cập http://localhost:8000 là có thể dùng ngay
Rõ ràng ElevenLabs Realtime Speech to Text v2 vừa nhanh vừa chính xác
Hiện tại cả người dùng miễn phí cũng có thể sử dụng (về sau chính sách giá của ElevenLabs có thể thay đổi)
Repo GitHub này sẽ tiếp tục được cập nhật
- (Dự kiến) Tính năng cho nhiều người cùng truy cập và cập nhật một tài liệu
- (Dự kiến) Tính năng tóm tắt nội dung đã được chép lời
- (Dự kiến) Tính năng tóm tắt cùng với tài liệu được gõ tay
Chưa có bình luận nào.