8 điểm bởi xguru 2025-02-19 | 2 bình luận | Chia sẻ qua WhatsApp

Audiblez là gì?

  • Công cụ chuyển đổi sách điện tử .epub thành sách nói .m4b
  • Sử dụng tổng hợp giọng nói chất lượng cao dựa trên Kokoro-82M
  • Được cung cấp theo giấy phép Apache và được huấn luyện với dưới 100 giờ dữ liệu âm thanh
  • Trên GPU T4 của Google Colab, có thể chuyển đổi "Animal Farm" trong khoảng 5 phút với "tốc độ chuyển đổi 600 ký tự/giây"
  • Trên M2 MacBook Pro (chế độ CPU), "mất khoảng 1 giờ với tốc độ 60 ký tự/giây"
    • Hiện chưa hỗ trợ CUDA trên Apple Silicon (M1, M2) (đang chờ hỗ trợ MLX)

Các cập nhật chính của Audiblez 4.2

  • Hỗ trợ GUI đa nền tảng dựa trên wxWidgets (Mac, Windows, Linux)
  • Hỗ trợ nhiều ngôn ngữ khác nhau (tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Hindi, tiếng Ý, tiếng Nhật, tiếng Bồ Đào Nha, tiếng Trung)
  • Chuyển từ ONNX sang nền tảng Torch sử dụng gói kokoro
  • Hỗ trợ tăng tốc CUDA (tuy nhiên trên Apple Silicon sẽ chạy ở chế độ CPU)
  • Bao gồm ảnh bìa và dấu thời gian chương trong sách nói
  • Cải thiện hỗ trợ Windows

2 bình luận

 
xguru 2025-02-19

Chuyển ebook thành audiobook bằng mô hình Kokoro-82M
Nó dựa trên cái này, nhưng phần tiếng Hàn có trong đó lại không có trong Audiblez (dù trong phần bình luận cũng có nói chất lượng tiếng Hàn của Kokoro không được tốt lắm)

 
inosphe 2025-02-19

Nhìn vào lịch sử trước đây của dự án kokoro thì rõ ràng từng có giọng nói tiếng Hàn, nhưng theo các thảo luận trên Discord, có vẻ họ đang gặp khó khăn trong việc phân phối do điều khoản cấm đưa dữ liệu của AI Hub Hàn Quốc ra nước ngoài…