Phát hành Whisper.cpp 1.4.0

xguru · 2023-05-02T10:36:09+09:00

Hỗ trợ lượng tử hóa số nguyên (integer quantization): có thể chuyển đổi mô hình ggml Whisper từ trọng số số thực 16 bit mặc định sang trọng số số nguyên 4, 6, 8 bit Giảm dung lượng trên đĩa và mức sử dụng bộ nhớ, nhờ đó chạy nhanh hơn trên một số kiến trúc Được hiện thực nhờ phần mã đã được đóng góp cho dự án llama.cpp Hỗ trợ GPU NVIDIA thông qua cuBLAS

(github.com/ggerganov)

13 điểm bởi xguru 2023-05-02 | 1 bình luận | Chia sẻ qua WhatsApp

Hỗ trợ lượng tử hóa số nguyên (integer quantization): có thể chuyển đổi mô hình ggml Whisper từ trọng số số thực 16 bit mặc định sang trọng số số nguyên 4, 6, 8 bit
- Giảm dung lượng trên đĩa và mức sử dụng bộ nhớ, nhờ đó chạy nhanh hơn trên một số kiến trúc
- Được hiện thực nhờ phần mã đã được đóng góp cho dự án llama.cpp
Hỗ trợ GPU NVIDIA thông qua cuBLAS

1 bình luận

xguru 2023-05-02

Whisper.cpp - Bản triển khai C/C++ hiệu năng cao của OpenAI Whisper

Phát hành Whisper.cpp 1.4.0

Bài viết liên quan

1 bình luận