wav2letter@anywhere, framework nhận dạng giọng nói hiệu năng cao do Facebook công bố
(ai.facebook.com)Thư viện nhận dạng giọng nói hiệu năng cao, đa luồng, đa nền tảng được tạo ra để có thể nhúng wav2letter++ đã được công bố trước đó vào bất cứ đâu.
Hỗ trợ RNN và CNN (phía CNN nhanh hơn).
Được viết bằng C++ và thiết kế với mục tiêu streaming.
Backend phía máy chủ là FBGEMM, backend cho iOS và Android cũng dự kiến sẽ được công bố.
1 bình luận
FBGEMM - https://github.com/pytorch/FBGEMM