24 điểm bởi rayinclay 2026-03-22 | 13 bình luận | Chia sẻ qua WhatsApp

Xin chào, ban đầu tôi dùng các công cụ gõ bằng giọng nói sẵn có như superwhisper hay spokenly, kết hợp với tay cầm chơi game 8bitdo micro. Nhưng độ trễ mạng cứ gây khó chịu theo một cách rất khó tả.

Vì vậy tôi đã liên tục thử nghiệm các mô hình chạy cục bộ, và lần này khi dùng thử mô hình Qwen3-ASR, tôi cảm thấy đúng là thứ mình tìm kiếm. Nó phản hồi rất nhanh nhưng hiệu năng không hề thua kém các mô hình đám mây, nên tôi đã tạo ra vvrite để chạy nó cục bộ mà vẫn hướng tới cùng một UX. Tùy theo hiệu năng thiết bị mà tốc độ có thể khác nhau, nhưng nhìn chung khá nhanh và cũng không tốn nhiều bộ nhớ.

vvrite là ứng dụng cho phép bạn nhấn hotkey từ menu bar trên macOS (mặc định là Option+Space) để bắt đầu ghi âm ngay lập tức; nhấn lại lần nữa thì AI on-device sẽ nhận dạng giọng nói và tự động dán vào ô nhập liệu hiện tại. Ứng dụng hỗ trợ Apple Silicon Mac chạy macOS 13 trở lên. Bạn có thể cài đặt ngay bằng file DMG đã được ký và công chứng từ GitHub Releases.

13 bình luận

 
toida 2026-03-24

Tôi định thử dùng handy, nhưng nghe nói cái này hỗ trợ tiếng Hàn tốt hơn nên chắc phải dùng thử rồi. Cảm ơn bạn.

 
0xvicky 2026-03-23

Tôi thấy khó chịu với công cụ nhận diện giọng nói tiếng Hàn mình đang dùng,

nên vì grok có đề xuất cái này trong số các mã nguồn mở
(đề xuất bằng dòng chữ rất nhỏ ở cuối) nên tôi đã thử,

thấy ổn nên đang tùy biến lại để dùng.

Tôi cũng thêm 3 mô hình nữa,
thêm phần chỉnh âm lượng vì tiếng thông báo quá to...
và sửa thêm vài lỗi nữa..

Trong thời gian tới, chắc lại sẽ hăng hái code bằng giọng nói với cái này.

Mở code ra xem thì có cảm giác đây là dự án do một người không phải lập trình viên thực hiện, nên lại càng muốn ủng hộ hơn~~

So với những người lúc nào cũng chỉ nghĩ rồi trì hoãn
(ai đó... là tôi..) thì còn giỏi hơn gấp trăm lần 😂

Nhìn cả những dấu vết của superpowers còn sót lại, tôi cũng nghĩ kiểu như "à, ra là mọi người làm thế này.."~

 
xguru 2026-03-23

Wow, dùng thử thấy nhanh và rất ổn. Mình sẽ dùng tốt.

 
rayinclay 2026-03-24

Cảm ơn bạn!

 
wedding 2026-03-23

Tôi đang làm một ứng dụng lệnh bằng giọng nói cho Android, và đúng là qwen khá tốt. Nhưng vì tôi vẫn chưa tối ưu hóa được nên hiện tại đang dùng bản whisper base được fine-tune bằng bộ dữ liệu tiếng Hàn.

 
jwseo 2026-03-22

Nó có tốt hơn Whisper large v3 turbo không? Tôi vẫn đang dùng cái này, nên tò mò không biết bạn đã thử so sánh chưa. Tôi cũng thấy Moonshine ở đây rồi định thử dùng, mà mới đó đã trôi qua 3 tuần rồi haha

 
rayinclay 2026-03-22

Với tiếng Hàn thì chắc chắn tốt hơn Whisper! Moonshine thì không khác parakeet là mấy.

 
hoonix 2026-03-22

Khác gì so với handy?

 
rayinclay 2026-03-22

Các ứng dụng kiểu này gần như có UX khá giống nhau. vvrite cũng không khác nhiều. Cuối cùng vẫn là hiệu năng của mô hình.
Nếu bạn chỉ dùng tiếng Anh thì mức như parakeet được hỗ trợ trong handy là đủ rồi,
nhưng theo trải nghiệm của tôi, với hỗ trợ tiếng Hàn thì Qwen3-ASR là lựa chọn tốt nhất.
Nhưng vì không có nơi nào hỗ trợ nên tôi đã tự làm.

 
jhk0530 2026-03-22

Wow, đây là một công cụ rất tuyệt.
Cá nhân mình nghĩ sẽ còn tốt hơn nếu có thêm UI để có thể xem lại hướng dẫn sử dụng (manual). Lúc đầu cài đặt xong mình bấm linh tinh nên bị hơi rối không biết dùng thế nào haha

 
jhk0530 2026-03-22

Tên công cụ đọc là gì vậy? Là “rite” à?

 
rayinclay 2026-03-22

Cảm ơn bạn đã góp ý! Mình sẽ phản ánh vào bản phát hành tiếp theo.
Mình đúng là có chủ ý là lite… nhưng ngay cả mình cũng không chắc nên đọc thế nào cho hay nữa.

 
nemorize 2026-03-22

Bạn thấy Bright thế nào?
vvrite - vwrite - bright, gói gọn đồng thời cả ba ý nghĩa...