5 điểm bởi kirinonakar 2026-04-12 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Đây là trình dịch OCR cho Windows được tạo bằng rust/slint.
Dựa trên VLM và hỗ trợ gemini cùng các mô hình cục bộ. (LM Studio, OpenAI compatible API, v.v.)
Hỗ trợ nhiều tính năng như phím tắt, overlay, hộp văn bản, tự động dịch lại, clipboard, thay đổi prompt, tính năng kiểu dáng, v.v.
Trong chế độ hộp văn bản, bạn cũng có thể nhấp ngay trong màn hình đang được dịch.
Rất phù hợp để dịch game.

Trong các mô hình cục bộ, gemma-4-31b-it cho chất lượng tốt nhất và gemma-4-26b-a4b có sự cân bằng tốt giữa tốc độ/chất lượng.
qwen3.5 9 nhanh nhưng cảm giác vẫn hơi thiếu một chút.

Tùy theo system prompt cũng có sự khác biệt đôi chút.
Bạn có thể chỉ định phong cách dịch, và với các nội dung như danh từ riêng thì nếu nhập trực tiếp vào system prompt, nó sẽ xử lý khá tốt.
Nếu thay đổi system prompt, bạn còn có thể làm không chỉ việc dịch mà cả những việc khác.
(markdown, json, tóm tắt, biến truyện tranh thành tiểu thuyết, xuất vị trí chữ, mô tả hình ảnh, tạo prompt, đánh giá thiết kế trang web, v.v.)
Cách sử dụng gần như là vô tận.

Để biết cách sử dụng chi tiết, vui lòng tham khảo GitHub.
https://github.com/kirinonakar/ocr_trans

Chưa có bình luận nào.

Chưa có bình luận nào.