Trình dịch OCR - ứng dụng rust/slint cho Windows dựa trên VLM
(github.com/kirinonakar)Đây là trình dịch OCR cho Windows được tạo bằng rust/slint.
Dựa trên VLM và hỗ trợ gemini cùng các mô hình cục bộ. (LM Studio, OpenAI compatible API, v.v.)
Hỗ trợ nhiều tính năng như phím tắt, overlay, hộp văn bản, tự động dịch lại, clipboard, thay đổi prompt, tính năng kiểu dáng, v.v.
Trong chế độ hộp văn bản, bạn cũng có thể nhấp ngay trong màn hình đang được dịch.
Rất phù hợp để dịch game.
Trong các mô hình cục bộ, gemma-4-31b-it cho chất lượng tốt nhất và gemma-4-26b-a4b có sự cân bằng tốt giữa tốc độ/chất lượng.
qwen3.5 9 nhanh nhưng cảm giác vẫn hơi thiếu một chút.
Tùy theo system prompt cũng có sự khác biệt đôi chút.
Bạn có thể chỉ định phong cách dịch, và với các nội dung như danh từ riêng thì nếu nhập trực tiếp vào system prompt, nó sẽ xử lý khá tốt.
Nếu thay đổi system prompt, bạn còn có thể làm không chỉ việc dịch mà cả những việc khác.
(markdown, json, tóm tắt, biến truyện tranh thành tiểu thuyết, xuất vị trí chữ, mô tả hình ảnh, tạo prompt, đánh giá thiết kế trang web, v.v.)
Cách sử dụng gần như là vô tận.
Để biết cách sử dụng chi tiết, vui lòng tham khảo GitHub.
https://github.com/kirinonakar/ocr_trans
Chưa có bình luận nào.