1 điểm bởi spilist2 2024-03-29 | 1 bình luận | Chia sẻ qua WhatsApp

Tôi đang làm việc tại một công ty dịch thuật media và cung cấp một trình biên tập phụ đề.

Trong trình biên tập có tính năng kiểm tra chính tả, và chúng tôi chuyển toàn bộ phụ đề thành văn bản rồi (chia nhỏ ra) gọi API.

Hiện tại chúng tôi đang dùng API của Bing nhưng hiệu năng rất tệ. Những lỗi cần bắt thì không bắt được, còn những thứ không nên bắt thì lại bắt.

Các phương án thay thế tôi đã thử như sau.

  • AWS Spellcheck có giới hạn 20 ký tự cho mỗi lần gọi nên quá khó để dùng
  • Grammarly đã ngừng hỗ trợ API từ năm ngoái
  • Tôi đã thử test https://sapling.ai/ nhưng chất lượng lại còn kém hơn cả Bing
  • Tôi cũng đã thử tất cả các API trong https://rapidapi.com/collection/grammar-spellcheck-api nhưng khó mà nói là tốt hơn Bing rõ rệt

Ngay cả khi không nhất thiết phải là 'đa ngôn ngữ', chỉ cần bắt lỗi tiếng Anh tốt thôi cũng được, nhưng có vẻ không có nhiều phương án thay thế tốt. Dù không phải gợi ý sản phẩm, nếu bạn từng có kinh nghiệm triển khai kiểm tra chính tả thì tôi cũng rất cảm kích nếu bạn chia sẻ.

1 bình luận

 
libner 2024-04-01

https://huggingface.co/mzbac/mistral-grammar/tree/main
Vì bị thu hút bởi cụm “đa ngôn ngữ” nên khi tìm các dòng Mistral tôi có thấy cái này, nhưng không rõ nó có đáp ứng được đến mức dùng ở cấp độ sản phẩm hay không...
Có vẻ như nó được fine-tune để phù hợp với tiếng Anh, hay là bạn thử model này xem sao?