Laravel AI Translator: Hệ thống dịch AI mạnh mẽ hơn cho sản phẩm dựa trên Laravel (hoặc Crowdin)
(github.com/kargnas)Trước đây tôi đã từng giới thiệu, nhưng nay xin chia sẻ lại vì đã cập nhật tính năng mới và thực hiện refactor.
Tôi là người sáng lập và hiện đang vận hành dịch vụ dữ liệu game toàn cầu OP.GG.
Chúng tôi đang cung cấp dịch vụ bằng hơn 15 ngôn ngữ. Trong thời gian qua, khi sử dụng dịch giả con người, chúng tôi đã nhiều lần gặp các vấn đề như tiến độ bị lùi hàng tháng, các công ty dịch thuật lén dùng máy dịch rồi giao bản dịch, hoặc chất lượng bản dịch quá thấp. Dự án này được lên ý tưởng mới từ những trải nghiệm đó.
Dự án này được bắt đầu với mục tiêu dùng công nghệ AI để khi cần dịch từ 3 ngôn ngữ trở lên thì có thể thực hiện nhanh hơn nhiều so với giao cho con người (chỉ trong vài phút), và dù không phải chất lượng tốt nhất thì vẫn đảm bảo ít nhất ở mức khá. Nếu coi bản dịch của con người là 90 điểm và Google Dịch là 30 điểm, thì mục tiêu của hệ thống dịch này là đạt 80 điểm. Và cùng với sự phát triển của LLM, có lẽ trong vòng 1-2 năm tới có thể kỳ vọng đạt trên 90 điểm. Tất nhiên chi phí cũng thấp hơn rất nhiều so với con người.
Các tính năng chính được cân nhắc gồm có:
- Khi gửi yêu cầu tới AI, hệ thống sẽ đưa vào ngữ cảnh nhiều chuỗi liên quan nhất có thể để tăng tính nhất quán trong bản dịch và trong cách dùng thuật ngữ. Ngữ cảnh sẽ bao gồm chuỗi của ngôn ngữ nguồn và các chuỗi đã được dịch sẵn của ngôn ngữ đích. [Tính năng mới]
- Nếu bạn đang dùng CrowdIn, một nền tảng dịch thuật xã hội đồng thời là nền tảng dịch có tích hợp các đơn vị thuê ngoài dễ giao việc, thì còn có một tính năng ẩn cho phép dịch cả dự án trên CrowdIn. Bạn vẫn có thể dùng nó cho các dự án hoàn toàn không liên quan đến Laravel. Tài liệu không đề cập, vì đây là tính năng chúng tôi phát triển cho nội bộ. (lệnh:
ai-translator:translate-crowdin) [Tính năng mới] - Có thể cấu hình mọi ngôn ngữ trên thế giới mà LLM hỗ trợ
- Có thể thêm tính năng ngôn ngữ riêng.
README.mdcó ví dụ về văn phong văn hóa Triều Tiên và thuật ngữ Reddit.
- Có thể thêm tính năng ngôn ngữ riêng.
- Hỗ trợ Claude và OpenAI (tuy nhiên khuyến nghị dùng model Claude vì chất lượng cao hơn)
- Hỗ trợ Claude 3.7 Deep Thinking [Tính năng mới]
- Hỗ trợ xử lý số nhiều (Plural) trong tính năng bản địa hóa của Laravel
- Giúp dịch ngôn ngữ một cách thông minh hơn
- Phân biệt câu và từ để dịch phù hợp
- Nhìn vào key để dịch theo đúng ý đồ của lập trình viên nếu có thể (vì vậy bạn nên đặt key thật rõ ràng)
- Có thể thêm ngữ cảnh theo từng ngôn ngữ và từng dự án để bản dịch tự nhiên hơn nhiều khi dịch dự án (điểm cốt lõi)
- So với việc chỉ đơn thuần yêu cầu dịch, việc nói rõ cho AI biết một số từ cụ thể trong dự án này mang ý nghĩa gì là yếu tố cực kỳ quan trọng để nâng cao chất lượng.
- Ví dụ, khi dùng từ 'Champion' trong tiếng Anh, nếu dịch sang tiếng Hàn thì nên dịch là 'champion', còn nếu dịch sang tiếng Trung thì nên dịch là 英雄, v.v. Khi được cung cấp những thông tin như vậy, bản dịch sẽ tự nhiên hơn rất nhiều.
Nếu bạn đang tìm hiểu cách viết prompt, hãy ghé thư mục này để xem các prompt tôi đã tạo. Và nếu bạn có ý tưởng muốn bổ sung, rất mong nhận được Pull Request.
5 bình luận
Cả tài liệu chính thức của Laravel cũng có thể chứ?
Cảm ơn bạn đã giới thiệu một dự án hay.
Nếu có thể cung cấp image Docker thì có lẽ việc sử dụng sẽ thuận tiện hơn.
Vì chi phí khi dùng API của LLM có thể khá cao, nên sẽ rất tốt nếu cũng có tính năng dự đoán chi phí cho dữ liệu đầu vào.
Thú vị là gói này còn hỗ trợ cả tiếng Triều Tiên nữa, với tư cách là một người dùng OP.GG thì tôi xin ủng hộ.
Có vẻ như anh/chị đã nỗ lực hỗ trợ đa ngôn ngữ từ rất sớm, xin gửi lời ủng hộ.