Co-op Translator: Hỗ trợ dịch đa ngôn ngữ cho dự án chỉ với một dòng lệnh
(github.com/Azure)👀 Có lẽ bạn đã từng trải qua việc dịch và quản lý một dự án đa ngôn ngữ phiền toái đến mức nào. Đặc biệt, nếu có nhiều tài liệu Markdown cần dịch hoặc ngay cả hình ảnh trong dự án cũng cần được dịch, mọi thứ lại càng trở nên phức tạp hơn.
✅Để giải quyết sự bất tiện này, chúng tôi đã phát triển một mã nguồn mở tận dụng dịch vụ Azure AI và công nghệ LLM mới nhất, cho phép quản lý đa ngôn ngữ của dự án chỉ với một dòng lệnh.
✅ Co-op Translator là một gói Python sử dụng Azure OpenAI và Azure Computer Vision để tự động dịch các tệp Markdown và văn bản trong hình ảnh sang nhiều ngôn ngữ, đồng thời sắp xếp chúng vào thư mục dịch được chỉ định. Bạn có thể dịch toàn bộ tệp tài liệu trong dự án chỉ bằng một dòng lệnh, từ đó quản lý hỗ trợ đa ngôn ngữ một cách hiệu quả.
✅ Các tính năng và đặc điểm chính:
Dịch tự động: Thực hiện dịch đa ngôn ngữ một cách dễ dàng.
Giữ nguyên định dạng Markdown: Vẫn giữ nguyên định dạng Markdown gốc trong quá trình dịch.
Dịch văn bản trong hình ảnh: Dịch cả văn bản có trong hình ảnh để lưu lại và thay thế các liên kết đính kèm trong bản dịch Markdown bằng liên kết đã được dịch.
Hỗ trợ nhiều ngôn ngữ: Có thể dịch sang khoảng 40 ngôn ngữ, bao gồm cả tiếng Hàn.
Tích hợp đơn giản: Dễ dàng tích hợp vào dự án để nhanh chóng bổ sung hỗ trợ đa ngôn ngữ.
✅ README của Co-op Translator có giải thích chi tiết và hướng dẫn để hỗ trợ đa ngôn ngữ, hãy tham khảo nhé!
: https://github.com/Azure/co-op-translator
✅ Hiện tại, dự án mã nguồn mở chính thức của Microsoft là Phi-3 Cookbook đang quản lý đa ngôn ngữ bằng Co-op Translator. Nếu bạn muốn xem ví dụ về cách quản lý dịch đa ngôn ngữ bằng Co-op Translator, rất đáng để ghé qua!
: https://github.com/microsoft/Phi-3CookBook
Nếu bạn dùng thử và có tính năng nào muốn được bổ sung hoặc có điều gì thắc mắc, chúng tôi rất cảm kích nếu bạn để lại trên GitHub Issues hoặc trong phần bình luận!
4 bình luận
Tôi còn tưởng đây là repo cá nhân, hóa ra là chính thức của Azure à??
Vâng, đúng vậy😊. Kể một chút về câu chuyện này...
Ban đầu, khi tham gia với vai trò cộng tác viên trong dự án mã nguồn mở Phi-3 CookBook của Microsoft, tôi đã đề xuất thực hiện bản dịch tiếng Hàn, và đúng lúc đó tôi được một nhân viên của Microsoft chia sẻ rằng trong chương trình tài trợ đại học của Microsoft đang có một dự án tự động hóa dịch đa ngôn ngữ.
May mắn là tôi đã được kết nối với nhóm đó để tìm hiểu, và hóa ra các sinh viên của Imperial College ở Anh đã triển khai sẵn các chức năng ban đầu và POC (proof of concept), nhưng cấu trúc khi ấy vẫn hơi phức tạp để thương mại hóa.
Vì vậy, dựa trên POC (proof of concept) này, tôi đã thiết kế lại thành một dự án mã nguồn mở Python có thể đưa vào sử dụng thực tế và triển khai các tính năng cần thiết. Sau đó, dự án này đã được chuyển thành mã nguồn mở chính thức của Azure, và hiện tại tôi đang là maintainer chính của dự án!
Cảm ơn bạn đã đọc bài viết dài này. Trong thời gian tới, tôi sẽ tiếp tục cải thiện tính năng để nhiều người có thể sử dụng thuận tiện hơn.
Đây là một dự án rất hay! Cảm ơn bạn đã chia sẻ :)
Tuy nhiên, về sau sẽ còn tốt hơn nếu phần dịch thuật có thể dễ dàng thay sang dịch vụ khác. Không phải là tôi ghét Azure, mà đây là một dự án rất hữu ích và có thể dùng theo nhiều cách một cách phổ biến, nhưng vì dịch vụ backend đang phụ thuộc vào Azure nên ngoài những nơi dùng nội bộ trong MS hoặc các doanh nghiệp đã có sẵn hợp đồng với Azure, có lẽ sẽ không có nhiều người muốn thử dùng, nên cũng hơi đáng tiếc.
Xin chào, cảm ơn bạn đã gửi phản hồi rất hữu ích! 😊
Đây thực sự là một đề xuất rất hay. Hiện tại dự án được phát triển dựa trên dịch vụ Azure, nhưng như bạn nói, nếu áp dụng một cấu trúc có thể dễ dàng chuyển đổi sang các dịch vụ dịch thuật khác để nhiều người có thể tự do sử dụng hơn, thì có lẽ giá trị của dự án cũng sẽ được nâng lên thêm một bậc.
Tôi sẽ tiếp tục suy nghĩ kỹ về phản hồi này. Cảm ơn bạn đã cho biết!