- Các công ty AI và viện nghiên cứu hàng đầu châu Âu đã công bố dự án OpenEuroLLM nhằm đồng phát triển mô hình ngôn ngữ lớn (LLM) mã nguồn mở thế hệ tiếp theo
- Dự án hướng tới hiệu năng cao và hỗ trợ đa ngôn ngữ, đồng thời xây dựng các mô hình minh bạch, tuân thủ quy định để có thể ứng dụng trong dịch vụ thương mại và công
- Là mô hình mã nguồn mở minh bạch và tuân thủ quy định, dự án được phát triển theo khuôn khổ pháp lý của châu Âu nhằm phổ cập quyền tiếp cận công nghệ AI chất lượng cao và hỗ trợ các doanh nghiệp châu Âu nâng cao năng lực cạnh tranh trên thị trường toàn cầu
- Dự án đã đạt chứng nhận STEP (Strategic Technologies for Europe Platform) và nhận tài trợ từ chương trình Digital Europe của Liên minh châu Âu, chính thức bắt đầu từ ngày 1 tháng 2 năm 2025
Nội dung chính của dự án
- Tên dự án: OpenEuroLLM
- Mục tiêu
- Củng cố và nâng cao năng lực cạnh tranh AI cùng chủ quyền số của châu Âu thông qua LLM mã nguồn mở
- Thể hiện tầm quan trọng của tính minh bạch, tính mở và sự tham gia của cộng đồng trong hệ sinh thái công nghệ châu Âu
- Được phát triển trong khuôn khổ pháp lý chặt chẽ của châu Âu để duy trì các giá trị châu Âu và sự xuất sắc về công nghệ
- Cho phép sử dụng tự do trong khu vực thương mại và công, đồng thời hỗ trợ fine-tuning tùy chỉnh theo từng ngành
- Tăng cường môi trường đa ngôn ngữ có xét đến sự đa dạng ngôn ngữ và văn hóa tại châu Âu, giúp các doanh nghiệp châu Âu phát triển sản phẩm và dịch vụ chất lượng cao trong kỷ nguyên AI
- Phạm vi hoạt động
- Dựa trên các thành quả sẵn có như kho dữ liệu chất lượng cao và LLM thử nghiệm để cùng phát triển các mô hình và phần mềm mới
- Hợp tác với cộng đồng mã nguồn mở và các chuyên gia trong ngành như LAION, open-sci, OpenML
- Hướng tới việc cung cấp nền tảng mà bất kỳ ai cũng có thể truy cập và cải thiện thông qua quy trình phát triển và đánh giá mô hình minh bạch
Cấu trúc đối tác
- Trường đại học và viện nghiên cứu
- Charles University (Séc, điều phối), ALT-EDIC (Pháp), Eindhoven University of Technology (Hà Lan), ELLIS Institute Tübingen (Đức), Fraunhofer IAIS (Đức) cùng tổng cộng 11 tổ chức tham gia
- Phụ trách dữ liệu quy mô lớn, phát triển thuật toán và kiểm chứng dựa trên năng lực nghiên cứu mạnh mẽ
- Doanh nghiệp
- AMD Silo AI (Phần Lan, đồng dẫn dắt), Aleph Alpha Research (Đức), ellamind (Đức), LightOn (Pháp), Prompsit Language Engineering (Tây Ban Nha) cùng tổng cộng 5 doanh nghiệp tham gia
- Phụ trách tối ưu hóa mô hình trong môi trường công nghiệp, bí quyết thương mại hóa và nghiên cứu các trường hợp ứng dụng kinh doanh
- Các trung tâm EuroHPC
- Barcelona Supercomputing Center (Tây Ban Nha), Cineca Interuniversity Consortium (Ý), CSC - IT Center for Science (Phần Lan), SURF (Hà Lan)
- Phụ trách hỗ trợ huấn luyện và thử nghiệm thông qua việc cung cấp hạ tầng tính toán hiệu năng cực cao
Giá trị dự án và hiệu quả kỳ vọng
- Mô hình mã nguồn mở minh bạch và tuân thủ pháp lý
- Tuân thủ các quy định nghiêm ngặt và hệ giá trị của châu Âu, đồng thời công khai các mô hình ngôn ngữ quy mô lớn, hiệu năng cao để mọi người đều có thể sử dụng
- Góp phần nâng cao năng lực cạnh tranh toàn cầu và đổi mới dịch vụ của cơ quan công quyền và doanh nghiệp
- Hỗ trợ đa ngôn ngữ và đa dạng văn hóa
- Phản ánh các đặc điểm ngôn ngữ và văn hóa đa dạng tại châu Âu vào mô hình, tạo nền tảng hỗ trợ triển khai dịch vụ chất lượng cao
- Tạo môi trường để doanh nghiệp châu Âu có thể cung cấp các sản phẩm ổn định và toàn diện bằng công nghệ tự chủ
- Tăng cường hệ sinh thái AI và hợp tác
- Các viện nghiên cứu, doanh nghiệp và trung tâm siêu máy tính châu Âu cùng kết hợp hạ tầng và chuyên môn
- Kỳ vọng bảo đảm cải tiến liên tục và khả năng mở rộng thông qua cộng đồng mã nguồn mở và các quan hệ đối tác chiến lược
1 bình luận
Ý kiến trên Hacker News
Có ý kiến hoài nghi về một dự án có nhiều tổ chức tham gia. Dù có nhiều bên góp mặt, vẫn có lo ngại rằng việc hợp tác sẽ khó khăn do mỗi bên có ưu tiên khác nhau. Cũng có quan điểm cho rằng dựa trên kinh nghiệm trước đây, họ sẽ tập trung vào nghiên cứu riêng lẻ hơn là hợp tác
Có ý kiến cho rằng dù các dự án AI của châu Âu khó cạnh tranh với các viện nghiên cứu lớn, đây vẫn có thể là cơ hội để thúc đẩy AI thông qua các mô hình mã nguồn mở. Châu Âu có thể khó thu hẹp khoảng cách với Mỹ và Trung Quốc, nhưng dự án này có thể trở thành chất xúc tác giúp tăng năng lực cạnh tranh
Có ý kiến cho rằng ngân sách được phân bổ cho dự án là không đủ. Lập luận được đưa ra là nguồn vốn cần thiết cho các dự án AI của châu Âu phải lớn hơn nhiều
Có ý kiến cho rằng dự án sẽ cung cấp các mô hình AI minh bạch và tuân thủ quy định, nhưng về hiệu năng thì sẽ không đáp ứng được kỳ vọng
Có ý kiến cho rằng lý do các viện nghiên cứu và công ty AI lớn của châu Âu không tham gia dự án là vì khả năng thất bại quá cao
Có ý kiến nhấn mạnh tầm quan trọng của dự án, cho rằng việc châu Âu xây dựng hạ tầng AI độc lập là điều thiết yếu. Cũng có kỳ vọng rằng Open LLM sẽ nâng cao tiêu chuẩn cho thành công dài hạn của AI
Có ý kiến cho rằng dự án đã có sẵn dữ liệu tốt và các mô hình hiện có, đồng thời cũng có thể kỳ vọng vào kết quả thương mại. Các công ty như Red Hat, Volvo và SAAB đang tham gia
Có ý kiến cho rằng trên thực tế các quy định bảo vệ dữ liệu cá nhân của châu Âu không tạo ra khác biệt lớn. Đồng thời có kỳ vọng rằng châu Âu sẽ sớm giải quyết vấn đề này