- Mistral Large là mô hình tạo sinh văn bản tiên tiến, sở hữu năng lực suy luận hàng đầu
- Có thể thực hiện các tác vụ suy luận phức tạp bằng nhiều ngôn ngữ, đồng thời dùng cho hiểu văn bản, chuyển đổi và sinh mã
- Cho thấy hiệu năng mạnh trên benchmark MMLU và là mô hình xếp hạng cao thứ hai trên thế giới hiện đang phổ biến rộng rãi qua API
- 81.2%, đứng sau GPT-4 86.4%; Claude 2 đạt 78.5%, Gemini Pro đạt 71.8%
Tính năng mới và điểm mạnh của Mistral Large
- Thành thạo ở mức bản ngữ với tiếng Anh, tiếng Pháp, tiếng Tây Ban Nha, tiếng Đức và tiếng Ý, đồng thời cung cấp khả năng hiểu tinh tế về ngữ pháp và bối cảnh văn hóa
- Cửa sổ ngữ cảnh 32K token cho phép truy hồi thông tin chính xác từ các tài liệu lớn
- Khả năng tuân thủ chỉ thị chính xác giúp các nhà phát triển thiết kế chính sách kiểm duyệt riêng, và được dùng cho thiết lập kiểm duyệt cấp hệ thống của le Chat
- Tích hợp sẵn function calling, kết hợp với chế độ đầu ra bị giới hạn được triển khai trên la Plateforme, cho phép phát triển ứng dụng và hiện đại hóa tech stack ở quy mô lớn
Cung cấp mô hình trên Azure thông qua quan hệ đối tác với Microsoft
- Mục tiêu của Mistral là phổ cập AI tiên tiến hàng đầu, và để làm điều đó, hãng cung cấp các mô hình mở và thương mại trên Azure
- Các mô hình của Mistral có thể được sử dụng qua La Plateforme và Azure, đồng thời cũng có thể được triển khai trực tiếp trong môi trường của người dùng
- La Plateforme được lưu trữ an toàn trên hạ tầng châu Âu của Mistral, còn Azure được cung cấp qua Azure AI Studio và Azure Machine Learning
- Tự triển khai cho phép truy cập vào trọng số mô hình đối với những trường hợp sử dụng nhạy cảm nhất; có thể đọc các case study thành công và liên hệ đội ngũ để biết thêm chi tiết
Năng lực của Mistral Large
- Mistral Large cho thấy năng lực suy luận mạnh khi so sánh với các mô hình LLM hàng đầu trên các benchmark tiêu chuẩn
- Về năng lực đa ngôn ngữ, Mistral Large cũng vượt xa LLaMA 2 70B ở tiếng Pháp, tiếng Đức, tiếng Tây Ban Nha và tiếng Ý
- Cũng cho thấy hiệu năng hàng đầu trong các tác vụ lập trình và toán học
Mistral Small mới, tối ưu cho workload độ trễ thấp
- Cùng với Mistral Large, hãng ra mắt Mistral Small, một mô hình mới được tối ưu cho độ trễ và chi phí
- Mistral Small có hiệu năng tốt hơn Mixtral 8x7B và độ trễ thấp hơn, là giải pháp trung gian tinh gọn giữa bản cung cấp open-weight và các mô hình flagship
- Mistral Small tận dụng cùng các đổi mới về kích hoạt RAG và function calling như Mistral Large
- Cung cấp endpoint open-weight với mức giá cạnh tranh cùng endpoint mô hình tối ưu mới, mang lại góc nhìn toàn diện về bài toán đánh đổi hiệu năng/chi phí
Định dạng JSON và function calling
- Chế độ định dạng JSON buộc đầu ra của mô hình ngôn ngữ phải là JSON hợp lệ
- Thông qua function calling, các nhà phát triển có thể kết nối bộ công cụ riêng và endpoint của Mistral để cho phép các tương tác phức tạp hơn với mã nội bộ, API hoặc cơ sở dữ liệu
- Function calling và định dạng JSON chỉ khả dụng trên mistral-small và mistral-large, và việc chỉ định định dạng cho mọi endpoint sẽ sớm được bổ sung
Ý kiến của GN⁺
- Mistral Large là mô hình ngôn ngữ AI có hỗ trợ đa ngôn ngữ và năng lực suy luận nâng cao; khả năng thực hiện các tác vụ phức tạp bằng nhiều ngôn ngữ là điểm đặc biệt đáng chú ý.
- Mô hình này có tiềm năng cạnh tranh với các mô hình hiện có như GPT-4, và đặc biệt là việc hỗ trợ nhiều ngôn ngữ giúp tăng khả năng ứng dụng trên thị trường toàn cầu.
- Quan hệ đối tác với Azure mang lại cơ hội để các mô hình của Mistral AI tiếp cận tập người dùng rộng hơn, đồng thời tăng cường khả năng mở rộng và tính dễ tiếp cận của dịch vụ AI trên nền tảng đám mây.
- Việc ra mắt các mô hình tối ưu như Mistral Small có thể trở thành lựa chọn hấp dẫn cho các doanh nghiệp cần giải pháp AI tiết kiệm chi phí và có độ trễ thấp.
- Tính năng định dạng JSON và function calling giúp các nhà phát triển tích hợp mô hình AI vào ứng dụng của mình dễ dàng hơn, từ đó nâng cao tính thực tiễn và tính linh hoạt của công nghệ AI.
1 bình luận
Ý kiến trên Hacker News
Đánh giá cao sự thẳng thắn trong tài liệu marketing. Việc cho thấy điểm benchmark thấp hơn sản phẩm dẫn đầu thị trường được xem là tốt hơn cách Google chọn lọc benchmark để sử dụng.
Họ đã làm được nhiều việc, nhưng có ý kiến cho rằng sẽ tốt hơn nếu có thêm nội dung tái khẳng định cam kết đóng góp cho cộng đồng mã nguồn mở. Đây từng được xem là một phần quan trọng trong thương hiệu của họ.
Sau vụ miqu, đã theo dõi với kỳ vọng sẽ có thêm nhiều open-weight được công bố, nhưng có lẽ vẫn phải chờ xem kết quả.
Cập nhật thay đổi: đổi tên endpoint API và bổ sung endpoint mô hình, phát hành mô hình mới, cập nhật các mô hình hiện có và thông báo kế hoạch ngừng hỗ trợ.
Tính năng API mới: có thể dùng function calling và chế độ JSON trên các mô hình Mistral Small và Mistral Large.
La Plateforme: bổ sung hệ thống thanh toán hỗ trợ đa tiền tệ và giới thiệu các tính năng nền tảng dành cho doanh nghiệp.
Le Chat: ra mắt giao diện chat mới giúp tương tác với các mô hình Mistral dễ dàng hơn.
Đã thêm các mô hình mới vào plugin cho công cụ LLM CLI. Giờ có thể dùng như sau.
Đã thử dùng Le Chat để giải quyết một vài vấn đề lập trình phát sinh hôm nay, và nó đưa ra câu trả lời tốt hơn hẳn ChatGPT (bao gồm cả GPT-4). Không rõ có phải chất lượng của ChatGPT đã giảm vì cắt giảm chi phí như một số người gợi ý hay không, nhưng với vài vấn đề này thì chất lượng câu trả lời của Mistral vượt trội hơn nhiều.
Trước giờ không biết đến sự tồn tại của Le Chat. Vốn muốn có một đối thủ của ChatGPT dùng Mistral, và cũng thích việc họ đặt thêm "le" ở trước tên sản phẩm.
Trên Azure, Mistral rẻ hơn GPT-4 một chút.
Có thắc mắc liệu mọi ồn ào xung quanh open-weight đã thực sự kết thúc chưa, hay mọi thứ sẽ tiếp tục đóng kín.
Có câu hỏi rằng không thấy thông tin nào về kích thước tham số, không rõ đây là chủ ý hay chỉ là bị bỏ sót.
Cảm giác giống như có nhiều kiến trúc CPU có thể thay thế lẫn nhau. Mỗi khi một LLM mới được phát hành lại có thêm hy vọng rằng tính độc quyền sẽ giảm đi rất nhiều và mọi thứ sẽ tốt hơn. Ngay cả khi không có mô hình mã nguồn mở, OpenAI dường như đã hoàn thành sứ mệnh của họ.