Meta phát hành Llama 3.2 - công nghệ đổi mới AI biên và thị giác với các mô hình tùy biến mở
(ai.meta.com)-
Meta phát hành Llama 3.2
- Bao gồm các vision LLM cỡ nhỏ và trung bình (11B và 90B) cùng các mô hình chỉ văn bản hạng nhẹ (1B và 3B)
- Có thể sử dụng trên phần cứng Qualcomm và MediaTek, được tối ưu cho bộ xử lý Arm
- Các mô hình phù hợp cho tác vụ tóm tắt, làm theo chỉ thị và viết lại
-
Đặc điểm của các mô hình Llama 3.2
- Các mô hình thị giác 11B và 90B nổi trội trong các tác vụ hiểu hình ảnh
- Có thể tinh chỉnh cho các ứng dụng tùy biến bằng
torchtune - Có thể triển khai cục bộ bằng
torchchat - Có thể sử dụng thông qua trợ lý thông minh Meta AI
-
Triển khai Llama Stack
- Đơn giản hóa việc làm việc với các mô hình Llama trong môi trường một nút, on-premise, đám mây và on-device
- Triển khai với sự hợp tác của AWS, Databricks, Dell Technologies, Fireworks, Infosys và Together AI
-
Tải xuống các mô hình Llama 3.2
- Có thể tải từ llama.com và Hugging Face
- Có thể bắt đầu phát triển ngay trên các nền tảng đối tác như AMD, AWS, Databricks, Dell, Google Cloud, Groq, IBM, Intel, Microsoft Azure, NVIDIA, Oracle Cloud và Snowflake
-
Hiệu năng của Llama 3.2
- Các mô hình 11B và 90B phù hợp cho hiểu tài liệu ở cấp độ toàn tài liệu, tạo chú thích ảnh và các tác vụ dựa trên thị giác
- Các mô hình 1B và 3B cung cấp khả năng sinh văn bản đa ngôn ngữ và gọi công cụ
- Khi chạy cục bộ, mang lại phản hồi tức thì và duy trì mức riêng tư cao
-
Đánh giá mô hình
- Hiệu năng được đánh giá trên hơn 150 bộ dữ liệu benchmark
- Hiệu năng có thể cạnh tranh với Claude 3 Haiku và GPT4o-mini
-
Mô hình thị giác
- Giới thiệu kiến trúc mô hình mới để hỗ trợ đầu vào hình ảnh
- Kết hợp prompt hình ảnh và văn bản trong khi vẫn giữ các khả năng chỉ văn bản để đạt được hiểu biết và suy luận sâu hơn
-
Mô hình hạng nhẹ
- Phát triển các mô hình 1B và 3B bằng phương pháp pruning và knowledge distillation
- Có thể chạy hiệu quả trên máy cục bộ
-
Triển khai Llama Stack
- Cung cấp giao diện chuẩn hóa thông qua API Llama Stack
- Đơn giản hóa việc làm việc với các mô hình Llama trong nhiều môi trường khác nhau
-
An toàn ở cấp hệ thống
- Phát hành Llama Guard 3 11B Vision
- Mô hình Llama Guard 3 1B giúp giảm đáng kể chi phí triển khai
-
Sử dụng Llama 3.2
- Cung cấp các công cụ và tài nguyên cần thiết cho nhà phát triển
- Có thể phát triển các ứng dụng đổi mới bằng Llama 3.2 và Llama Stack
Tổng hợp của GN⁺
- Llama 3.2 cung cấp nhiều mô hình thị giác và văn bản khác nhau, bao gồm các mô hình hạng nhẹ có thể chạy trên thiết bị biên và thiết bị di động
- Thông qua hợp tác với Qualcomm, MediaTek, Arm và các bên khác, hệ thống mang lại hiệu năng được tối ưu trên nhiều loại phần cứng
- Với triển khai Llama Stack, các nhà phát triển được hỗ trợ để dễ dàng sử dụng mô hình Llama trong nhiều môi trường khác nhau
- Llama 3.2 phù hợp để phát triển ứng dụng cục bộ nhờ mức riêng tư cao và phản hồi tức thì
- Hệ thống mang lại hiệu năng có thể cạnh tranh với Claude 3 Haiku và GPT4o-mini, đồng thời chứng minh kết quả xuất sắc trên nhiều benchmark khác nhau
1 bình luận
Ý kiến Hacker News
Bất ngờ với hiệu năng của mô hình 1B mới. Kích thước tải xuống là 1.3GB
Trong ví dụ "The Llama jumped over the ______!", với mã hóa 1-hot thì "wall" là đáp án đúng với xác suất 100%
Rất khâm phục sự cởi mở của đội Llama tại Meta. Không chỉ cho truy cập mô hình mà còn công khai cả cách xây dựng
Câu hỏi cho người mới: tôi cần một mô hình có năng lực như kỹ sư phần mềm gấp 10 lần, nhưng không cần kiến thức của con người. Không biết có mô hình nào như vậy không
Đã thử dùng mô hình 3B trên Ollama. Trả lời nhanh và có nhiều kiến thức về quang học, sinh học và Rust
Bài blog của Ollama: liên kết
Mô hình
llama3.2:3b-instruct-q8_0cho hiệu năng tốt hơn3.1 8b-q4. Chạy nhanh hơn trên MacBook Pro M1 và kết quả cũng tốt hơn3.1-8bllama3.2:3b-instruct-q8_0: 3.4GB, sửa đổi 2 giờ trướcgemma2:9b-instruct-q4_1: 6.0GB, sửa đổi 3 ngày trướcphi3.5:3.8b-mini-instruct-q8_0: 4.1GB, sửa đổi 3 ngày trướcmxbai-embed-large:latest: 669MB, sửa đổi 3 tháng trướcHỏi xem có thể đề xuất một client web UI cho Ollama hay không
Hỏi xem có bảng xếp hạng nào có benchmark LLM mới nhất không
Mô hình 3B khá tốt ở tác vụ đa phương thức (tiếng Na Uy), nhưng đôi khi trả lời rất nhiều điều vô nghĩa. Nhạy hơn 8B, nhưng vẫn dùng được hơn Gemma 2 2B