Apple cập nhật mạnh mẽ các mô hình AI on-device và đám mây, đồng thời công bố API mới cho nhà phát triển

(deeplearning.ai)

4 điểm bởi GN⁺ 2025-06-26 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Apple đã công bố mới mô hình AI thị giác-ngôn ngữ (AFM, Apple Foundation Models) và framework Foundation Models (API) dành cho nhà phát triển, đồng thời cải thiện đáng kể hiệu năng và hiệu quả của cả mô hình on-device lẫn mô hình đám mây
Mô hình AFM on-device gồm một transformer 3B tham số và một vision transformer 300 triệu tham số, hỗ trợ đầu vào văn bản·hình ảnh cùng các tính năng đa ngôn ngữ·thị giác; mô hình máy chủ áp dụng kiến trúc MoE tùy chỉnh
Cung cấp các tính năng mạnh mẽ và khả năng tiếp cận cho nhà phát triển như rút gọn mô hình (lượng tử hóa và LoRA), hỗ trợ 15 ngôn ngữ, hiểu hình ảnh, sử dụng công cụ
Mô hình on-device cho thấy lợi thế so với các mô hình cạnh tranh ở tiếng Anh ngoài thị trường Mỹ và khả năng hiểu hình ảnh, nhưng mô hình máy chủ vẫn kém hơn các mô hình mới nhất như GPT-4o
Sự chú ý đang đổ dồn vào sự chuyển hướng trong chiến lược AI của Apple và ảnh hưởng của hãng trong hệ sinh thái iOS, giữa lúc có tranh cãi quanh bài báo AI gần đây của Apple và việc trì hoãn nâng cấp Siri AI

Apple Foundation Models (AFM) được cập nhật quy mô lớn

Apple đã nâng cấp cả mô hình AI on-device (tích hợp trên thiết bị di động) và mô hình lưu trữ trên máy chủ (AFM), với tốc độ, hiệu quả và hiệu năng được cải thiện mạnh mẽ
Hãng cũng cung cấp mới API cho nhà phát triển (Foundation Models framework), cho phép gọi AI on-device trên các thiết bị đã kích hoạt tính năng Apple Intelligence

Đầu vào/đầu ra: văn bản, hình ảnh (tối đa 65.000 token đầu vào), đầu ra là văn bản
Kiến trúc:
- AFM-on-Device: transformer 3 tỷ tham số, vision transformer 300 triệu tham số
- AFM-Server: transformer Mixture-of-Experts (MoE) tùy chỉnh (không công bố số lượng tham số), vision transformer 1 tỷ tham số
Hiệu năng: mạnh ở tiếng Anh ngoài thị trường Mỹ và khả năng hiểu hình ảnh
Khả dụng: AFM-on-Device có thể dùng qua Foundation Models framework. AFM-Server chưa được mở cho sử dụng công khai
Hỗ trợ 15 ngôn ngữ, sử dụng công cụ, v.v.
Thông tin chưa công bố: số tham số của mô hình máy chủ, giới hạn token, chi tiết tập dữ liệu huấn luyện, v.v. đều chưa được tiết lộ

Lượng tử hóa (Quantization):
- Mô hình on-device nén phần lớn trọng số xuống 2-bit, còn lớp embedding là 4-bit (sử dụng huấn luyện nhận biết lượng tử hóa)
- Mô hình máy chủ áp dụng ASTC (nén cho đồ họa), nén xuống trung bình 3,56-bit (embedding 4-bit)
Adapter LoRA được dùng để bù đắp suy giảm hiệu năng do nén, đồng thời thích ứng với các tác vụ cụ thể như tóm tắt, hiệu đính, hỏi đáp
Kiến trúc MoE tùy chỉnh giúp giảm thiểu overhead giao tiếp giữa các phần cứng, từ đó cải thiện hiệu quả

Mô hình on-device: vượt các mô hình cạnh tranh như Qwen2.5-VL-3B ở tiếng Anh ngoài thị trường Mỹ và khả năng hiểu hình ảnh
Mô hình máy chủ: đôi lúc nhỉnh hơn Qwen3-23B, nhưng vẫn chưa đạt tới các mô hình mới nhất như GPT-4o

Gần đây Apple đã gây tranh cãi với một bài báo thử nghiệm giới hạn năng lực suy luận của 5 mô hình AI mới nhất, và các bài phản biện cũng nhanh chóng xuất hiện sau đó
Việc nâng cấp Siri AI bị hoãn vô thời hạn, đồng thời còn xuất hiện vụ kiện tập thể cho rằng iPhone thế hệ mới thiếu các tính năng AI
Trong bối cảnh phe Google/Android đang nhanh chóng dẫn trước trong cuộc đua AI, Apple đang chuyển hướng chiến lược AI của mình thông qua Foundation Models và các nỗ lực khác

iOS nhiều khả năng sẽ tạo ra ảnh hưởng rất lớn lên hệ sinh thái nhà phát triển ứng dụng thông qua các mô hình được cài sẵn mặc định
Do giới hạn bộ nhớ và dung lượng mô hình, dự kiến các nhà phát triển ứng dụng sẽ ngày càng dùng mô hình do Apple cung cấp thay vì tự đóng gói mô hình AI riêng
Giới quan sát đang theo dõi liệu chiến lược nền tảng hóa AI của Apple có thúc đẩy đổi mới ứng dụng và mở rộng việc sử dụng AI on-device hay không