4 điểm bởi GN⁺ 2025-06-26 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Apple đã công bố mới mô hình AI thị giác-ngôn ngữ (AFM, Apple Foundation Models) và framework Foundation Models (API) dành cho nhà phát triển, đồng thời cải thiện đáng kể hiệu năng và hiệu quả của cả mô hình on-device lẫn mô hình đám mây
  • Mô hình AFM on-device gồm một transformer 3B tham số và một vision transformer 300 triệu tham số, hỗ trợ đầu vào văn bản·hình ảnh cùng các tính năng đa ngôn ngữ·thị giác; mô hình máy chủ áp dụng kiến trúc MoE tùy chỉnh
  • Cung cấp các tính năng mạnh mẽ và khả năng tiếp cận cho nhà phát triển như rút gọn mô hình (lượng tử hóa và LoRA), hỗ trợ 15 ngôn ngữ, hiểu hình ảnh, sử dụng công cụ
  • Mô hình on-device cho thấy lợi thế so với các mô hình cạnh tranh ở tiếng Anh ngoài thị trường Mỹ và khả năng hiểu hình ảnh, nhưng mô hình máy chủ vẫn kém hơn các mô hình mới nhất như GPT-4o
  • Sự chú ý đang đổ dồn vào sự chuyển hướng trong chiến lược AI của Apple và ảnh hưởng của hãng trong hệ sinh thái iOS, giữa lúc có tranh cãi quanh bài báo AI gần đây của Apple và việc trì hoãn nâng cấp Siri AI

Apple Foundation Models (AFM) được cập nhật quy mô lớn

  • Apple đã nâng cấp cả mô hình AI on-device (tích hợp trên thiết bị di động) và mô hình lưu trữ trên máy chủ (AFM), với tốc độ, hiệu quả và hiệu năng được cải thiện mạnh mẽ
  • Hãng cũng cung cấp mới API cho nhà phát triển (Foundation Models framework), cho phép gọi AI on-device trên các thiết bị đã kích hoạt tính năng Apple Intelligence

Kiến trúc và tính năng cốt lõi

  • Đầu vào/đầu ra: văn bản, hình ảnh (tối đa 65.000 token đầu vào), đầu ra là văn bản
  • Kiến trúc:
    • AFM-on-Device: transformer 3 tỷ tham số, vision transformer 300 triệu tham số
    • AFM-Server: transformer Mixture-of-Experts (MoE) tùy chỉnh (không công bố số lượng tham số), vision transformer 1 tỷ tham số
  • Hiệu năng: mạnh ở tiếng Anh ngoài thị trường Mỹ và khả năng hiểu hình ảnh
  • Khả dụng: AFM-on-Device có thể dùng qua Foundation Models framework. AFM-Server chưa được mở cho sử dụng công khai
  • Hỗ trợ 15 ngôn ngữ, sử dụng công cụ, v.v.
  • Thông tin chưa công bố: số tham số của mô hình máy chủ, giới hạn token, chi tiết tập dữ liệu huấn luyện, v.v. đều chưa được tiết lộ

Khác biệt kỹ thuật và tối ưu hóa

  • Lượng tử hóa (Quantization):
    • Mô hình on-device nén phần lớn trọng số xuống 2-bit, còn lớp embedding là 4-bit (sử dụng huấn luyện nhận biết lượng tử hóa)
    • Mô hình máy chủ áp dụng ASTC (nén cho đồ họa), nén xuống trung bình 3,56-bit (embedding 4-bit)
  • Adapter LoRA được dùng để bù đắp suy giảm hiệu năng do nén, đồng thời thích ứng với các tác vụ cụ thể như tóm tắt, hiệu đính, hỏi đáp
  • Kiến trúc MoE tùy chỉnh giúp giảm thiểu overhead giao tiếp giữa các phần cứng, từ đó cải thiện hiệu quả

Đánh giá hiệu năng

  • Mô hình on-device: vượt các mô hình cạnh tranh như Qwen2.5-VL-3B ở tiếng Anh ngoài thị trường Mỹ và khả năng hiểu hình ảnh
  • Mô hình máy chủ: đôi lúc nhỉnh hơn Qwen3-23B, nhưng vẫn chưa đạt tới các mô hình mới nhất như GPT-4o

Tranh cãi gần đây và sự thay đổi trong chiến lược AI

  • Gần đây Apple đã gây tranh cãi với một bài báo thử nghiệm giới hạn năng lực suy luận của 5 mô hình AI mới nhất, và các bài phản biện cũng nhanh chóng xuất hiện sau đó
  • Việc nâng cấp Siri AI bị hoãn vô thời hạn, đồng thời còn xuất hiện vụ kiện tập thể cho rằng iPhone thế hệ mới thiếu các tính năng AI
  • Trong bối cảnh phe Google/Android đang nhanh chóng dẫn trước trong cuộc đua AI, Apple đang chuyển hướng chiến lược AI của mình thông qua Foundation Models và các nỗ lực khác

Triển vọng và tác động trong thời gian tới

  • iOS nhiều khả năng sẽ tạo ra ảnh hưởng rất lớn lên hệ sinh thái nhà phát triển ứng dụng thông qua các mô hình được cài sẵn mặc định
  • Do giới hạn bộ nhớ và dung lượng mô hình, dự kiến các nhà phát triển ứng dụng sẽ ngày càng dùng mô hình do Apple cung cấp thay vì tự đóng gói mô hình AI riêng
  • Giới quan sát đang theo dõi liệu chiến lược nền tảng hóa AI của Apple có thúc đẩy đổi mới ứng dụng và mở rộng việc sử dụng AI on-device hay không

Chưa có bình luận nào.

Chưa có bình luận nào.