1 điểm bởi GN⁺ 2025-01-07 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Apple Intelligence có nền tảng vững chắc gồm xử lý trên thiết bị và Private Cloud Compute, nhưng trải nghiệm sản phẩm thực tế giống các cải tiến kiểu demo công nghệ hơn là “chiếc xe đạp cho tâm trí” hỗ trợ sáng tạo
  • Khả năng hiểu ngữ cảnh cá nhân của Siri mà Apple từng hé lộ hứa hẹn các tình huống sử dụng như “phát podcast mà vợ tôi gửi vài ngày trước”, nhưng tính năng cốt lõi được lặp đi lặp lại trong quảng cáo vẫn chưa được phát hành
  • Private Cloud Compute đã trở thành một ví dụ hiếm về điện toán tin cậy có thể xác minh từ xa nhờ xóa dữ liệu người dùng, xác minh node, ảnh OS công khai và công bố mã nguồn phần lõi bảo mật, nhưng các tính năng chạy trên nền tảng đó lại không đáp ứng kỳ vọng
  • Trong các tính năng thực tế, Math Notes là phần hài lòng nhất vì xử lý trực tiếp các phép tính dựa trên biến trong Notes, còn Writing Tools, tóm tắt thông báo, Clean Up và Image Playground bộc lộ điểm yếu về tính hữu ích, độ chính xác và khả năng kiểm soát sáng tạo
  • AI tạo sinh giống một chi tiết triển khai trong một sản phẩm lớn hơn hơn là một sản phẩm độc lập, và Apple Intelligence thậm chí còn kém hữu ích hơn cảm giác khi tích hợp trực tiếp Ollama trên cùng thiết bị

Triết lý sản phẩm Apple từng là “chiếc xe đạp cho tâm trí”

  • Năm 1981, Steve Jobs ví máy tính như một chiếc xe đạp cho tinh thần con người, coi đó là công cụ giúp phát huy sức sáng tạo lớn hơn với ít năng lượng hơn
  • Macintosh và MacWrite, khác với máy đánh chữ hay chữ viết tay, cho phép xem tài liệu trên màn hình trước khi in và sửa bằng Backspace
  • Trình xử lý văn bản đã thay đổi mạnh mẽ cách viết tài liệu, và sản phẩm Apple đặt ra tiêu chuẩn rằng chúng không chỉ là máy tính toán đơn thuần mà phải vận hành như phần mở rộng của cơ thể để hỗ trợ sáng tạo
  • Theo tiêu chuẩn này, Apple được phân biệt là công ty bán công cụ sáng tạo, chứ không phải “máy tính làm việc của máy tính”

Tầm nhìn mà Apple Intelligence đã hứa hẹn

  • Tháng 6/2024, Apple công bố Apple Intelligence và giới thiệu đây là một bộ tính năng giúp smartphone thông minh hơn
  • Ví dụ Siri xử lý yêu cầu như “phát podcast mà vợ tôi gửi vài ngày trước” cho thấy khả năng tìm kiếm ngữ cảnh cá nhân, kết nối các mối quan hệ, liên kết và ngữ cảnh ứng dụng
  • Nếu tầm nhìn này thành hiện thực, người dùng có thể tìm kiếm đời sống số rải rác trong nhiều ứng dụng bằng ngôn ngữ tự nhiên, và điện thoại có thể thay họ thực hiện tác vụ
  • Apple đưa ra ý tưởng rằng mọi thiết bị Apple đều có thể truy cập trí thông minh (intelligence), giống như Spotify cung cấp âm nhạc hay AWS API cung cấp điện toán như vòi nước
  • Hướng đi này gần với tầm nhìn “chiếc xe đạp cho tâm trí”, nơi máy tính hoạt động cùng người dùng để làm điều họ muốn

Cách các ứng dụng hiện đại khiến người dùng xa rời dữ liệu của chính mình

  • Một vấn đề lớn của ứng dụng hiện đại là nhiều ứng dụng hoạt động như lớp vỏ mỏng của dịch vụ web
  • Các ứng dụng như Instagram hay Bluesky gửi yêu cầu lên máy chủ, nhận phản hồi rồi hiển thị nội dung
  • Khi không có sóng, ngay cả việc lên lịch bài đăng, xem lại bài đã từng xem hay kiểm tra nội dung vừa đăng cũng có thể trở nên khó khăn
  • Signal và các ứng dụng Apple được nhắc đến như ngoại lệ, còn nhiều ứng dụng khác dần dần khiến người dùng xa rời dữ liệu của chính mình
  • Bài viết của Ed Zitron chỉ trích rằng các nền tảng đang bào mòn trải nghiệm người dùng bằng trình theo dõi quảng cáo, quảng cáo video, yêu cầu bật thông báo và nhiều thứ khác để tăng trưởng và kiếm tiền
  • Thị trường không muốn trả tiền trực tiếp cho chat hay mạng xã hội, trong khi chi phí vận hành các dịch vụ này rất lớn, nên dữ liệu người dùng dễ bị xem là đối tượng để kiếm tiền

Nền tảng vững chắc mang tên Private Cloud Compute

  • Apple Intelligence chạy trên thiết bị khi có thể, và Apple cũng tiến hành nghiên cứu để chạy các mô hình ngôn ngữ lớn và mô hình AI trên thiết bị
  • Các phép tính được xử lý trên thiết bị, hoặc trên phần cứng mà người dùng có thể thấy, mạnh hơn rất nhiều về mặt quyền riêng tư so với cách bao gồm yêu cầu ra bên ngoài
  • Tại WWDC, Apple tuyên bố Private Cloud Compute cung cấp bảo đảm quyền riêng tư ngang bằng hoặc mạnh hơn tính toán cục bộ trên thiết bị ngay cả với các yêu cầu qua mạng
  • Xét theo kinh nghiệm vận hành dịch vụ web thông thường, Private Cloud Compute phải đồng thời đáp ứng những điều kiện rất khắt khe
    • Dữ liệu người dùng chỉ được dùng để xử lý yêu cầu rồi bị xóa sau đó
    • Hạ tầng cân bằng tải không biết ai đã gửi yêu cầu và yêu cầu được chuyển tới máy chủ nào
    • Nhà nghiên cứu có thể kiểm tra, xác minh hệ thống và mô phỏng trên laptop
    • Nhân viên SRE của Apple không có quyền truy cập đặc quyền vào các node Private Cloud Compute, và việc ghi log được tối thiểu hóa ở cấp trình biên dịch
    • Kẻ tấn công không thể xác định một cách ổn định node nào đang xử lý yêu cầu của một người dùng cụ thể

Hai mặt của mô hình bảo mật công khai và tính khép kín

  • Tài liệu kỹ thuật của Apple được xem là một trường hợp hiếm hoi khi một đội ngũ sản phẩm AI công bố mô hình bảo mật nhất quán
  • Trong quá trình lắp ráp phần cứng, từng giai đoạn đều được chụp X-quang và so sánh với ảnh chuẩn để ngăn mối đe dọa phần cứng chưa được phê duyệt bị thêm vào bo mạch máy chủ
  • Người dùng có thể dựng bản sao cục bộ của node Private Cloud Compute để thử nghiệm tấn công, và Apple trả thưởng nếu tìm thấy lỗ hổng
  • Việc xác thực phần cứng có sự tham gia của nhân sự từ nhiều bộ phận không liên quan với nhau trong nội bộ Apple
  • Node Private Cloud Compute tự hủy xác thực khi bị ngắt nguồn; công tắc phát hiện xâm nhập khung máy chủ được nối với nguồn chính, nên khi mở máy chủ thì nguồn bị cắt và node bị hủy xác thực
  • Node ID được dùng khi thiết bị gửi yêu cầu tới Private Cloud Compute được ghi lại, và người dùng có thể kiểm tra node mà thiết bị đã dùng có còn ở trạng thái được xác thực hay không
  • Ảnh OS production có thể tải công khai và không được mã hóa
  • Các gói quan trọng của OS được tách thành mã và dữ liệu; không thể trộn mã vào gói dữ liệu hoặc ngược lại
  • Apple công bố mã nguồn phần lõi bảo mật của Private Cloud Compute trên GitHub
  • Hệ thống này gần như là chén thánh của điện toán tin cậy có thể xác minh từ xa, nhưng nếu được cung cấp như một OS cho người tiêu dùng thì nó sẽ là một hệ thống cực kỳ khép kín, chỉ chạy phần mềm được định sẵn mà không có quyền root, trình biên dịch hay trình gỡ lỗi

Những tính năng thực sự xuất hiện vào cuối năm 2024

  • Nhóm tính năng đầu tiên của Apple Intelligence được phát hành vào cuối tháng 10/2024
  • Các tính năng được cung cấp gồm Writing Tools, tóm tắt thông báo, trang web và email, Clean Up để xóa vật thể trong ảnh, tìm kiếm dựa trên nội dung ảnh, tìm kiếm tài liệu trên thiết bị bằng Siri, và Math Notes trong ứng dụng Notes
  • Sau đó, Image Playground và phân loại email được bổ sung
  • Tính năng ngữ cảnh cá nhân được lặp lại trong quảng cáo vẫn chưa được phát hành

Math Notes: tính năng thành công nhất

  • Math Notes được xem là tính năng hài lòng nhất trong Apple Intelligence
  • Khi nhập phép tính dựa trên biến như sau trong ứng dụng Notes, kết quả sẽ tự động được chèn sau dấu bằng cuối cùng
Rent = 2300
FamilySize = 2
Rent / FamilySize =
  • Ví dụ trên sẽ chèn 1150
  • Tính năng này hữu ích cho phép tính cơ bản, dùng biến, và ước tính sơ bộ thu nhập cũng như chi tiêu
  • Đánh giá cho rằng không có phàn nàn gì về Math Notes

Writing Tools: kết quả thay thế hơn là hỗ trợ sáng tạo

  • Writing Tools gần như vô dụng với người dùng có nhiều kinh nghiệm viết, và chỉ cung cấp một phiên bản hơi tệ hơn của kết quả mà họ vốn đã có thể tự tạo tốt hơn
  • Tính năng này tạo cảm giác về tác dụng phụ xấu của các công cụ AI hiện có: không bổ sung cho quá trình sáng tạo mà thay thế
  • Kết quả xuất hiện dưới dạng một khối văn bản mờ đục sau những lựa chọn hạn chế như “làm cho chuyên nghiệp” hay “chuyển thành bảng”, không có lớp hay khả năng tinh chỉnh chi tiết
  • Trên thực tế, khi yêu cầu tóm tắt một đoạn văn, lỗi “Writing Tools Unavailable: Certain capabilities are unavailable at this time. Try again later.” đã xảy ra
  • Tính năng này có thể hữu ích để biến một phát biểu dài khi streaming thành dàn ý làm điểm khởi đầu cho bài viết, nhưng không phù hợp với việc viết thay toàn bộ bài
  • Nó có thể hữu ích hơn với người ít kinh nghiệm tiếng Anh, nhưng với tác giả thì mức độ hữu ích không lớn

Vấn đề của tóm tắt thông báo, tin nhắn và email

  • Bản thân ý tưởng tóm tắt thông báo có vẻ tốt vì giúp lướt qua nhiều thông báo cùng lúc dễ dàng hơn
  • Trong triển khai thực tế, các trường hợp thất bại lộ rõ
  • Tin nhắn lừa đảo có thể bị tóm tắt thành “giao hàng bị chậm do thông tin địa chỉ không đầy đủ”, khiến người dùng cảm thấy cần hành động ngay
  • BBC đưa tin về trường hợp tóm tắt thông báo khiến mọi người nghĩ rằng một nghi phạm đang bị giam đã tự sát
  • Nếu bật Apple Intelligence nhưng chỉ tắt tóm tắt thông báo, thông báo có thể bị trễ tới 5 giây
  • Một phần tính năng tóm tắt không hoạt động trên iPhone, và vì không hữu ích nên chỉ còn được bật trên MacBook để tránh thông báo bị trễ
  • Nhìn chung, nó có độ hoàn thiện kiểu Apple, nhưng vẫn mang cảm giác mới hoàn thành một nửa

Clean Up: công cụ thay đổi tính hiện thực của ảnh

  • Clean Up là tính năng xóa đối tượng không mong muốn khỏi ảnh
  • Với quan điểm xem ảnh là phản ánh thực tại như nó vốn có, và phân biệt giữa việc thay đổi cách thể hiện như chỉnh màu hay cắt ảnh với việc thay đổi nội dung của hình ảnh, tính năng này khó được chấp nhận
  • Trường hợp chỉnh sửa lịch sử khi Nikolai Yezhov bị xóa khỏi ảnh của Stalin được dùng làm ví dụ để giải thích bản chất của Clean Up
  • Công cụ này có thể tạo ra hình ảnh như khoảnh khắc mà người dùng mong muốn, chứ không phải khoảnh khắc đã thực sự xảy ra
  • Vì những lý do triết học như vậy, Clean Up không được sử dụng và không được đánh giá chi tiết hơn

Image Playground: kết quả không giống một sản phẩm Apple

  • Image Playground là tính năng tạo ảnh bằng prompt văn bản và ảnh chân dung, v.v.
  • Ảnh được tạo bằng luồng khuếch tán phức tạp kết hợp Stable Diffusion 1.5, ComfyUI và 11–12 mô hình được nêu như ví dụ về tiêu chuẩn cao
  • Ảnh hoàng hôn tháp truyền hình Đông Berlin tạo bằng Image Playground có thể tạm chấp nhận nếu nhìn lướt trên màn hình điện thoại, nhưng các thời điểm trên bầu trời bị trộn lẫn, còn những đường thẳng của cửa sổ và đài quan sát trông gượng gạo
  • Các ví dụ tốt là kết quả đã được tuyển chọn kỹ, còn phần lớn có thể lệch nặng về hình dạng và ý nghĩa như “taco smoking beer at a party”
  • Khi dùng ảnh của chính mình, kết quả có thể gây khó chịu ở tỷ lệ cơ thể, đôi mắt và các chi tiết khác
  • Việc Apple đưa những kết quả như vậy vào sản phẩm phát hành tạo cảm giác trái ngược với chất lượng và sự tỉ mỉ vốn được kỳ vọng ở Apple
  • Genmoji cũng bị đánh giá là tạo ra kết quả trống rỗng, vô hồn tương tự, nhưng không được phân tích chi tiết vì khó trích xuất từ tin nhắn chat mà vẫn giữ chất lượng
  • Có khả năng các công ty khác dùng mô hình open-weights sẽ tạo ra kết quả tốt hơn, và phía Apple để lại tiếc nuối vì không có công cụ như IntelligenceKit cho phép nhà phát triển tận dụng mô hình một cách sáng tạo

AI tạo sinh không phải sản phẩm, mà là chi tiết triển khai

  • AI tạo sinh tự thân giống một chi tiết triển khai được dùng trong sản phẩm lớn hơn hơn là một sản phẩm
  • Ngay cả khi tạo bức tranh tháp truyền hình Berlin trong 1–2 giây, người dùng cũng không có được chỉnh sửa theo lớp như chỉnh màu bầu trời hay khả năng kiểm soát sáng tạo, mà chỉ nhận một đầu ra cuối cùng duy nhất
  • Những tính năng như vậy có thể dùng cho bài đăng mạng xã hội ít đầu tư, nhưng giống demo công nghệ hơn là sản phẩm; xét ở thời điểm 2025, chúng bị đánh giá là chỉ đáng kinh ngạc nếu đã xuất hiện từ năm 2022
  • Những lĩnh vực AI tạo sinh thực sự hữu ích nằm ở các tác vụ ít hào nhoáng hơn
  • Một trường hợp nghiên cứu dùng AI tạo sinh để phân loại các cảm giác khó mô tả xuất hiện trong trải nghiệm thiền được nhắc đến, với kế hoạch có tin liên quan và công bố bài báo trước tháng 6

Đánh giá cuối cùng: sản phẩm yếu trên nền tảng mạnh

  • Apple Intelligence được đánh giá là sản phẩm thất bại xét từ góc độ triển khai
  • Nền tảng của nó rất mạnh
    • Mọi dữ liệu có thể đều được xử lý trên thiết bị
    • Các tác vụ không thể xử lý trên thiết bị dùng thực hành bảo mật mạnh của Private Cloud Compute
    • Mục tiêu là xử lý riêng tư và mã hóa nhiều nhất có thể
  • Vấn đề là dù đã xây dựng một nền tảng gần như chén thánh của điện toán tin cậy có thể xác minh từ xa, trải nghiệm người dùng cuối lại kém hơn cảm giác tự tạo tích hợp trực tiếp với Ollama trên cùng thiết bị
  • Khi dùng Ollama, có thể chọn mô hình tốt hơn Apple Intelligence rất nhiều, và vì chạy trên cùng thiết bị nên vẫn giữ được quyền riêng tư
  • Cộng đồng mã nguồn mở phải khai thác hiệu năng tối đa từ phần cứng hạn chế, nên có thể tạo ra kết quả bằng tư duy ngang với công nghệ đã cũ và triển khai lên production mà không cần chỉnh sửa
  • Apple Intelligence không phải “chiếc xe đạp cho tâm trí”, mà chỉ cung cấp những cải tiến bên lề giống demo công nghệ, dẫn đến kết quả như thể tiềm năng từng có vẻ vô hạn đã bị lãng phí
  • Ngoại lệ là Math Notes, được đánh giá tích cực đến mức đáng mong có trong các ứng dụng ghi chú khác

Chưa có bình luận nào.

Chưa có bình luận nào.