1 điểm bởi GN⁺ 2024-06-11 | 1 bình luận | Chia sẻ qua WhatsApp
  • Apple đã giới thiệu Apple Intelligence, kết hợp các mô hình tạo sinh với ngữ cảnh cá nhân để đưa khả năng ngôn ngữ, tạo hình ảnh và thực thi tác vụ liên ứng dụng vào trải nghiệm mặc định trên iPhone, iPad và Mac
  • iOS 18, iPadOS 18, macOS Sequoia tích hợp Writing Tools, tính năng ưu tiên và tóm tắt trong Mail, tóm tắt thông báo, cùng khả năng ghi âm·phiên âm·tóm tắt trong Notes và Phone
  • Mảng hình ảnh được mở rộng với Image Playground, Genmoji, tìm kiếm trong Photos·Clean Up·Memories, và có thể được sử dụng trong các ứng dụng của Apple cũng như ứng dụng bên thứ ba áp dụng API
  • Siri được mở rộng để đảm nhiệm nhập văn bản, nhận diện màn hình, hàng trăm tác vụ trong và ngoài ứng dụng, trả lời cách sử dụng thiết bị, và xử lý yêu cầu dựa trên thông tin trên thiết bị
  • Quyền riêng tư đặt trọng tâm vào xử lý trên thiết bị và Private Cloud Compute; ChatGPT được tích hợp dựa trên GPT-4o trong Siri và Writing Tools sau khi có sự cho phép của người dùng, còn bản beta sẽ được cung cấp bằng tiếng Anh Mỹ vào mùa thu này

Cấu trúc cơ bản của Apple Intelligence

  • Apple Intelligence là một hệ thống trí tuệ cá nhân dành cho iPhone, iPad và Mac, kết hợp khả năng của các mô hình tạo sinh với ngữ cảnh cá nhân của người dùng
  • Nó được tích hợp sâu vào iOS 18, iPadOS 18, macOS Sequoia và tận dụng Apple silicon để thực hiện các tác vụ sau
    • Hiểu và tạo ngôn ngữ cũng như hình ảnh
    • Thực thi tác vụ giữa các ứng dụng
    • Đơn giản hóa và tăng tốc công việc hằng ngày dựa trên ngữ cảnh cá nhân
  • Các yêu cầu phức tạp hơn sẽ dùng Private Cloud Compute để điều phối năng lực tính toán cần thiết giữa xử lý trên thiết bị và các mô hình chạy trên máy chủ dùng Apple silicon

Hiểu ngôn ngữ và công cụ viết

  • Writing Tools được tích hợp trên toàn hệ thống và áp dụng ở gần như mọi nơi có thể soạn thảo như Mail, Notes, Pages và ứng dụng bên thứ ba trên iOS 18, iPadOS 18, macOS Sequoia
  • Các tính năng hỗ trợ viết tập trung vào việc tinh chỉnh bản nháp sao cho phù hợp với mục đích và định dạng của bài viết
    • Rewrite: đề xuất nhiều phiên bản của nội dung đã viết và điều chỉnh giọng điệu cho phù hợp với đối tượng và công việc
    • Proofread: kiểm tra ngữ pháp, lựa chọn từ ngữ, cấu trúc câu, đồng thời đưa ra đề xuất chỉnh sửa và giải thích
    • Summarize: tóm tắt văn bản được chọn dưới dạng đoạn văn, gạch đầu dòng chính, bảng hoặc danh sách
  • Mail có thêm Priority Messages để hiển thị email khẩn cấp ở đầu hộp thư đến
    • Có thể xem phần tóm tắt mà không cần mở email
    • Với các chuỗi email dài, chỉ cần chạm một lần để xem chi tiết liên quan
    • Smart Reply gợi ý phản hồi nhanh và nhận diện các câu hỏi trong email để giúp trả lời đầy đủ
  • Thông báo được áp dụng Priority Notifications và tính năng tóm tắt để giảm lượng thông tin phải xử lý trên màn hình khóa
    • Hiển thị các thông báo quan trọng ở đầu chồng thông báo
    • Hiển thị nội dung cốt lõi của thông báo dài hoặc nhiều thông báo dồn lại ngay trên màn hình khóa
    • Focus mới là Reduce Interruptions chỉ hiển thị những thông báo có thể cần được chú ý ngay
  • Trong ứng dụng Notes và Phone, có thể ghi âm·phiên âm·tóm tắt âm thanh
    • Khi bắt đầu ghi âm trong cuộc gọi, những người tham gia sẽ tự động được thông báo
    • Khi cuộc gọi kết thúc, Apple Intelligence sẽ tóm tắt các nội dung chính

Tạo hình ảnh và khả năng biểu đạt

  • Image Playground là tính năng cho phép người dùng tạo hình ảnh chỉ trong vài giây, với ba phong cách là Animation, Illustration và Sketch
  • Có thể dùng trực tiếp trong các ứng dụng như Messages, đồng thời cũng được cung cấp dưới dạng ứng dụng riêng
    • Mọi hình ảnh đều được tạo trên thiết bị
    • Có thể chọn các khái niệm theo danh mục như chủ đề, trang phục, phụ kiện và địa điểm
    • Có thể nhập mô tả để định nghĩa hình ảnh
    • Có thể đưa người trong thư viện ảnh cá nhân vào hình ảnh
  • Trong Messages, hệ thống hiển thị các khái niệm gợi ý được cá nhân hóa theo nội dung cuộc trò chuyện
    • Ví dụ, trong một cuộc trò chuyện nhóm đang lên kế hoạch đi leo núi, các khái niệm liên quan đến bạn bè, điểm đến và hoạt động sẽ được gợi ý
  • Trong Notes, có thể dùng Image Playground qua Image Wand trong bảng công cụ Apple Pencil
    • Có thể biến một bản phác thảo sơ bộ thành hình ảnh
    • Nếu chọn một khoảng trống, hệ thống có thể dùng ngữ cảnh xung quanh để tạo hình ảnh
  • Image Playground cũng có trong Keynote, Freeform và Pages, đồng thời có thể được dùng trong ứng dụng bên thứ ba áp dụng Image Playground API mới

Genmoji và các tính năng của Photos

  • Genmoji là tính năng tạo hình ảnh kiểu emoji mới bằng cách nhập mô tả
    • Khi nhập mô tả, Genmoji cùng các tùy chọn bổ sung sẽ xuất hiện
    • Có thể tạo Genmoji của bạn bè hoặc người thân dựa trên ảnh
    • Có thể thêm trực tiếp vào tin nhắn hoặc chia sẻ dưới dạng sticker, phản hồi Tapback
  • Tìm kiếm trong Photos hỗ trợ ngôn ngữ tự nhiên để tìm các cảnh cụ thể trực tiếp hơn
    • Có thể tìm ảnh cụ thể như “Maya skateboarding in a tie-dye shirt”
    • Tìm kiếm video có thể xác định đúng khoảnh khắc trong clip và chuyển thẳng đến đoạn liên quan
  • Công cụ Clean Up mới sẽ nhận diện và loại bỏ các yếu tố gây xao nhãng trong nền ảnh
    • Được thiết kế để tránh vô tình làm thay đổi chủ thể
  • Trong Memories, khi người dùng nhập mô tả, Apple Intelligence sẽ chọn ảnh và video, xây dựng cốt truyện với các chương theo chủ đề rồi sắp xếp thành một bộ phim
    • Apple Music cũng sẽ gợi ý bài hát phù hợp với kỷ niệm đó
    • Ảnh và video của người dùng được giữ riêng tư trên thiết bị và không được chia sẻ với Apple hay người khác

Những thay đổi của Siri

  • Siri được tích hợp sâu hơn vào trải nghiệm hệ thống nhờ Apple Intelligence
  • Khả năng hiểu ngôn ngữ được tăng cường để vẫn theo kịp khi người dùng nói ngập ngừng và duy trì ngữ cảnh giữa các yêu cầu
  • Người dùng có thể gõ cho Siri và chuyển đổi giữa văn bản với giọng nói tùy tình huống
  • Khi Siri được kích hoạt, một hiệu ứng ánh sáng mới bao quanh mép màn hình sẽ xuất hiện
  • Siri cũng có thể trả lời hàng nghìn câu hỏi về cách sử dụng iPhone, iPad và Mac
    • Lên lịch gửi email trong ứng dụng Mail
    • Xử lý các câu hỏi như chuyển từ Light Mode sang Dark Mode
  • Thông qua nhận diện màn hình, Siri có thể thực hiện tác vụ gắn với thông tin đang hiển thị
    • Có thể thêm một địa chỉ mới nhận trong Messages vào thẻ liên hệ
  • Siri thực hiện hàng trăm tác vụ mới trong và ngoài các ứng dụng của Apple cũng như ứng dụng bên thứ ba
    • Mở một bài viết cụ thể trong Reading List
    • Xử lý các yêu cầu như gửi ảnh buổi barbecue hôm thứ Bảy cho một người cụ thể
  • Siri cũng xử lý các yêu cầu được cá nhân hóa dựa trên thông tin trên thiết bị của người dùng
    • Có thể tìm và phát một podcast được đề xuất ngay cả khi người dùng không nhớ đã thấy nó trong tin nhắn hay email
    • Có thể tìm thông tin chuyến bay và đối chiếu với theo dõi chuyến bay thời gian thực để cho biết giờ đến

Quyền riêng tư và Private Cloud Compute

  • Apple Intelligence được xây dựng trên tiền đề bảo vệ quyền riêng tư của người dùng trong khi vẫn hiểu được ngữ cảnh cá nhân
  • Nhiều mô hình chạy hoàn toàn trên thiết bị
  • Với các yêu cầu phức tạp cần nhiều năng lực xử lý hơn, hệ thống sẽ dùng Private Cloud Compute
    • Chạy các mô hình máy chủ lớn hơn trên máy chủ dùng Apple silicon
    • Được thiết kế để dữ liệu không bị lưu trữ hoặc lộ ra ngoài
  • Các chuyên gia độc lập có thể kiểm tra mã đang chạy trên máy chủ Apple silicon để xác minh cơ chế bảo vệ quyền riêng tư
  • Private Cloud Compute bảo đảm bằng mật mã rằng iPhone, iPad và Mac chỉ giao tiếp với các máy chủ đang chạy phần mềm được ghi nhận công khai và có thể kiểm tra

Tích hợp ChatGPT

  • Apple tích hợp quyền truy cập ChatGPT vào trải nghiệm iOS 18, iPadOS 18 và macOS Sequoia
  • Người dùng có thể sử dụng kiến thức chuyên môn, khả năng hiểu hình ảnh và hiểu tài liệu của ChatGPT mà không cần chuyển sang công cụ riêng
  • Siri có thể dùng ChatGPT khi thấy phù hợp
    • Siri sẽ xin phép người dùng trước khi gửi câu hỏi, tài liệu hoặc ảnh sang ChatGPT
    • Sau khi được cho phép, Siri sẽ hiển thị câu trả lời trực tiếp
  • ChatGPT cũng có mặt trong Writing Tools trên toàn hệ thống
    • Có thể tạo nội dung đang viết thông qua Compose
    • Có thể tạo hình ảnh theo nhiều phong cách bằng công cụ hình ảnh của ChatGPT để bổ trợ cho bài viết
  • Việc sử dụng ChatGPT đi kèm các biện pháp bảo vệ quyền riêng tư
    • Địa chỉ IP được che giấu
    • OpenAI không lưu trữ các yêu cầu
    • Nếu người dùng liên kết tài khoản, chính sách sử dụng dữ liệu của ChatGPT sẽ được áp dụng
  • Tích hợp ChatGPT sẽ có mặt trên iOS 18, iPadOS 18 và macOS Sequoia vào cuối năm nay, dựa trên GPT-4o
    • Có thể truy cập miễn phí mà không cần tạo tài khoản
    • Người đăng ký ChatGPT có thể liên kết tài khoản để dùng các tính năng trả phí

Thời gian phát hành và thiết bị hỗ trợ

  • Apple Intelligence được cung cấp miễn phí cho người dùng
  • Vào mùa thu này, tính năng sẽ được cung cấp dưới dạng beta trên iOS 18, iPadOS 18macOS Sequoia, với ngôn ngữ ban đầu là tiếng Anh Mỹ
  • Một số tính năng, nền tảng phần mềm và ngôn ngữ bổ sung sẽ được cung cấp dần trong năm tiếp theo
  • Các thiết bị được hỗ trợ gồm
    • iPhone 15 Pro
    • iPhone 15 Pro Max
    • iPad và Mac trang bị chip M1 trở lên
  • Để sử dụng, Siri và ngôn ngữ thiết bị phải được đặt thành tiếng Anh Mỹ
  • Thông tin thêm có tại apple.com/apple-intelligence

1 bình luận

 
GN⁺ 2024-06-11
Ý kiến trên Hacker News
  • Những tính năng AI cá nhân mà Apple trình diễn hôm nay thực sự rất ấn tượng
    Điều đó cho thấy sức mạnh thực sự của AI cho người tiêu dùng nằm trong tay các chủ sở hữu nền tảng vốn đã nắm phần lớn đời sống số như tin nhắn, email, ảnh và ứng dụng, tức Apple hay Google, hoặc Microsoft ở mảng công việc/lối sống
    Cách Siri có thể thực hiện các tác vụ như lịch, đặt chỗ, kiểm tra chuyến bay dựa trên ngữ cảnh từ email và tin nhắn trông thực sự hữu ích. Tôi từng nghĩ các tính năng trí tuệ cá nhân rồi sẽ xuất hiện, nhưng không ngờ Apple lại đẩy mạnh đến vậy, và hiệu ứng kéo người dùng vào hệ sinh thái là rất lớn
    Việc họ cũng tính đến private cloud, tích hợp ChatGPT, sân chơi tạo ảnh và cả Genmoji cũng rất hay, và câu “dành cho tất cả chúng ta” mà Craig nói nghe có vẻ có thể thành hiện thực. Tuy nhiên, việc tạo ảnh người thật thì quá gần với thung lũng kỳ lạ, nên nếu nhận một tấm ảnh chúc mừng sinh nhật kiểu lạnh lẽo và hời hợt như vậy thì chắc tôi cũng không vui

    • Đây là lợi thế của cách Apple xử lý quyền sở hữu sản phẩm, và nó tương phản với Google hay Microsoft
      Sự hội tụ của AI có lẽ sẽ phơi bày những khiếm khuyết về tổ chức còn rõ ràng hơn nhiều so với các làn sóng công nghệ trước. Không ai muốn một AI tạo sinh chỉ hoạt động trong Gmail, rồi một AI khác chỉ hoạt động trong Messages; người ta muốn một tính năng nền tảng hoạt động ở mọi nơi có nhập văn bản
      Hiện tại tôi không chắc Google hay Microsoft có thể cung cấp điều đó về mặt tổ chức hay không
    • Vẫn còn quá sớm để kết luận, và không nên quá dễ dàng bị marketing thuyết phục
    • Apple Intelligence có vẻ sẽ rất thành công. iOS rõ ràng là nền tảng phù hợp để kết hợp trải nghiệm người dùng tốt với AI, và việc gắn mô hình ngôn ngữ lớn vào Siri cho đội Siri cơ hội nhanh chóng chuộc lại những lỗi lầm trong quá khứ
      Private computing cũng có vẻ cực kỳ quan trọng. Ngoài trường hợp hiển nhiên là xử lý các tác vụ nặng trên máy chủ đám mây, nó còn có thể mở đường cho một trình thông dịch mã cá nhân, tức khả năng scripting đúng nghĩa trên iOS và về lâu dài là cho phép phát triển trên iPadOS
      Việc Apple dùng chip tự thiết kế cả trên máy chủ cũng rất quan trọng. Câu hỏi đúng không phải là “đã đủ chưa”, mà là họ sẽ làm gì ở phía nhà phát triển và phần cứng để nâng lên mức NVIDIA
      Có vẻ mọi người vẫn chưa hiểu bức tranh lớn này vì chỉ nhìn vào việc Apple có nên lao vào cuộc đua mô hình tiên tiến nhất hay không. Giờ thì tôi hiểu các tiêu đề nói Nadella lo ngại về quan hệ đối tác giữa Apple và OpenAI
    • Phần lớn những gì được trình diễn là ấn tượng, và nó trông như đang thực sự hiện thực hóa lời hứa về một trợ lý số cá nhân mà các thiết bị điện toán cá nhân đã quảng bá suốt hàng chục năm
      Câu hỏi quan trọng nhất là độ tin cậy. Liệu nó có hoạt động đúng mọi lần không, hay có khả năng hiểu sai nghiêm trọng nội dung rồi khiến người dùng tin tưởng giao việc rơi vào tình huống khó xử
    • Trong bối cảnh xử lý bên ngoài thiết bị, cũng cần lưu ý rằng phạm vi và ảnh hưởng của luật giám sát tại Mỹ gần đây đã được mở rộng
      https://www.theguardian.com/us-news/2024/apr/16/house-fisa-g...
  • Ngoài tìm kiếm và cải thiện Siri, tôi không chắc các tính năng tạo sinh mà Apple đề xuất ở đây sẽ hữu ích đến mức nào
    Nếu ai đó dành một tiếng để vẽ tranh gửi mừng sinh nhật cho một người, thì phần lớn giá trị mà người nhận cảm thấy không nằm ở chất lượng bức tranh, mà ở chỗ đó là một kết quả độc nhất được tạo riêng cho họ bằng chính công sức và thời gian bỏ ra. Cảm giác thỏa mãn khi dùng thứ mình tự làm cũng tương tự như sự khác biệt giữa dùng đồ tự làm và đồ mua sẵn
    Một hình ảnh AI mà Tania tạo ra trong vài giây ban đầu có thể vui, nhưng rồi sẽ nhanh chóng thành spam lấp đầy màn hình trò chuyện và có lẽ không bổ sung thêm điều gì. Việc tự nghĩ ra truyện đi ngủ mà con mình là nhân vật chính cũng vậy
    Trong một thế giới mà cái gì cũng có thể có được, giá trị của mọi thứ sẽ về 0

    • Tôi đã cùng con xây dựng một thế giới truyện khá tinh vi và nhiều chi tiết, luôn bắt đầu theo cùng một cách và có cả những nhân vật quen thuộc
      Hôm qua khi đang lái xe đi mua burrito, tôi đọc cho gpt-4o ghi lại các ý chính chi tiết, bao gồm toàn bộ phần mở đầu của câu chuyện, rồi yêu cầu nó kể một cuộc phiêu lưu mới dựa trên ngữ cảnh đó, và nó làm rất tốt. Tôi có thể nhìn phản ứng của con qua gương chiếu hậu, và nó không phá hỏng những gì chúng tôi đã xây dựng. Ngược lại, nó còn cho tôi những ý tưởng mới để dùng khi tự kể chuyện
      Nếu chỉ trông chờ vào AI tạo sinh mà không có đóng góp cá nhân và sáng tạo của riêng mình thì khó có kết quả thú vị, nhưng nếu đặt AI tạo sinh lên trên những gì bạn đã liên tục tạo dựng và tích lũy thì có thể cho ra kết quả rất xuất sắc
      Theo nghĩa đó, AI tạo sinh giống như có thêm một bộ tổng hợp âm thanh sau khi trước đây chỉ dùng piano hay organ, tức là một công cụ nữa mà bạn càng luyện tập sẽ càng dùng tốt hơn
    • Điều tương tự cũng có thể nói về việc gửi tin nhắn chúc mừng sinh nhật so với gửi thư hoặc thiệp viết tay
      Hiện giờ chẳng có gì ngăn bạn gửi thiệp viết tay cả, và dĩ nhiên nó được trân trọng hơn, nhưng mọi người cũng vẫn biết ơn khi nhận tin nhắn. Điều đó càng đúng khi ở xa nhau hoặc khi mối quan hệ không quá sâu đậm
    • Giá trị của món quà không chỉ phụ thuộc vào công sức hay tiền bạc đã bỏ ra. Nếu bạn chọn được thứ hay, thì việc chọn đúng tự nó cũng có giá trị
      Khi việc tặng quà trở nên dễ hơn, ngữ cảnh sẽ càng quan trọng hơn
    • Tôi nghĩ logic tương tự cũng áp dụng cho trường hợp mua thiệp ở Hallmark
    • Với tư cách là người từng nhận cả đống ảnh chào “chào buổi sáng” mỗi ngày từ những người thân yêu, tôi thực sự đồng cảm với cảm giác này
      Sẽ rất thú vị khi xem liệu spam AI, đặc biệt là emoji và sticker tùy biến, có được tái sử dụng hay sẽ bị rải khắp nơi như nhựa dùng một lần
  • Bản demo trông giống hình ảnh về AI mà người ta từng tưởng tượng trước khi ChatGPT xuất hiện. Đó là cách tương tác được cá nhân hóa, hiểu ngữ cảnh và tích hợp sâu vào toàn bộ hệ thống
    Phần giải thích rằng các tác vụ AI cần máy chủ vẫn cố giữ yêu cầu riêng tư tối đa cũng khá hay. Nếu chạy trên phần cứng Apple và phần mềm máy chủ có thể kiểm toán thì có lẽ gần như là phương án tốt nhất cho những tác vụ như vậy, và sẽ còn tốt hơn nữa nếu là mã nguồn mở
    Bản demo Siri hiểu ngữ cảnh về “mẹ” dựa trên nội dung email mẹ gửi đúng là kiểu cảnh mà chúng ta từng hình dung trong thế giới AI. Khả năng AI thuần túy của chính mô hình rồi có lẽ một ngày nào đó sẽ trở nên phổ biến, và giờ điều quan trọng là phần cứng và sự tích hợp trên toàn bộ hệ thống để tận dụng mô hình đó
    Trải nghiệm thực tế sau khi phát hành là chuyện khác, nhưng chỉ riêng tầm nhìn đã rất ấn tượng, và Apple một lần nữa cho thấy họ hiểu trải nghiệm người dùng. Hàm ý của công bố này có thể lớn hơn nhiều so với bề ngoài, và đặc biệt đáng kỳ vọng ở khả năng giúp việc sử dụng máy tính trở nên dễ dàng hơn cho người lớn tuổi

    • Chưa ai biết các tính năng này tốt đến đâu cho tới khi rơi vào tay reviewer
      Demo kiểu AI có thể “làm đủ mọi thứ” thì rất dễ dựng cho đẹp, nhưng nếu thường xuyên sụp đổ ngoài đời thực thì rốt cuộc sẽ thành Siri hiện tại. Cần nhớ quảng cáo này từ 12 năm trước: https://www.youtube.com/watch?v=sw1iwC7Zh24
      Trong số những điều khi đó đã hứa hẹn, đến giờ vẫn còn nhiều thứ khó mà yên tâm giao cho Siri
    • Có vẻ quá nhiều người mặc định rằng vì ChatGPT là giao diện hội thoại nên AI cũng phải được thiết kế như vậy. Điều đó cũng giống như cho rằng máy tính lúc nào cũng phải là dòng lệnh
      Apple đã cung cấp các giao diện đồ họa theo mục đích cho tính năng AI khá tốt, và sẽ rất thú vị khi xem nó tiếp tục đi sâu hơn trong tương lai
    • Thành thật mà nói, những tính năng kiểu Siri hiểu nội dung về mẹ trong email đều khiến tôi thấy quá rợn người
    • Nếu tính năng này hoạt động như lúc trình diễn, nó sẽ kéo mọi người vào sâu hơn trong hệ sinh thái
      Bạn sẽ bắt đầu muốn nó hiểu cuộc sống của mình, và mọi thiết bị đều phải có khả năng tạo nên ngữ cảnh của bạn thì mới trả lời được các sự kiện hay đủ loại câu hỏi, nên có thể sẽ dẫn tới suy nghĩ kiểu “để Siri biết cả chương trình mình đang xem thì có nên mua Apple TV thay vì Chromecast không”
    • Cuối cùng thì có vẻ nó sẽ làm hào lũy lớn hơn nữa và khiến việc bị khóa vào nền tảng trở nên đau đớn hơn, điều đó khiến tôi không thích
      Giá iPhone vẫn đang tiếp tục tăng, và năng lực tính toán cao sau khi đã lún sâu vào hệ sinh thái này có thể thực sự mang cảm giác như bị moi tiền. Vì rời khỏi thế giới Apple sẽ gần như là bất khả thi
      Các đối thủ cũng không có hệ thống tích hợp chặt như vậy, nên sẽ khó mà tích hợp mọi thứ ở cùng mức độ
  • Xét về mặt xây dựng thương hiệu thì hoàn hảo. Một thứ “trông nhỏ bé” như các chữ cái trong tên công ty có thể tạo ảnh hưởng lớn sau hàng chục năm
    Họ có thể lái AI == Apple Intelligence, và câu “AI for the rest of us” ở cuối đã bắt trúng khoảnh khắc này rất tốt, đồng thời dường như gợi ý Apple sẽ đi về đâu
    Có vẻ Apple sẽ tích lũy chuyên môn để xử lý quy mô khổng lồ nơi những người dùng phổ thông hơn dùng nó cho các hình ảnh sáng tạo hoặc hài hước, emoji, công việc liên quan đến văn bản và cải thiện chất lượng cuộc sống. Dù họ không đứng ngay tuyến đầu để tích hợp tức thì các công nghệ AI mới nhất vào tính năng cho người dùng, nhưng để hỗ trợ quy mô rất đặc thù này thì họ vẫn phải tiến rất gần tới tuyến đầu của chính công nghệ đó
    WWDC lần này rất ấn tượng, còn việc không có tin tức về Mac Studio, Mac Pro, M3 Ultra, M4 Ultra hay M3/M4 Extreme thì khá đáng tò mò. Tôi từng đoán họ sẽ dùng M2 Ultra tự phát triển chẳng hạn cho năng lực điện toán đám mây, và việc điều đó thực sự được nhắc tới khá thú vị; không biết rồi sẽ có thêm chi tiết theo hướng này hay không

    • Theo tôi, công bố lớn nhất là đám mây tính toán riêng tư dựa trên Apple Silicon. Apple đang xây dựng năng lực chuyên môn nội bộ để nhắm tới NVIDIA
    • Điều Apple làm ở đây rất thông minh nhưng cũng có thể gây nhầm lẫn
      Một mặt có cảm giác như họ đang nói “chúng tôi sở hữu cái này”, nhưng mặt khác lại đang chồng thêm một thương hiệu nằm ngoài tầm kiểm soát. Chỉ mong mọi người đừng viết tắt thành ApI, nếu không kết quả tìm kiếm API sẽ bị ô nhiễm mất
    • Có cảm giác như họ đã rải vụn bánh mì cho các công bố phần cứng tương lai. Ví dụ kiểu như “chúng tôi rất vui được công bố M4 Ultra, bộ xử lý hiện đại mạnh mẽ đã được dùng trong đám mây AI riêng tư từ trước tới nay”
    • Không thể dùng chữ cái đầu của sản phẩm, cũng chẳng thể tìm kiếm được, đúng là một nước đi rất khôn. Apple lại làm được rồi
  • Tôi vẫn hoài nghi cho tới khi thấy nó thực sự hoạt động
    Một mặt Apple có thành tích tốt về quyền riêng tư và xử lý trên thiết bị, nhưng trong công bố lần này có quá nhiều điểm mơ hồ. Không rõ tiêu chí nào quyết định chạy trên đám mây, mô hình cá nhân sẽ được dùng như thế nào giữa nhiều thiết bị, liệu điều đó có nghĩa là nó tạm thời chuyển lên đám mây hay không, và trong chế độ khách thì khác đi thế nào
    Ngay cả cách nói “OpenAI không lưu các yêu cầu” cũng cho cảm giác cố tình mập mờ. Tôi từng kỳ vọng một hướng tiếp cận như học liên kết, tận dụng nhiều thiết bị Apple cùng xử lý yêu cầu, nhưng có vẻ lưỡi dao cạo Occam đã thắng, nên cứ chờ xem vậy

    • Apple cũng có tiền sử lâu năm kiểu “bạn đang cầm sai rồi”. Tôi không mong một trợ lý AI kỳ diệu, mà mong một thứ gì đó thỉnh thoảng đoán đúng ý người dùng
    • Công bằng mà nói thì đây là keynote, và chi tiết sẽ được công bố trong các session
    • Họ đã lặp đi lặp lại câu “chúng tôi có thành tích tốt về quyền riêng tư” nhiều tới mức biến nó thành sự thật
    • Có vẻ trong vài tháng tới vẫn còn rất nhiều việc phải làm, và một số tính năng có thể sẽ bị lùi lại
      Rồi chúng ta sẽ thấy trong bản beta Apple hiện thực hóa những gì họ nói ra sao, nhưng tôi sẽ tránh xa beta. Hơi tiếc một chút, nhưng lúc này sự mơ hồ đang có lợi cho Apple. Hứa ít làm nhiều vẫn tốt hơn là hứa quá rồi cung cấp ít
    • Họ nên cung cấp cơ chế để người dùng có thể xem dữ liệu nào đang được tải lên
  • Nếu tôi hiểu đúng thì có ba loại: 1) AI trên thiết bị, 2) AI dùng máy chủ của Apple, 3) AI dùng dịch vụ ChatGPT/OpenAI hoặc các dịch vụ khác trong tương lai
    Có vẻ như loại 1 sẽ chuyển sang loại 2 nếu bị đánh giá là cần thêm năng lực xử lý, còn loại 3 chỉ được gọi khi có sự cho phép rõ ràng từ người dùng
    Như đã chỉ ra bên dưới, các nhà cung cấp khác cũng dự kiến sẽ được bổ sung sau này

    • Tôi cho rằng về thực chất không có khác biệt giữa loại 2 và loại 3. Một khi dữ liệu đã rời khỏi thiết bị thì là đã rời đi rồi, không thể lấy lại hay kiểm soát được nữa
    • Có vẻ giai đoạn 3 cũng sẽ hỗ trợ các mô hình và nhà cung cấp khác sau này
      Sẽ rất tốt nếu nó hỗ trợ mọi máy chủ có API chuẩn đơn giản, để có thể chạy Llama 3 tự host hoặc thứ gì đó sẽ xuất hiện trong 6~12 tháng tới
    • Loại 3 nghe như được thiết kế cho các mục đích không mang tính cá nhân. Về cơ bản nó là chức năng kiểu công cụ tìm kiếm
      Có vẻ phù hợp khi muốn tra cứu thống kê thể thao hay thông tin, phim ảnh và thông tin liên quan
    • Vấn đề là Apple không nói rõ khi nào loại 1 có thể chuyển sang loại 2, và liệu có thể tắt hoàn toàn việc đó hay không
      Theo những gì tôi biết, loại 1 cũng có thể chuyển sang loại 2 khi chính phủ yêu cầu dữ liệu cá nhân hoặc khi mô hình quảng cáo của Apple cần chi tiết nhạy cảm để cá nhân hóa
    • Tôi cũng hiểu như vậy. Tôi mong họ làm rõ hơn ranh giới giữa loại 1 và loại 2, nhưng khi thiết bị thực sự đến tay người dùng thì các YouTuber chắc sẽ sớm đào sâu vào chuyện này
  • Như tôi đã nói ở chủ đề khác, việc có cả tạo ảnh và việc nó nhận được nhiều sự chú ý như vậy khá khiến tôi khó chịu
    Nếu mọi người tin vào thông tin quan trọng mà không kiểm tra nguồn, ví dụ như thông tin chuyến bay, thì có thể dẫn đến tình huống xấu, nên tôi lo về độ tin cậy
    Dù vậy, mức độ hoàn thiện và tính hữu ích thực tế của các tính năng vẫn rất đáng quan tâm. Có thể không phải thứ hào nhoáng nhất, nhưng những gì họ trình diễn đều thực sự hữu ích. Tôi cũng thích việc ChatGPT chỉ là tùy chọn khi Siri thấy nó hữu ích
    Câu hỏi lớn nhất là có thể tắt các thành phần trực tuyến hay không, và điều gì sẽ xảy ra khi không thể xử lý cục bộ. Với lời giải thích rằng máy chủ dùng cùng loại chip, tôi cũng tò mò liệu là vì mô hình không chạy được cục bộ hay vì vấn đề ngữ cảnh
    Cũng chưa rõ là theo cấp độ toàn bộ tính năng hay theo từng yêu cầu riêng lẻ, và điều đó cũng có thể có nghĩa là theo thời gian, mức xử lý cục bộ và đám mây sẽ khác nhau tùy phần cứng

    • Liên quan đến tạo ảnh, có vẻ Image Playground hỗ trợ ba phong cách: Animation, Illustration, Sketch
      Có một thứ bị thiếu. Không có phong cách ảnh thật
      Có vẻ đây là một lựa chọn đúng đắn. Tôi không hẳn thích việc biến mọi thứ thành hoạt hình bằng thêm nhiều meme và emoji hơn, nhưng ít nhất nó rõ ràng là nội dung bịa dựng và thiên về phía “vui vẻ”. Trẻ em sẽ thích, và người lớn cũng có thể thích
      Vẫn sẽ có tranh cãi vì mọi người có thể tạo ra những thứ rất không phù hợp, nhưng mức độ rủi ro sẽ thấp hơn
    • Có vẻ nó hiển thị cả ngữ cảnh về nơi thông tin đến từ đâu, như tin nhắn, sự kiện và các tài liệu khác
      Vì vậy có thể nhanh chóng kiểm tra xem câu trả lời có đúng không. Nó giống tìm kiếm theo ngữ nghĩa hơn, nhưng giải thích kết quả bằng văn bản linh hoạt hơn
    • Tôi cho rằng theo thời gian, khả năng cao mức xử lý cục bộ và đám mây sẽ khác nhau giữa các thiết bị
      Apple có lẽ thêm máy chủ như một giải pháp tạm thời vì nhu cầu, nhưng trạng thái lý tưởng sẽ là đến lúc tất cả thiết bị họ bán đều có thể chạy mọi thứ cục bộ trong thời gian đủ dài, để rồi họ có thể tắt máy chủ
    • Trong 2 năm tới, khi Apple còn đang tìm cách kiểm soát, tôi lo rằng thanh thiếu niên sẽ có khả năng vô tận để lách các rào chắn và tạo ra những hình ảnh có thể không phù hợp ở trường học
    • Apple đã giấu đi lối thoát này. Đầu tiên nó chỉ có bằng tiếng Anh Mỹ, rồi trong vòng một năm sau mới mở rộng sang khu vực khác
      Điều này có thể sẽ không bao giờ đến. Các mô hình ngôn ngữ lớn thất bại rất nhanh khi rời xa các ngôn ngữ giàu tài nguyên
  • Cái này trông thực sự rất tuyệt
    Họ nói mô hình có thể mở rộng lên private cloud compute dựa trên Apple Silicon, và thiết bị của người dùng sẽ xác nhận việc chạy “publicly verifiable software” để ngăn lạm dụng dữ liệu
    Tôi tò mò liệu mã phía máy chủ có được open source hay không. Nếu vậy thì sẽ là một bất ngờ tích cực. Tôi cũng tò mò xem nó sẽ phát triển thế nào
    Nếu nó hoạt động đúng như quảng bá thì đúng kiểu “im đi và lấy tiền của tôi”. Có vẻ Siri cuối cùng đang trở thành thứ mà nó lẽ ra phải là, và tôi cũng tò mò liệu họ có đang đặt nó lên trên danh mục Shortcuts Actions để mở rộng phạm vi những việc có thể làm ngay từ đầu hay không
    Tính năng tạo ảnh và emoji được tích hợp vào Apple Photos và các phần khác của hệ thống cũng trông rất tuyệt. Có vẻ Mac/iPad cần M1 trở lên, còn iPhone thì cần 15 Pro

    • Không nhất thiết phải mua thiết bị mới. Vì nó tương thích ngược với A17 Pro và M1, M2, M3, M4
      Việc tích hợp dịch vụ có cảm giác như dùng các mô hình hiện có và mở rộng API vốn tiếp nối từ AppleScript sang mô hình ngôn ngữ lớn hoặc các hệ thống kiểu Stable Diffusion. Tuy vậy có vẻ họ muốn đẩy M4 càng sớm càng tốt vì game và định hướng đám mây
    • Nói cho ai đang tò mò thì thực sự có tích hợp ChatGPT
      Nếu mô hình trên thiết bị đánh giá rằng “cái này ChatGPT có thể trả lời tốt hơn”, nó sẽ hỏi người dùng có muốn dùng hay không. Theo mô tả thì theo thời gian có vẻ đây là cấu trúc có thể cắm thêm các mô hình khác
      Đặc biệt, ChatGPT 4o có thể được dùng miễn phí mà không cần tạo tài khoản OpenAI
    • Phần này làm tôi thực sự tò mò. Họ gói nó theo kiểu “chạy mô hình ngôn ngữ lớn trên đám mây”, nhưng với tôi nó lại giống như đang che đi phần cốt lõi
      Thông thường điều đó có nghĩa là client có thể xác minh bằng mật mã đoạn mã đang chạy trên máy chủ hay sao? Nếu đúng vậy thì điều này cực kỳ thú vị và hữu ích cả ngoài mục đích này
    • Việc tích hợp ChatGPT trông giống một lệnh gọi API, nên cái này có vẻ là một lớp điều phối chạy trên Apple Silicon
      Hiện vẫn chưa rõ chính xác thứ gì được tính toán trong “private cloud compute”
  • Phần hỏi “Có được dùng ChatGPT cho việc này không?” tạo cảm giác cực kỳ vụng về và không hề giống Apple
    Đây là cách nói khá cũ, nhưng có cảm giác như Steve Jobs sẽ phải trở mình trong mộ. Thành thật mà nói tôi khá bối rối vì sao điều đó lại cần thiết
    Chẳng lẽ họ không thể tạo ra một sự tích hợp đủ nhất quán? Nếu vậy thì phần còn lại không dựa trên ChatGPT sao? Khác nhau ở điểm nào? Từ góc nhìn người dùng thì khá rối rắm

    • Tôi cho rằng đó là lựa chọn thông minh và thực tế nhất trong toàn bộ buổi công bố
      Trở thành bên giỏi nhất về AI chạy trên thiết bị là một cơ hội thị trường cực lớn. Cố làm mọi thứ một mình thì ngớ ngẩn chẳng khác nào phát hành Safari mà không có thỏa thuận tích hợp với trang chủ tìm kiếm của Google
      Apple có thể tập trung vào thế mạnh của mình là xử lý trên thiết bị và đưa AI hòa vào trải nghiệm người dùng trên toàn bộ nền tảng mà không làm tổn hại quyền riêng tư. Còn với những lĩnh vực buộc phải gửi dữ liệu ra ngoài để dùng các cụm máy chủ quy mô lớn và truy cập Internet, như truy vấn tìm kiếm bằng AI, thì có thể tận dụng đơn vị dẫn đầu thị trường
    • Từ góc nhìn người dùng thì rõ ràng 100%
      Nếu hệ thống không nói rằng “tôi sẽ gọi cho một người bạn để lấy câu trả lời”, thì điều đó có nghĩa là mọi thứ đều 100% cục bộ hoặc, trong trường hợp xấu nhất, vẫn nằm hoàn toàn trong Apple Intelligence với cơ chế kiểm toán riêng tư đầy đủ
      Nếu bạn hỏi công thức làm bánh mì chuối thì để chuyển sang ChatGPT cũng không sao, nhưng với thông tin cá nhân hơn thì có thể là không
    • Đây là ranh giới rõ ràng giữa “dữ liệu của tôi ở trên thiết bị của tôi hoặc trong hệ sinh thái Apple” và “dữ liệu của tôi rời khỏi Apple để đến bên thứ ba”
    • Trọng tâm trong mọi thứ Apple công bố là quyền riêng tư. Ý chính là phần lớn câu hỏi sẽ được trả lời cục bộ hoặc qua hệ thống Private Compute
      Cụ thể hơn, với câu hỏi “OpenAI có nhìn thấy dữ liệu cá nhân hoặc câu hỏi của tôi không?”, câu trả lời là “mọi thứ đều được xử lý trên iPhone hoặc Private Compute trừ khi bạn cho phép nói chuyện với OpenAI”
    • Apple đang nhấn mạnh tính trung tâm của quyền riêng tư trong các tác vụ AI, và ngay khoảnh khắc chuyển sang ChatGPT thì luồng đó bị phá vỡ
      Thực ra, nếu không có lời nhắc xác nhận đó để ngắt mạch và nói rõ khi nào hệ thống lấy kết quả từ ChatGPT, thì tôi đã ngần ngại khi dùng các tính năng AI mới
  • Cái này trông thật sự rất tuyệt
    Họ nói mô hình có thể mở rộng sang private cloud compute dựa trên Apple Silicon, và thiết bị của người dùng sẽ xác minh việc chạy “publicly verifiable software” để ngăn việc lạm dụng dữ liệu
    Tôi tò mò không biết mã phía máy chủ có được mã nguồn mở hay không. Nếu có thì sẽ là một bất ngờ tích cực. Tôi rất muốn xem nó sẽ phát triển thế nào
    Nếu nó hoạt động đúng như quảng bá thì đúng kiểu “im đi và cầm lấy tiền của tôi”. Có vẻ Siri cuối cùng cũng đang trở thành thứ đáng lẽ nó phải là, và tôi cũng tò mò liệu họ có xây nó trên danh mục Shortcuts Actions để mở rộng ngay từ đầu phạm vi những việc có thể làm hay không
    Tính năng tạo ảnh và emoji được tích hợp vào Apple Photos và các phần khác của hệ thống cũng trông rất hay. Có vẻ Mac/iPad sẽ cần M1 trở lên, còn iPhone thì cần 15 Pro

    • Họ nói mã phía máy chủ sẽ không mã nguồn mở, nhưng sẽ được cung cấp để các chuyên gia độc lập có thể kiểm toán
    • Apple nói rất rõ rằng iPhone cần 15 Pro trở lên, còn các thiết bị khác cần M1 trở lên