3 điểm bởi GN⁺ 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Apple Intelligence được áp dụng cho VoiceOver, Magnifier, Voice Control và Accessibility Reader, tăng cường mô tả hình ảnh, điều hướng bằng ngôn ngữ tự nhiên và hỗ trợ đọc
  • VoiceOver và Magnifier có thể dùng Image Explorer và Live Recognition để hỏi đáp về nội dung trên màn hình camera, nhưng không nên phụ thuộc vào chúng trong các tình huống rủi ro cao
  • Voice Control hỗ trợ điều hướng iPhone và iPad bằng các lệnh ngôn ngữ tự nhiên như “tap the purple folder” thay vì phải dùng nhãn hoặc số chính xác
  • Với video không có phụ đề, phụ đề tạo sinh trên thiết bị sẽ tự động hiển thị và dự kiến có mặt trên iPhone, iPad, Mac, Apple TV và Apple Vision Pro
  • Apple Vision Pro có thể điều khiển hệ thống lái thay thế Tolt và LUCI bằng theo dõi mắt, đồng thời Hikawa Grip & Stand cũng sẽ được phát hành toàn cầu

Lịch phát hành và quyền riêng tư

  • Các tính năng mới và các bản cập nhật dựa trên Apple Intelligence dự kiến sẽ được cung cấp vào cuối năm nay
  • Apple cho biết họ vẫn duy trì nguyên tắc privacy by design khi áp dụng Apple Intelligence cho các tính năng trợ năng
  • Hikawa Grip & Stand for iPhone được ra mắt trên Apple Store online với ba màu mới

Khám phá thông tin thị giác với VoiceOver và Magnifier

  • VoiceOverMagnifier mô tả chi tiết hơn thông tin trên màn hình và môi trường xung quanh cho người dùng khiếm thị hoặc thị lực kém
  • Image Explorer trong VoiceOver sử dụng Apple Intelligence để cung cấp mô tả hình ảnh trên toàn hệ thống, bao gồm ảnh, hóa đơn đã quét và hồ sơ cá nhân
  • Với bản cập nhật Live Recognition, người dùng VoiceOver có thể nhấn Action button trên iPhone để đặt câu hỏi và nhận câu trả lời về những gì đang hiện trong khung ngắm camera
  • Người dùng có thể tiếp tục đặt các câu hỏi tiếp theo bằng lời của mình để tìm hiểu thêm thông tin thị giác
  • Magnifier cung cấp cùng các tính năng điều hướng hỗ trợ và mô tả hình ảnh này trong giao diện tương phản cao dành cho người dùng thị lực kém
  • Magnifier cũng tích hợp với Action button, cho phép điều khiển ứng dụng bằng các yêu cầu giọng nói như “zoom in”, “turn on flashlight”
  • Không nên phụ thuộc vào VoiceOver và Magnifier trong các tình huống có thể gây thương tích hoặc tổn hại cho con người, các tình huống rủi ro cao, chỉ đường, hay chẩn đoán hoặc điều trị tình trạng y tế

Nhập liệu ngôn ngữ tự nhiên trong Voice Control

  • Voice Control sử dụng Apple Intelligence để giúp người dùng khuyết tật vận động điều hướng iPhone và iPad trực quan hơn chỉ bằng giọng nói
  • Tính năng nhập linh hoạt mới cho phép thao tác bằng cách mô tả các nút và điều khiển trên màn hình bằng ngôn ngữ tự nhiên thay vì phải nói đúng nhãn hoặc số
  • Cách tiếp cận “say what you see” có thể dùng trong mọi ứng dụng, bao gồm cả các ứng dụng có bố cục trực quan như Apple Maps hoặc Files
  • Ví dụ lệnh như “tap the guide about best restaurants”, “tap the purple folder” cho phép diễn đạt trực tiếp đối tượng đang thấy trên màn hình
  • Tính năng này cũng có thể giúp giảm rào cản khi các phần tử chưa được gắn nhãn phù hợp cho trợ năng
  • Voice Control dựa trên Apple Intelligence sẽ được cung cấp trong môi trường tiếng Anh tại Mỹ, Canada, Anh và Australia

Accessibility Reader và phụ đề tạo sinh

  • Accessibility Reader mang đến trải nghiệm đọc tùy biến cho người dùng có nhiều dạng khuyết tật, từ chứng khó đọc đến thị lực kém
  • Nhờ Apple Intelligence, công cụ này có thể xử lý cả các tài liệu nguồn phức tạp hơn như bài báo khoa học
  • Nó cũng có thể xử lý văn bản có nhiều cột, hình ảnh và bảng biểu
  • Tóm tắt theo yêu cầu cho phép người dùng xem tổng quan tài liệu trước khi đọc chi tiết
  • Bản dịch tích hợp mới cho phép người dùng đọc văn bản bằng ngôn ngữ mẹ đẻ của mình trong khi vẫn giữ nguyên định dạng tùy chỉnh, phông chữ và màu sắc
  • Phụ đề tạo sinh mới sẽ tự động hiển thị bản chép lời âm thanh trong các video không có caption hoặc phụ đề
  • Phạm vi áp dụng gồm các clip quay bằng iPhone, video nhận từ bạn bè và gia đình, cũng như video phát trực tuyến online
  • Phụ đề được tạo riêng tư bằng nhận dạng giọng nói trên thiết bị và sẽ tự động hiển thị cho video không có phụ đề trên iPhone, iPad, Mac, Apple TV và Apple Vision Pro
  • Có thể tùy chỉnh giao diện phụ đề trong menu phát video hoặc Settings
  • Phụ đề tạo sinh dự kiến sẽ được cung cấp trong môi trường tiếng Anh tại Mỹ và Canada

Điều khiển xe lăn điện bằng Apple Vision Pro

  • Một số người dùng xe lăn điện không thể lái bằng joystick, nên các điều khiển lái thay thế có thể là yếu tố thiết yếu cho việc di chuyển độc lập
  • Hệ thống theo dõi mắt chính xác của Apple Vision Pro được dùng làm phương thức nhập có độ phản hồi cao cho các hệ thống lái thay thế tương thích
  • Tính năng theo dõi mắt của Vision Pro không cần hiệu chỉnh lại thường xuyên và hoạt động trong nhiều điều kiện ánh sáng khác nhau
  • Tính năng này sẽ được ra mắt tại Mỹ với các hệ thống lái thay thế ToltLUCI
  • Hỗ trợ phụ kiện bao gồm cả kết nối Bluetooth và có dây; với kết nối có dây, người dùng cần mua Apple Vision Pro Developer Strap
  • Apple sẽ tiếp tục hợp tác với các nhà phát triển để hỗ trợ thêm nhiều hệ thống điều khiển xe lăn hơn
  • Tính năng này và Apple Vision Pro được thiết kế để sử dụng trong môi trường có kiểm soát; thông tin chi tiết có tại support.apple.com/en-us/118507
  • Pat Dolan, người đã sống chung với ALS trong 10 năm, cho biết khả năng tự điều khiển xe lăn điện là điều “quý như vàng” đối với ông

Hikawa Grip & Stand for iPhone

  • Hikawa Grip & Stand for iPhone sẽ được phát hành toàn cầu trên Apple Store online với ba màu mới
  • Đây là một phụ kiện MagSafe do nhà thiết kế Bailey Hikawa ở Los Angeles phát triển với trọng tâm là trợ năng
  • Quá trình phát triển có sự tham gia của những người có nhiều dạng khuyết tật ảnh hưởng đến khả năng cầm nắm, sức lực và di chuyển
  • Đây là một tay cầm kiêm chân đỡ thích ứng, giúp người dùng cầm iPhone theo cách phù hợp nhất với mình
  • Sự hợp tác giữa Hikawa và PopSockets đưa phụ kiện thích ứng này lần đầu tiên đến thị trường toàn cầu
  • Tại Apple The Grove in Los Angeles sẽ có phiên Today at Apple với sự tham gia của Hikawa, Shane Burcaw và Alex Barone
  • Các quốc gia có thể mua gồm Australia, Austria, Belgium, Canada, China, Denmark, France, Hong Kong, Italy, Japan, the Netherlands, Singapore, South Korea, Spain, Sweden, Switzerland, Taiwan, the United Arab Emirates, the UK và the U.S.; có thể mua tại apple.com

Các cập nhật trợ năng khác

  • Vehicle Motion Cues được bổ sung cho visionOS, có thể giúp giảm say xe khi dùng Apple Vision Pro trong lúc là hành khách trên phương tiện đang di chuyển
  • Vision Pro hỗ trợ cử chỉ khuôn mặt để thực hiện thao tác chạm và các hành động hệ thống
  • Vision Pro cũng bổ sung cách mới để chọn phần tử bằng mắt khi dùng Dwell Control
  • Touch Accommodations cung cấp cách mới để cá nhân hóa thiết lập iOS và iPadOS
  • Made for iPhone hearing aids sẽ ghép nối và handoff ổn định hơn giữa các thiết bị Apple trên iOS, iPadOS, macOS và visionOS, đồng thời cải thiện trải nghiệm thiết lập
  • Hỗ trợ Larger Text được thêm vào tvOS để người xem thị lực kém có thể tăng kích thước chữ trên màn hình và đọc dễ hơn
  • Name Recognition cho phép người dùng khiếm thính hoặc khó nghe nhận thông báo khi ai đó gọi tên mình, và hoạt động với hơn 50 ngôn ngữ trên toàn thế giới
  • API mới cho các nhà phát triển ứng dụng phiên dịch ngôn ngữ ký hiệu hỗ trợ người dùng thêm thông dịch viên thật vào cuộc gọi video FaceTime đang diễn ra
  • Có thể kết nối Sony Access controller làm tay cầm chơi game trên iOS, iPadOS và macOS
  • Trên Sony Access controller, người dùng có thể cấu hình thumbstick, 9 nút tích hợp và tối đa 4 nút ngoài hoặc công tắc chuyên dụng để cá nhân hóa bố cục
  • Người dùng có thể kết hợp hai bộ điều khiển để tạo trải nghiệm chơi game được cá nhân hóa sâu hơn

Ngôn ngữ hỗ trợ và giới hạn khu vực

  • Apple Intelligence được cung cấp ở dạng beta, với các ngôn ngữ hỗ trợ gồm English, Danish, Dutch, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish, Turkish, Vietnamese, Chinese (simplified), Chinese (traditional), Japanese và Korean
  • Một số tính năng có thể không khả dụng ở mọi khu vực hoặc ngôn ngữ
  • Có thể xem tình trạng hỗ trợ tính năng và ngôn ngữ, cũng như yêu cầu hệ thống, tại support.apple.com/en-us/121115

1 bình luận

 
Ý kiến trên Hacker News
  • Apple thích lén đưa công nghệ mới vào những chỗ tưởng như bình thường để thử nghiệm công khai một cách kín đáo, nên việc lần đầu tung AI dạng tác nhân dưới dạng tính năng trợ năng nghe rất đúng kiểu Apple
    Touch Bar không chỉ là một thanh OLED đơn thuần mà là bước đi đầu tiên hướng tới quá trình chuyển Mac sang Apple Silicon, và chip Apple T1 trên MacBook Touch Bar 2016 là bộ xử lý đầu tiên do Apple tự thiết kế hoàn toàn xuất hiện trên Mac
    Nó lấy từ chipset Intel các vai trò như quản lý điện năng, quạt, ngủ/đánh thức, quyền truy cập camera và micro, cùng Secure Enclave cho Touch ID; sau đó T2 còn đảm nhiệm cả mã hóa SSD, quản lý âm thanh, xử lý hình ảnh camera và chống can thiệp vào quá trình khởi động
    iPhone 3G đi kèm dụng cụ lấy SIM Liquidmetal, một hợp kim kim loại tùy biến gần như không thể bẻ cong bằng tay; sau đó Apple không ra thêm sản phẩm nào dùng hợp kim này, nhưng gần 20 năm sau lại có tin đồn iPhone gập sẽ dùng kim loại lỏng
    RealityKit cũng đã có quét 3D và nhiều tính năng AR trong nhiều năm, dù ý nghĩa của chúng chưa rõ ràng cho tới khi Apple Vision Pro xuất hiện

    • Có vẻ diễn giải quá nhiều rồi, tôi thấy đây đơn giản là những thử nghiệm thương mại hóa thất bại
      Touch Bar bị nhiều người ghét, và chỉ vài năm sau mới được dân mê công nghệ thích lên khi họ hack và tinh chỉnh để thêm chức năng sâu hơn
      Làm dụng cụ lấy SIM bằng hợp kim đắt đỏ cũng vô lý, còn RealityKit và Vision giống như giải pháp đi tìm vấn đề, mà bản thân Vision cũng đang hụt hơi
      3D Touch cũng gặp vấn đề về khả năng khám phá và tính dễ dùng, và còn nhiều ví dụ khác nữa
    • Modem tự phát triển đầu tiên của Apple cũng được trang bị trước trên dòng rẻ nhất là iPhone 16e
    • “liquid metal” nghe rất ngầu nhưng có lẽ thực ra là kim loại thủy tinh
      Loại vật liệu này đã tồn tại hàng chục năm, nên tôi khá khó chịu khi nó gần như bị xem đồng nghĩa với tên thương hiệu của Apple
      Việc nó không được dùng nhiều chủ yếu là vì quá đắt, nhưng nếu ở vị thế như Apple, nơi nhu cầu hàng chục triệu linh kiện là điều đảm bảo, thì việc đạt hiệu quả kinh tế sẽ dễ hơn rất nhiều
    • Tôi tự hỏi liệu “LiquidMetal” có thực sự tốt hơn một hợp kim nhôm tốt hay không
    • Kính thông minh Apple sắp ra mắt có thể mang lại trải nghiệm người dùng tốt hơn trong gần như mọi tình huống mà trong video người dùng phải giơ iPhone lên
      Tôi đọc được rằng khi quay video hay chụp ảnh, đèn trên kính sẽ sáng hoặc nhấp nháy rõ hơn so với Meta; điều này có thể giúp ích cho vấn đề quyền riêng tư, và ít nhất thì nó không phải Meta
      Tôi thích kính thông minh Meta, nhưng cả hai cặp tôi mua đều đã hỏng và cũng không có cửa hàng nào để được hỗ trợ, nên khi Apple ra sản phẩm tôi định đổi ngay
  • Từ góc nhìn nhà phát triển, API trợ năng ở cấp hệ điều hành của Apple thực sự rất tốt
    Điểm dễ vỡ nằm ở ranh giới khi nhúng WebKit vào bên trong ứng dụng native
    Tôi từng phát hành một ứng dụng Tauri với Monaco editor nằm trong WKWebView, và rất vất vả mới phát hiện chế độ accessibilitySupport: auto của VoiceOver âm thầm phá hỏng việc chọn văn bản ở phía sau của Monaco
    Phải đặt thành "off" thì việc chọn mới hoạt động đúng, và rốt cuộc tôi buộc phải chọn giữa chọn văn bản bình thường và hỗ trợ VoiceOver; đáp án là chọn chức năng chọn văn bản
    Trong AppKit/UIKit thì rất chắc chắn, nhưng nó sụp đổ ở ranh giới WebView nhúng nơi phần lớn ứng dụng desktop ngày nay thực sự tồn tại

  • Trước đây tôi từng đăng ký Be My Eyes với tư cách là người sáng mắt
    Tôi không nhận được nhiều cuộc gọi như kỳ vọng, nhưng vẫn vui vì đã giúp được vài lần
    Tôi từng đọc giúp phong bì thư, từng đọc nhãn lọ thuốc, và từng có hai người đàn ông hài hước ngồi trên chiếc ghế bành lớn mềm mại với cả túi mua sắm đầy hộp ngũ cốc muốn biết từng hộp là loại gì
    Tôi nhớ có một người rất ghét một loại cụ thể
    Ứng dụng này có một tính năng khá độc đáo là người sáng mắt có thể bật camera của người khiếm thị
    https://www.bemyeyes.com

    • Tôi vẫn còn cài Be My Eyes, nhưng đã hơn một năm không nhận được cuộc gọi nào, và điều đó có vẻ là bằng chứng cho thấy mô hình thị giác AI giờ đã mạnh đến mức nào
      Tôi nghĩ thật tuyệt khi AI hoạt động đủ tốt để người khiếm thị tự giải quyết vấn đề của họ
      Dù vậy, việc đôi khi giúp một người lạ xử lý một chuyện nhỏ nhặt ngẫu nhiên vẫn mang lại cảm giác rất con người và rất đẹp
      Tôi vẫn nhớ rất rõ một bà cụ làm đổ cả hộp việt quất xuống sàn bếp, và tôi đã hướng dẫn để bà tìm lại hết
      Đó là 10 phút kết nối với người lạ để làm một việc thú vị, và sau 4 năm ký ức ấy vẫn còn ấm áp
    • Theo tôi biết thì từ khi Be My Eyes đưa vào tính năng AI, nhu cầu về tình nguyện viên đã giảm đi rất nhiều
      Là một người mù hoàn toàn, tôi chỉ bắt đầu dùng ứng dụng này sau khi AI được thêm vào, và nó hoạt động rất tốt cho những việc như đọc nhãn thực phẩm sau khi bọn trẻ chuyển đồ đi chỗ khác hoặc kiểm tra xem TV có đang bật không
      Nếu tôi vẫn sống một mình thì chắc tôi cũng sẽ dùng tính năng gọi tình nguyện viên, nhưng giờ thì không
    • Số người muốn giúp luôn nhiều hơn rất nhiều so với số người cần giúp
      Đó là điều tốt, tôi không phàn nàn gì, nhưng tôi đã đăng ký từ vài năm trước mà chưa từng nhận một cuộc gọi nào nên cuối cùng xóa ứng dụng luôn
    • Tôi tò mò không biết ai là người gọi. Là những người khiếm thị à?
  • Có một việc Apple thực sự cần làm cho tốt là chuyển giọng nói thành văn bản
    Ở mảng trợ năng họ đã làm rất nhiều thứ tốt, nhưng riêng phần ghi âm chép lời thì có cảm giác tụt ít nhất 5 năm, nếu không muốn nói là 10 năm
    Việc nhập liệu trên iPhone bây giờ thật kinh khủng
    Chống chạm nhầm bằng lòng bàn tay rõ ràng tệ hơn trước nên lỗi gõ xuất hiện thường xuyên hơn, còn thuật toán tự sửa khi gõ cũng tệ hơn trước vì nó hay sửa sai những từ nằm trước vài từ so với chỗ tôi đang nhập
    Nhận dạng giọng nói cũng chẳng khá hơn, mà chính kiểu dáng điện thoại còn khiến ngón tay mỏi
    Tôi chỉ mong dùng iPhone không còn là cực hình nữa

    • Wispr Flow là ví dụ mẫu mực về chuyển giọng nói thành văn bản
      So với nó, giải pháp của Apple cho cảm giác như đồ của thế kỷ trước
      Phần chuyển văn bản thành giọng nói của Apple cũng vậy khi ElevenLabs và OpenAI đang dẫn trước rất xa
      Điều cần thiết chỉ là iPhone hỗ trợ native những việc này với cùng chất lượng, vì trong hệ sinh thái đóng của Apple, như vậy mới dùng được ở mọi nơi
    • Cho tới khi Siri có thể xử lý ổn định lệnh “Navigate to ” bằng bản đồ tải sẵn để dùng offline, thì tôi sẽ xem mọi thứ khó hơn như chuyển giọng nói thành văn bản hay hội thoại chỉ là ảo tưởng
      Hôm qua tôi lại phát hiện thêm một “tính năng” nhập liệu khủng khiếp khác trên iPhone
      Nếu bạn đang duyệt một danh sách trong ứng dụng CarPlay của bên thứ ba và chuẩn bị chạm để chọn, nhưng lại đạp ga trước, thì danh sách sẽ bị cắt xuống chỉ còn vài mục và cuộn lên đầu
      Đúng là một cách tuyệt vời để giảm xao nhãng khi lái xe. Lần tới xe vừa chạy là điểm đến trên bản đồ cũng đổi luôn chăng?
      Tôi mong nghiên cứu về tương tác người-máy được áp dụng rộng rãi hơn, và tôi cho rằng những việc ngớ ngẩn như trong hệ sinh thái ô tô/CarPlay nên phải chịu trách nhiệm trước pháp luật
      Trước đây tôi từng lái một chiếc xe mà mỗi lần bật camera lùi đều bị che bởi thông báo pháp lý; trong lúc cái màn đó hiện lên, chắc hẳn đã có ít nhất một người đi bộ bị xe lùi tông phải
      Nhà sản xuất nên chịu trách nhiệm 100% cho những quyết định UI tệ như vậy
    • Thứ giúp tôi sửa trải nghiệm bàn phím iPhone nhiều nhất là tắt Slide to Type
      Tôi cũng học được mẹo này trên HN
      Chỉ cần mở Settings, chạm General, kéo xuống Keyboard rồi tắt Slide to Type là được
    • Mỗi ngày, cả ngày, iPhone khiến tôi cảm thấy như mình là đồ ngốc
      Gần như cách một từ là tôi lại phải sửa từ mà tôi đã gõ, hoặc từ mà iPhone nghĩ là tôi đã gõ
      Ngay cả lúc đang sửa, tự động sửa vẫn tạo ra những lỗi mới còn khó hiểu hơn
      Có lúc nó đạt tới mức điên loạn kiểu cơn sốt mê sảng khiến bạn đột nhiên không thể làm nổi những việc thường ngày
      Điều tệ nhất là trước đây nó từng ổn
      Trên iPhone 4S, tôi gõ gần như đạt tốc độ và độ chính xác của cả một bàn phím đầy đủ
    • Tôi không nghĩ mảng này đã cải thiện được bao nhiêu kể từ khi Colin Hughes tổng hợp các vấn đề của Voice Control vài năm trước
      https://www.theregister.com/on-prem/2023/08/16/those-who-rel...
      Ít nhất họ cũng nên sửa hai lỗi lớn
      Ngay cả ở nơi được hỗ trợ, nhập liệu vẫn thất bại ngẫu nhiên như trò may rủi, còn rất nhiều ứng dụng của các hãng lớn như OneNote thì hoàn toàn không hỗ trợ nhập bằng đọc chính tả
      Trong những trường hợp như vậy, ít nhất cũng cần có đường vòng thay thế như Dragon Dictate hàng chục năm trước
      Việc viết hoa vẫn ngẫu nhiên nên còn rất nhiều lỗi phải sửa
      Có vẻ Apple xem trợ năng không phải là tính năng thực sự mà là chất liệu để tạo ra các thông cáo báo chí phô diễn
  • Một sự thật thú vị: video này được làm để dễ tiếp cận với người sáng mắt
    Nếu là người mù thực sự thì không ai nghe giọng đọc ở tốc độ như thế cả; và nếu bạn từng xem người khiếm thị dùng máy tính, bạn sẽ ngạc nhiên trước khả năng nghe âm thanh ở tốc độ mà bạn khó lòng tưởng tượng nổi

    • https://youtu.be/wKISPePFrIs?si=ahGfFp0U7-pTU9w6&t=43
      Ví dụ tôi hay đưa ra là video này, nơi kỹ sư phần mềm khiếm thị của Microsoft là Saqib Shaikh thuyết trình về Visual Studio
      Liên kết đã được đặt đúng mốc thời gian đó
    • Từ lâu tôi từng làm IT ở một trung tâm cộng đồng, và giám đốc trung tâm là người khiếm thị
      Tôi hoàn toàn kinh ngạc trước tốc độ trình đọc màn hình của ông ấy, đến mức với tôi thì không thể hiểu nổi
      Hiệu quả sử dụng phím tắt của ông ấy đủ khiến cả giới tinh hoa vim/emacs cũng phải xấu hổ
    • Chắc là vì đây là quảng cáo
      Giọng robot cực nhanh có thể nghe khá thô và khó chịu, và ngay cả người khiếm thị phụ thuộc vào nó đôi khi cũng bị quá tải kích thích
    • Đúng vậy. Không chỉ nhanh mà thường còn là giọng rất robot, nên nhiều người sáng mắt còn khó hiểu nổi ngay cả ở tốc độ 1.5x
      Tôi từng đọc về người khiếm thị học cách định vị bằng tiếng vang, và nó trông đúng kiểu siêu năng lực rất ngầu, khiến tôi muốn một ngày nào đó rút màn hình ra và học cách dùng công cụ cho đúng
      Một đồng nghiệp khiếm thị mà tôi làm cùng vài năm trước luôn tắt màn hình, nên pin laptop của anh ấy dùng lâu gần gấp đôi mọi người, và chỉ riêng điều đó thôi cũng đã là một tính năng hay
      Có thể tôi sẽ không đạt đến mức định vị bằng tiếng vang siêu hạng, nhưng chỉ cần làm được nửa thế cũng đã tuyệt, lại còn có thêm lợi ích là có thể thật sự QA các thay đổi về trợ năng
    • Khoảng 20 năm trước tôi nhận cuộc gọi hỗ trợ kỹ thuật cấp 1, và chỉ mất chừng 3,2 giây để nhận ra người kia bị khiếm thị, đồng thời cũng ngay lập tức hiểu rằng điều đó hoàn toàn không cản trở việc dùng máy tính của anh ấy nhờ trình đọc màn hình mà anh dùng
  • Đây trông giống một ứng dụng LLM thực sự hữu ích
    Tôi ước nhiều công ty tập trung vào việc giúp con người hơn, thay vì thay thế hoặc vắt kiệt họ dưới danh nghĩa năng suất

    • Cá nhân tôi sẽ chờ phán xét cho tới khi nó thực sự đến tay những người có thể được giúp đỡ
      Kinh nghiệm của tôi chỉ giới hạn ở bố mẹ già có thị lực suy giảm, nhưng nếu đặt kích thước chữ theo mức Apple cho phép thì điện thoại trở nên không đọc nổi
      Văn bản tràn ra ngoài màn hình trong mọi ứng dụng, từ ứng dụng của Apple cho tới ứng dụng bên thứ ba
      Trong ví dụ hóa đơn, họ bảo người dùng xác nhận với nhà cung cấp, nhưng tôi không hiểu sao nó không gọi luôn tới số in trên hóa đơn
      Thay vì bảo dùng nhận dạng văn bản, sao không tự làm luôn đi? Nếu là Apple Intelligence thì đáng ra nó đã có khả năng đó rồi
      Tôi lo rằng cùng lắm nó chỉ là tính năng đánh lừa thị giác
      Nói thêm thì cái grip trông khá ổn, và mong là họ đừng cộng thêm thuế Apple vào đó
    • Đây chính là điều Apple làm giỏi nhất
      Họ đối xử với những bước tiến mới của ngành như một công nghệ, chứ không phải bản thân sản phẩm
      AI sẽ là một tính năng cải thiện trải nghiệm khách hàng, chứ không phải bản thân sản phẩm
    • Đồng ý. Ngay cả từ góc nhìn người ngoài, lĩnh vực này cũng có vẻ rất nhiều tiềm năng
      Chỉ là tôi thật sự hy vọng vấn đề trong bài trước này (https://news.ycombinator.com/item?id=48178378) không trở nên phổ biến tới mức khiến những tính năng hữu ích như thế này bị đe dọa
      Trong ngắn hạn thì có vẻ khó xảy ra, nhưng khi số lượng ca sử dụng tăng lên thì số lượng kẻ xấu cũng có thể tăng theo
    • Nó hoạt động theo kiểu dùng máy chủ à? Tôi tự hỏi là đặt mạng sống vào iPhone hay là tin vào trung tâm dữ liệu
    • Nói thật, chỉ cần so số tiền công ty có thể kiếm được từ việc giúp người khiếm thị với số tiền kiếm được từ việc thay thế lập trình viên phần mềm và nhà phân tích tài chính là đủ
      Việc Apple dùng công nghệ này để giúp người đang cần được hỗ trợ là đáng khen
      Nhưng cũng không cần giả vờ không biết vì sao phần lớn công ty lại không đào sâu theo hướng đó
      Thành thật mà nói thì ai cũng biết rõ lý do, và những việc như thế này luôn bị đẩy cho một “ai đó khác” mơ hồ
  • Có vẻ mọi người đều lướt qua phần này, nhưng điều khiển bằng mắt cho xe lăn điện nghe như một ý tưởng rất hay
    Có thể chỉ là với riêng tôi, hoặc có thể đó đã là ý tưởng cũ từ lâu
    VR hoàn chỉnh có thể chưa thành công lắm, nhưng nó vẫn khiến tôi luôn tự hỏi liệu có thị trường cho những thiết bị gọn nhẹ và mỏng hơn hay không
    Nếu nó vừa cỡ kính thông thường thì tôi có thể sẽ quan tâm tới thiết bị điều khiển bằng mắt
    Nếu có hệ thống HUD thì tôi còn hứng thú hơn, chỉ cần ở mức rất cơ bản, ví dụ hiển thị vài ký hiệu thôi cũng được
    Nếu có thêm âm thanh cơ bản thì càng tốt, nhưng quan trọng hơn cả HUD hay âm thanh là phải giữ được dạng kính bình thường

    • Đây là công nghệ đã có từ một thời gian rồi
      Nếu đi theo liên kết ở phía tham khảo sẽ thấy những ví dụ như https://www.tolt.tech
      Điều thú vị là Apple đã tích hợp nó vào hệ điều hành
    • Trông như một tín hiệu khá rõ rằng họ vẫn đang phát triển kính AR
      Có cảm giác đây là một trong những tính năng Apple tung ra trước để mài giũa trước khi phần cứng chính thức sẵn sàng
  • Tổng số tiền phải thanh toán trên hóa đơn là $83.89. Hãy xác nhận số tiền này với nhà cung cấp tiện ích công cộng trước khi thanh toán hoặc dùng Text Detection để kiểm tra

    1. AI tìm ra số tiền trên hóa đơn
    2. Gọi cho bên phát hành hóa đơn để hỏi xem họ tính bao nhiêu
    3. Trả số tiền đã bị tính
    • Chỉ riêng việc có thể lấy thông tin ngay lập tức rồi xác minh sau vẫn đã hữu ích rồi
      Nhờ một người đáng tin cậy đọc hộ các con số có thể còn tốt hơn là gọi cho công ty, nhưng không phải ai cũng có lựa chọn đó
    • Sau vài tháng trả cùng một loại hóa đơn, bạn sẽ biết hóa đơn điện thoại của mình thường khoảng bao nhiêu, nên có lẽ không cần làm vậy mỗi lần
      Câu đó rõ ràng là kiểu câu bắt buộc phải có, giống như ChatGPT viết ở cuối rằng “hãy xác minh mọi điều chúng tôi nói với bạn”
    • Tôi cho rằng gọi cho bộ phận chăm sóc khách hàng đối với người khuyết tật chắc cũng ít nhất bực bội y như với bất kỳ ai khác
    • Sẽ hữu ích nếu nó nhớ hóa đơn trong, chẳng hạn, 60 ngày và còn nói được tỷ lệ tăng giảm so với hóa đơn trước
      Kiểu như “Tổng số tiền phải thanh toán trên hóa đơn này là $83.89, cao hơn 4% so với hóa đơn tháng trước từ cùng công ty”
  • Hơi tiếc là Apple đã bỏ phần trình đọc màn hình đọc “the Apple logo” trong bản YouTube của quảng cáo
    https://www.youtube.com/watch?v=B3SmsSCvoss
    Theo tôi, chính đoạn đó làm cho quảng cáo nổi bật hơn

    • Chỉ cần đổi ngôn ngữ âm thanh sang "English descriptive"
  • Thành thật mà nói, với tư cách là người mù và cũng là lập trình viên mù, phần lớn các tính năng này cùng lắm chỉ khiến tôi thấy hơi hứng thú
    Các ứng dụng bên thứ ba như Seeing AI, Envision AI, BeMyEyes, Aira đã làm được phần lớn những việc này rồi
    Vậy nên cùng lắm thì đây chỉ là làm những gì các ứng dụng đó đang làm nhưng nhanh hơn và on-device, mà điều đó cũng có thể đồng nghĩa là kém chính xác hơn, nên còn phải chờ xem
    Trong khi đó, VoiceOver trên macOS, tức trình đọc màn hình của Apple, về cơ bản đã bị bỏ ở chế độ bảo trì trong thời gian dài, và người dùng phải tự tạo ra các giải pháp bên thứ ba khá ấn tượng để bổ sung những tính năng mà trình đọc màn hình tương tự trên Windows đã có từ lâu
    Từ góc nhìn đó, tất cả chuyện này có phần hơi phô trương, nhưng biết đâu tôi vẫn có thể được bất ngờ theo hướng tích cực
    Điều khiến tôi hơi kỳ vọng là các cải tiến cho Voice Control
    Vì việc phải đoán tên kỹ thuật của nút hoặc liên tục dùng lưới số để nhắm vào phần tử thật sự chẳng vui vẻ gì
    Về tốc độ giọng nói, để tăng lên mức rất cao cần luyện tập khá nhiều, và khi đổi sang giọng khác cũng cần tái huấn luyện ở mức nào đó
    Những giọng “giống người” hơn thường khó theo kịp ở tốc độ cực cao, nên nhiều người thích giọng đều đều, máy móc hơn nhưng nhất quán, và vẫn chưa tin hẳn vào TTS dựa trên AI
    Những giọng kiểu này thường bị vỡ khi tăng tốc độ nói vượt quá một ngưỡng nhất định
    Vấn đề phải chờ đánh giá từ chính người dùng mục tiêu thực sự là vô cùng quan trọng
    Ngày càng nhiều công ty và cá nhân nói về trợ năng, làm giải pháp trợ năng và rao giảng AI cho trợ năng, nhưng lại chưa từng nói chuyện với chính những người mà họ tuyên bố đang muốn giúp
    Làm vậy gần như chắc chắn sẽ dẫn tới sai lầm, và nếu tệ thì còn gây hại nhiều hơn giúp
    Muốn làm trợ năng cho đúng, kể cả với sản phẩm AI, thì phải tuyển những người có trải nghiệm sống thực sự
    Nếu không thì sẽ ra những kết quả như văn bản dịch máy, bảo mật chống hacker chỉ bằng một cú nhấp chuột, hay quầy cà phê AI đặt hàng cả nghìn đôi găng tay cao su
    Nhân tiện nói thêm, hiện giờ tôi đang có thời gian cho một dự án mới :P

    • Đồng ý. Nếu một giờ sau khi tôi đọc bài này mà tình hình vẫn chưa đổi, thì đây là bình luận cấp cao đầu tiên ở đây đến từ một người mù/thị lực yếu thực sự
      Với tôi, một người đang chuyển từ thị lực “kém nhưng còn chỉnh được” sang thị lực yếu, điều này cũng rất có giá trị
      Tôi không biết những ứng dụng đó tồn tại, mà đúng lúc tôi đang tìm chính loại công nghệ hỗ trợ như vậy
    • Thật yên tâm khi nghe từ một người chưa từng gặp mà lại đi đến cùng kết luận như chúng tôi
      Có vẻ Apple làm những sản phẩm kiểu này mà chưa từng nói chuyện với người thực sự có vấn đề đó
      Trớ trêu là chúng tôi đang xây một sản phẩm cạnh tranh với các ứng dụng bên thứ ba mà bạn nhắc tới, còn đồng nghiệp của tôi thì có rất nhiều kinh nghiệm nhờ có cha mẹ khiếm thị
      Chúng tôi có một MVP trên mạng, nhưng vẫn chưa thật sự xuất sắc, và tôi không muốn trở thành kiểu người “ơ bọn tôi làm cái ứng dụng đó mà?”
    • Thật tốt khi được nghe góc nhìn từ người trong cuộc
      Dù vậy tôi vẫn hơi băn khoăn ở chỗ bạn cảm thấy xử lý on-device có thể chỉ là đánh bóng bề ngoài
      Theo suy nghĩ ngây thơ của tôi thì đó là một lợi thế lớn, vì nó có nghĩa là luôn hoạt động bất kể dịch vụ di động thế nào
      Có thể dùng trong tàu điện ngầm, trên máy bay, ở nơi hẻo lánh, v.v.
      Ngoài ra, tôi cũng tò mò không biết ứng dụng nào tạo ra khác biệt lớn nhất cho bạn trong đời sống hằng ngày