- Apple Intelligence được áp dụng cho VoiceOver, Magnifier, Voice Control và Accessibility Reader, tăng cường mô tả hình ảnh, điều hướng bằng ngôn ngữ tự nhiên và hỗ trợ đọc
- VoiceOver và Magnifier có thể dùng Image Explorer và Live Recognition để hỏi đáp về nội dung trên màn hình camera, nhưng không nên phụ thuộc vào chúng trong các tình huống rủi ro cao
- Voice Control hỗ trợ điều hướng iPhone và iPad bằng các lệnh ngôn ngữ tự nhiên như “tap the purple folder” thay vì phải dùng nhãn hoặc số chính xác
- Với video không có phụ đề, phụ đề tạo sinh trên thiết bị sẽ tự động hiển thị và dự kiến có mặt trên iPhone, iPad, Mac, Apple TV và Apple Vision Pro
- Apple Vision Pro có thể điều khiển hệ thống lái thay thế Tolt và LUCI bằng theo dõi mắt, đồng thời Hikawa Grip & Stand cũng sẽ được phát hành toàn cầu
Lịch phát hành và quyền riêng tư
- Các tính năng mới và các bản cập nhật dựa trên Apple Intelligence dự kiến sẽ được cung cấp vào cuối năm nay
- Apple cho biết họ vẫn duy trì nguyên tắc privacy by design khi áp dụng Apple Intelligence cho các tính năng trợ năng
- Hikawa Grip & Stand for iPhone được ra mắt trên Apple Store online với ba màu mới
Khám phá thông tin thị giác với VoiceOver và Magnifier
- VoiceOver và Magnifier mô tả chi tiết hơn thông tin trên màn hình và môi trường xung quanh cho người dùng khiếm thị hoặc thị lực kém
- Image Explorer trong VoiceOver sử dụng Apple Intelligence để cung cấp mô tả hình ảnh trên toàn hệ thống, bao gồm ảnh, hóa đơn đã quét và hồ sơ cá nhân
- Với bản cập nhật Live Recognition, người dùng VoiceOver có thể nhấn Action button trên iPhone để đặt câu hỏi và nhận câu trả lời về những gì đang hiện trong khung ngắm camera
- Người dùng có thể tiếp tục đặt các câu hỏi tiếp theo bằng lời của mình để tìm hiểu thêm thông tin thị giác
- Magnifier cung cấp cùng các tính năng điều hướng hỗ trợ và mô tả hình ảnh này trong giao diện tương phản cao dành cho người dùng thị lực kém
- Magnifier cũng tích hợp với Action button, cho phép điều khiển ứng dụng bằng các yêu cầu giọng nói như “zoom in”, “turn on flashlight”
- Không nên phụ thuộc vào VoiceOver và Magnifier trong các tình huống có thể gây thương tích hoặc tổn hại cho con người, các tình huống rủi ro cao, chỉ đường, hay chẩn đoán hoặc điều trị tình trạng y tế
Nhập liệu ngôn ngữ tự nhiên trong Voice Control
- Voice Control sử dụng Apple Intelligence để giúp người dùng khuyết tật vận động điều hướng iPhone và iPad trực quan hơn chỉ bằng giọng nói
- Tính năng nhập linh hoạt mới cho phép thao tác bằng cách mô tả các nút và điều khiển trên màn hình bằng ngôn ngữ tự nhiên thay vì phải nói đúng nhãn hoặc số
- Cách tiếp cận “say what you see” có thể dùng trong mọi ứng dụng, bao gồm cả các ứng dụng có bố cục trực quan như Apple Maps hoặc Files
- Ví dụ lệnh như “tap the guide about best restaurants”, “tap the purple folder” cho phép diễn đạt trực tiếp đối tượng đang thấy trên màn hình
- Tính năng này cũng có thể giúp giảm rào cản khi các phần tử chưa được gắn nhãn phù hợp cho trợ năng
- Voice Control dựa trên Apple Intelligence sẽ được cung cấp trong môi trường tiếng Anh tại Mỹ, Canada, Anh và Australia
Accessibility Reader và phụ đề tạo sinh
- Accessibility Reader mang đến trải nghiệm đọc tùy biến cho người dùng có nhiều dạng khuyết tật, từ chứng khó đọc đến thị lực kém
- Nhờ Apple Intelligence, công cụ này có thể xử lý cả các tài liệu nguồn phức tạp hơn như bài báo khoa học
- Nó cũng có thể xử lý văn bản có nhiều cột, hình ảnh và bảng biểu
- Tóm tắt theo yêu cầu cho phép người dùng xem tổng quan tài liệu trước khi đọc chi tiết
- Bản dịch tích hợp mới cho phép người dùng đọc văn bản bằng ngôn ngữ mẹ đẻ của mình trong khi vẫn giữ nguyên định dạng tùy chỉnh, phông chữ và màu sắc
- Phụ đề tạo sinh mới sẽ tự động hiển thị bản chép lời âm thanh trong các video không có caption hoặc phụ đề
- Phạm vi áp dụng gồm các clip quay bằng iPhone, video nhận từ bạn bè và gia đình, cũng như video phát trực tuyến online
- Phụ đề được tạo riêng tư bằng nhận dạng giọng nói trên thiết bị và sẽ tự động hiển thị cho video không có phụ đề trên iPhone, iPad, Mac, Apple TV và Apple Vision Pro
- Có thể tùy chỉnh giao diện phụ đề trong menu phát video hoặc Settings
- Phụ đề tạo sinh dự kiến sẽ được cung cấp trong môi trường tiếng Anh tại Mỹ và Canada
Điều khiển xe lăn điện bằng Apple Vision Pro
- Một số người dùng xe lăn điện không thể lái bằng joystick, nên các điều khiển lái thay thế có thể là yếu tố thiết yếu cho việc di chuyển độc lập
- Hệ thống theo dõi mắt chính xác của Apple Vision Pro được dùng làm phương thức nhập có độ phản hồi cao cho các hệ thống lái thay thế tương thích
- Tính năng theo dõi mắt của Vision Pro không cần hiệu chỉnh lại thường xuyên và hoạt động trong nhiều điều kiện ánh sáng khác nhau
- Tính năng này sẽ được ra mắt tại Mỹ với các hệ thống lái thay thế Tolt và LUCI
- Hỗ trợ phụ kiện bao gồm cả kết nối Bluetooth và có dây; với kết nối có dây, người dùng cần mua Apple Vision Pro Developer Strap
- Apple sẽ tiếp tục hợp tác với các nhà phát triển để hỗ trợ thêm nhiều hệ thống điều khiển xe lăn hơn
- Tính năng này và Apple Vision Pro được thiết kế để sử dụng trong môi trường có kiểm soát; thông tin chi tiết có tại support.apple.com/en-us/118507
- Pat Dolan, người đã sống chung với ALS trong 10 năm, cho biết khả năng tự điều khiển xe lăn điện là điều “quý như vàng” đối với ông
Hikawa Grip & Stand for iPhone
- Hikawa Grip & Stand for iPhone sẽ được phát hành toàn cầu trên Apple Store online với ba màu mới
- Đây là một phụ kiện MagSafe do nhà thiết kế Bailey Hikawa ở Los Angeles phát triển với trọng tâm là trợ năng
- Quá trình phát triển có sự tham gia của những người có nhiều dạng khuyết tật ảnh hưởng đến khả năng cầm nắm, sức lực và di chuyển
- Đây là một tay cầm kiêm chân đỡ thích ứng, giúp người dùng cầm iPhone theo cách phù hợp nhất với mình
- Sự hợp tác giữa Hikawa và PopSockets đưa phụ kiện thích ứng này lần đầu tiên đến thị trường toàn cầu
- Tại Apple The Grove in Los Angeles sẽ có phiên Today at Apple với sự tham gia của Hikawa, Shane Burcaw và Alex Barone
- Các quốc gia có thể mua gồm Australia, Austria, Belgium, Canada, China, Denmark, France, Hong Kong, Italy, Japan, the Netherlands, Singapore, South Korea, Spain, Sweden, Switzerland, Taiwan, the United Arab Emirates, the UK và the U.S.; có thể mua tại apple.com
Các cập nhật trợ năng khác
- Vehicle Motion Cues được bổ sung cho visionOS, có thể giúp giảm say xe khi dùng Apple Vision Pro trong lúc là hành khách trên phương tiện đang di chuyển
- Vision Pro hỗ trợ cử chỉ khuôn mặt để thực hiện thao tác chạm và các hành động hệ thống
- Vision Pro cũng bổ sung cách mới để chọn phần tử bằng mắt khi dùng Dwell Control
- Touch Accommodations cung cấp cách mới để cá nhân hóa thiết lập iOS và iPadOS
- Made for iPhone hearing aids sẽ ghép nối và handoff ổn định hơn giữa các thiết bị Apple trên iOS, iPadOS, macOS và visionOS, đồng thời cải thiện trải nghiệm thiết lập
- Hỗ trợ Larger Text được thêm vào tvOS để người xem thị lực kém có thể tăng kích thước chữ trên màn hình và đọc dễ hơn
- Name Recognition cho phép người dùng khiếm thính hoặc khó nghe nhận thông báo khi ai đó gọi tên mình, và hoạt động với hơn 50 ngôn ngữ trên toàn thế giới
- API mới cho các nhà phát triển ứng dụng phiên dịch ngôn ngữ ký hiệu hỗ trợ người dùng thêm thông dịch viên thật vào cuộc gọi video FaceTime đang diễn ra
- Có thể kết nối Sony Access controller làm tay cầm chơi game trên iOS, iPadOS và macOS
- Trên Sony Access controller, người dùng có thể cấu hình thumbstick, 9 nút tích hợp và tối đa 4 nút ngoài hoặc công tắc chuyên dụng để cá nhân hóa bố cục
- Người dùng có thể kết hợp hai bộ điều khiển để tạo trải nghiệm chơi game được cá nhân hóa sâu hơn
Ngôn ngữ hỗ trợ và giới hạn khu vực
- Apple Intelligence được cung cấp ở dạng beta, với các ngôn ngữ hỗ trợ gồm English, Danish, Dutch, French, German, Italian, Norwegian, Portuguese, Spanish, Swedish, Turkish, Vietnamese, Chinese (simplified), Chinese (traditional), Japanese và Korean
- Một số tính năng có thể không khả dụng ở mọi khu vực hoặc ngôn ngữ
- Có thể xem tình trạng hỗ trợ tính năng và ngôn ngữ, cũng như yêu cầu hệ thống, tại support.apple.com/en-us/121115
1 bình luận
Ý kiến trên Hacker News
Apple thích lén đưa công nghệ mới vào những chỗ tưởng như bình thường để thử nghiệm công khai một cách kín đáo, nên việc lần đầu tung AI dạng tác nhân dưới dạng tính năng trợ năng nghe rất đúng kiểu Apple
Touch Bar không chỉ là một thanh OLED đơn thuần mà là bước đi đầu tiên hướng tới quá trình chuyển Mac sang Apple Silicon, và chip Apple T1 trên MacBook Touch Bar 2016 là bộ xử lý đầu tiên do Apple tự thiết kế hoàn toàn xuất hiện trên Mac
Nó lấy từ chipset Intel các vai trò như quản lý điện năng, quạt, ngủ/đánh thức, quyền truy cập camera và micro, cùng Secure Enclave cho Touch ID; sau đó T2 còn đảm nhiệm cả mã hóa SSD, quản lý âm thanh, xử lý hình ảnh camera và chống can thiệp vào quá trình khởi động
iPhone 3G đi kèm dụng cụ lấy SIM Liquidmetal, một hợp kim kim loại tùy biến gần như không thể bẻ cong bằng tay; sau đó Apple không ra thêm sản phẩm nào dùng hợp kim này, nhưng gần 20 năm sau lại có tin đồn iPhone gập sẽ dùng kim loại lỏng
RealityKit cũng đã có quét 3D và nhiều tính năng AR trong nhiều năm, dù ý nghĩa của chúng chưa rõ ràng cho tới khi Apple Vision Pro xuất hiện
Touch Bar bị nhiều người ghét, và chỉ vài năm sau mới được dân mê công nghệ thích lên khi họ hack và tinh chỉnh để thêm chức năng sâu hơn
Làm dụng cụ lấy SIM bằng hợp kim đắt đỏ cũng vô lý, còn RealityKit và Vision giống như giải pháp đi tìm vấn đề, mà bản thân Vision cũng đang hụt hơi
3D Touch cũng gặp vấn đề về khả năng khám phá và tính dễ dùng, và còn nhiều ví dụ khác nữa
Loại vật liệu này đã tồn tại hàng chục năm, nên tôi khá khó chịu khi nó gần như bị xem đồng nghĩa với tên thương hiệu của Apple
Việc nó không được dùng nhiều chủ yếu là vì quá đắt, nhưng nếu ở vị thế như Apple, nơi nhu cầu hàng chục triệu linh kiện là điều đảm bảo, thì việc đạt hiệu quả kinh tế sẽ dễ hơn rất nhiều
Tôi đọc được rằng khi quay video hay chụp ảnh, đèn trên kính sẽ sáng hoặc nhấp nháy rõ hơn so với Meta; điều này có thể giúp ích cho vấn đề quyền riêng tư, và ít nhất thì nó không phải Meta
Tôi thích kính thông minh Meta, nhưng cả hai cặp tôi mua đều đã hỏng và cũng không có cửa hàng nào để được hỗ trợ, nên khi Apple ra sản phẩm tôi định đổi ngay
Từ góc nhìn nhà phát triển, API trợ năng ở cấp hệ điều hành của Apple thực sự rất tốt
Điểm dễ vỡ nằm ở ranh giới khi nhúng WebKit vào bên trong ứng dụng native
Tôi từng phát hành một ứng dụng Tauri với Monaco editor nằm trong WKWebView, và rất vất vả mới phát hiện chế độ
accessibilitySupport: autocủa VoiceOver âm thầm phá hỏng việc chọn văn bản ở phía sau của MonacoPhải đặt thành
"off"thì việc chọn mới hoạt động đúng, và rốt cuộc tôi buộc phải chọn giữa chọn văn bản bình thường và hỗ trợ VoiceOver; đáp án là chọn chức năng chọn văn bảnTrong AppKit/UIKit thì rất chắc chắn, nhưng nó sụp đổ ở ranh giới WebView nhúng nơi phần lớn ứng dụng desktop ngày nay thực sự tồn tại
Trước đây tôi từng đăng ký Be My Eyes với tư cách là người sáng mắt
Tôi không nhận được nhiều cuộc gọi như kỳ vọng, nhưng vẫn vui vì đã giúp được vài lần
Tôi từng đọc giúp phong bì thư, từng đọc nhãn lọ thuốc, và từng có hai người đàn ông hài hước ngồi trên chiếc ghế bành lớn mềm mại với cả túi mua sắm đầy hộp ngũ cốc muốn biết từng hộp là loại gì
Tôi nhớ có một người rất ghét một loại cụ thể
Ứng dụng này có một tính năng khá độc đáo là người sáng mắt có thể bật camera của người khiếm thị
https://www.bemyeyes.com
Tôi nghĩ thật tuyệt khi AI hoạt động đủ tốt để người khiếm thị tự giải quyết vấn đề của họ
Dù vậy, việc đôi khi giúp một người lạ xử lý một chuyện nhỏ nhặt ngẫu nhiên vẫn mang lại cảm giác rất con người và rất đẹp
Tôi vẫn nhớ rất rõ một bà cụ làm đổ cả hộp việt quất xuống sàn bếp, và tôi đã hướng dẫn để bà tìm lại hết
Đó là 10 phút kết nối với người lạ để làm một việc thú vị, và sau 4 năm ký ức ấy vẫn còn ấm áp
Là một người mù hoàn toàn, tôi chỉ bắt đầu dùng ứng dụng này sau khi AI được thêm vào, và nó hoạt động rất tốt cho những việc như đọc nhãn thực phẩm sau khi bọn trẻ chuyển đồ đi chỗ khác hoặc kiểm tra xem TV có đang bật không
Nếu tôi vẫn sống một mình thì chắc tôi cũng sẽ dùng tính năng gọi tình nguyện viên, nhưng giờ thì không
Đó là điều tốt, tôi không phàn nàn gì, nhưng tôi đã đăng ký từ vài năm trước mà chưa từng nhận một cuộc gọi nào nên cuối cùng xóa ứng dụng luôn
Có một việc Apple thực sự cần làm cho tốt là chuyển giọng nói thành văn bản
Ở mảng trợ năng họ đã làm rất nhiều thứ tốt, nhưng riêng phần ghi âm chép lời thì có cảm giác tụt ít nhất 5 năm, nếu không muốn nói là 10 năm
Việc nhập liệu trên iPhone bây giờ thật kinh khủng
Chống chạm nhầm bằng lòng bàn tay rõ ràng tệ hơn trước nên lỗi gõ xuất hiện thường xuyên hơn, còn thuật toán tự sửa khi gõ cũng tệ hơn trước vì nó hay sửa sai những từ nằm trước vài từ so với chỗ tôi đang nhập
Nhận dạng giọng nói cũng chẳng khá hơn, mà chính kiểu dáng điện thoại còn khiến ngón tay mỏi
Tôi chỉ mong dùng iPhone không còn là cực hình nữa
So với nó, giải pháp của Apple cho cảm giác như đồ của thế kỷ trước
Phần chuyển văn bản thành giọng nói của Apple cũng vậy khi ElevenLabs và OpenAI đang dẫn trước rất xa
Điều cần thiết chỉ là iPhone hỗ trợ native những việc này với cùng chất lượng, vì trong hệ sinh thái đóng của Apple, như vậy mới dùng được ở mọi nơi
Hôm qua tôi lại phát hiện thêm một “tính năng” nhập liệu khủng khiếp khác trên iPhone
Nếu bạn đang duyệt một danh sách trong ứng dụng CarPlay của bên thứ ba và chuẩn bị chạm để chọn, nhưng lại đạp ga trước, thì danh sách sẽ bị cắt xuống chỉ còn vài mục và cuộn lên đầu
Đúng là một cách tuyệt vời để giảm xao nhãng khi lái xe. Lần tới xe vừa chạy là điểm đến trên bản đồ cũng đổi luôn chăng?
Tôi mong nghiên cứu về tương tác người-máy được áp dụng rộng rãi hơn, và tôi cho rằng những việc ngớ ngẩn như trong hệ sinh thái ô tô/CarPlay nên phải chịu trách nhiệm trước pháp luật
Trước đây tôi từng lái một chiếc xe mà mỗi lần bật camera lùi đều bị che bởi thông báo pháp lý; trong lúc cái màn đó hiện lên, chắc hẳn đã có ít nhất một người đi bộ bị xe lùi tông phải
Nhà sản xuất nên chịu trách nhiệm 100% cho những quyết định UI tệ như vậy
Tôi cũng học được mẹo này trên HN
Chỉ cần mở Settings, chạm General, kéo xuống Keyboard rồi tắt Slide to Type là được
Gần như cách một từ là tôi lại phải sửa từ mà tôi đã gõ, hoặc từ mà iPhone nghĩ là tôi đã gõ
Ngay cả lúc đang sửa, tự động sửa vẫn tạo ra những lỗi mới còn khó hiểu hơn
Có lúc nó đạt tới mức điên loạn kiểu cơn sốt mê sảng khiến bạn đột nhiên không thể làm nổi những việc thường ngày
Điều tệ nhất là trước đây nó từng ổn
Trên iPhone 4S, tôi gõ gần như đạt tốc độ và độ chính xác của cả một bàn phím đầy đủ
https://www.theregister.com/on-prem/2023/08/16/those-who-rel...
Ít nhất họ cũng nên sửa hai lỗi lớn
Ngay cả ở nơi được hỗ trợ, nhập liệu vẫn thất bại ngẫu nhiên như trò may rủi, còn rất nhiều ứng dụng của các hãng lớn như OneNote thì hoàn toàn không hỗ trợ nhập bằng đọc chính tả
Trong những trường hợp như vậy, ít nhất cũng cần có đường vòng thay thế như Dragon Dictate hàng chục năm trước
Việc viết hoa vẫn ngẫu nhiên nên còn rất nhiều lỗi phải sửa
Có vẻ Apple xem trợ năng không phải là tính năng thực sự mà là chất liệu để tạo ra các thông cáo báo chí phô diễn
Một sự thật thú vị: video này được làm để dễ tiếp cận với người sáng mắt
Nếu là người mù thực sự thì không ai nghe giọng đọc ở tốc độ như thế cả; và nếu bạn từng xem người khiếm thị dùng máy tính, bạn sẽ ngạc nhiên trước khả năng nghe âm thanh ở tốc độ mà bạn khó lòng tưởng tượng nổi
Ví dụ tôi hay đưa ra là video này, nơi kỹ sư phần mềm khiếm thị của Microsoft là Saqib Shaikh thuyết trình về Visual Studio
Liên kết đã được đặt đúng mốc thời gian đó
Tôi hoàn toàn kinh ngạc trước tốc độ trình đọc màn hình của ông ấy, đến mức với tôi thì không thể hiểu nổi
Hiệu quả sử dụng phím tắt của ông ấy đủ khiến cả giới tinh hoa vim/emacs cũng phải xấu hổ
Giọng robot cực nhanh có thể nghe khá thô và khó chịu, và ngay cả người khiếm thị phụ thuộc vào nó đôi khi cũng bị quá tải kích thích
Tôi từng đọc về người khiếm thị học cách định vị bằng tiếng vang, và nó trông đúng kiểu siêu năng lực rất ngầu, khiến tôi muốn một ngày nào đó rút màn hình ra và học cách dùng công cụ cho đúng
Một đồng nghiệp khiếm thị mà tôi làm cùng vài năm trước luôn tắt màn hình, nên pin laptop của anh ấy dùng lâu gần gấp đôi mọi người, và chỉ riêng điều đó thôi cũng đã là một tính năng hay
Có thể tôi sẽ không đạt đến mức định vị bằng tiếng vang siêu hạng, nhưng chỉ cần làm được nửa thế cũng đã tuyệt, lại còn có thêm lợi ích là có thể thật sự QA các thay đổi về trợ năng
Đây trông giống một ứng dụng LLM thực sự hữu ích
Tôi ước nhiều công ty tập trung vào việc giúp con người hơn, thay vì thay thế hoặc vắt kiệt họ dưới danh nghĩa năng suất
Kinh nghiệm của tôi chỉ giới hạn ở bố mẹ già có thị lực suy giảm, nhưng nếu đặt kích thước chữ theo mức Apple cho phép thì điện thoại trở nên không đọc nổi
Văn bản tràn ra ngoài màn hình trong mọi ứng dụng, từ ứng dụng của Apple cho tới ứng dụng bên thứ ba
Trong ví dụ hóa đơn, họ bảo người dùng xác nhận với nhà cung cấp, nhưng tôi không hiểu sao nó không gọi luôn tới số in trên hóa đơn
Thay vì bảo dùng nhận dạng văn bản, sao không tự làm luôn đi? Nếu là Apple Intelligence thì đáng ra nó đã có khả năng đó rồi
Tôi lo rằng cùng lắm nó chỉ là tính năng đánh lừa thị giác
Nói thêm thì cái grip trông khá ổn, và mong là họ đừng cộng thêm thuế Apple vào đó
Họ đối xử với những bước tiến mới của ngành như một công nghệ, chứ không phải bản thân sản phẩm
AI sẽ là một tính năng cải thiện trải nghiệm khách hàng, chứ không phải bản thân sản phẩm
Chỉ là tôi thật sự hy vọng vấn đề trong bài trước này (https://news.ycombinator.com/item?id=48178378) không trở nên phổ biến tới mức khiến những tính năng hữu ích như thế này bị đe dọa
Trong ngắn hạn thì có vẻ khó xảy ra, nhưng khi số lượng ca sử dụng tăng lên thì số lượng kẻ xấu cũng có thể tăng theo
Việc Apple dùng công nghệ này để giúp người đang cần được hỗ trợ là đáng khen
Nhưng cũng không cần giả vờ không biết vì sao phần lớn công ty lại không đào sâu theo hướng đó
Thành thật mà nói thì ai cũng biết rõ lý do, và những việc như thế này luôn bị đẩy cho một “ai đó khác” mơ hồ
Có vẻ mọi người đều lướt qua phần này, nhưng điều khiển bằng mắt cho xe lăn điện nghe như một ý tưởng rất hay
Có thể chỉ là với riêng tôi, hoặc có thể đó đã là ý tưởng cũ từ lâu
VR hoàn chỉnh có thể chưa thành công lắm, nhưng nó vẫn khiến tôi luôn tự hỏi liệu có thị trường cho những thiết bị gọn nhẹ và mỏng hơn hay không
Nếu nó vừa cỡ kính thông thường thì tôi có thể sẽ quan tâm tới thiết bị điều khiển bằng mắt
Nếu có hệ thống HUD thì tôi còn hứng thú hơn, chỉ cần ở mức rất cơ bản, ví dụ hiển thị vài ký hiệu thôi cũng được
Nếu có thêm âm thanh cơ bản thì càng tốt, nhưng quan trọng hơn cả HUD hay âm thanh là phải giữ được dạng kính bình thường
Nếu đi theo liên kết ở phía tham khảo sẽ thấy những ví dụ như https://www.tolt.tech
Điều thú vị là Apple đã tích hợp nó vào hệ điều hành
Có cảm giác đây là một trong những tính năng Apple tung ra trước để mài giũa trước khi phần cứng chính thức sẵn sàng
Tổng số tiền phải thanh toán trên hóa đơn là $83.89. Hãy xác nhận số tiền này với nhà cung cấp tiện ích công cộng trước khi thanh toán hoặc dùng Text Detection để kiểm tra
Nhờ một người đáng tin cậy đọc hộ các con số có thể còn tốt hơn là gọi cho công ty, nhưng không phải ai cũng có lựa chọn đó
Câu đó rõ ràng là kiểu câu bắt buộc phải có, giống như ChatGPT viết ở cuối rằng “hãy xác minh mọi điều chúng tôi nói với bạn”
Kiểu như “Tổng số tiền phải thanh toán trên hóa đơn này là $83.89, cao hơn 4% so với hóa đơn tháng trước từ cùng công ty”
Hơi tiếc là Apple đã bỏ phần trình đọc màn hình đọc “the Apple logo” trong bản YouTube của quảng cáo
https://www.youtube.com/watch?v=B3SmsSCvoss
Theo tôi, chính đoạn đó làm cho quảng cáo nổi bật hơn
"English descriptive"Thành thật mà nói, với tư cách là người mù và cũng là lập trình viên mù, phần lớn các tính năng này cùng lắm chỉ khiến tôi thấy hơi hứng thú
Các ứng dụng bên thứ ba như Seeing AI, Envision AI, BeMyEyes, Aira đã làm được phần lớn những việc này rồi
Vậy nên cùng lắm thì đây chỉ là làm những gì các ứng dụng đó đang làm nhưng nhanh hơn và on-device, mà điều đó cũng có thể đồng nghĩa là kém chính xác hơn, nên còn phải chờ xem
Trong khi đó, VoiceOver trên macOS, tức trình đọc màn hình của Apple, về cơ bản đã bị bỏ ở chế độ bảo trì trong thời gian dài, và người dùng phải tự tạo ra các giải pháp bên thứ ba khá ấn tượng để bổ sung những tính năng mà trình đọc màn hình tương tự trên Windows đã có từ lâu
Từ góc nhìn đó, tất cả chuyện này có phần hơi phô trương, nhưng biết đâu tôi vẫn có thể được bất ngờ theo hướng tích cực
Điều khiến tôi hơi kỳ vọng là các cải tiến cho Voice Control
Vì việc phải đoán tên kỹ thuật của nút hoặc liên tục dùng lưới số để nhắm vào phần tử thật sự chẳng vui vẻ gì
Về tốc độ giọng nói, để tăng lên mức rất cao cần luyện tập khá nhiều, và khi đổi sang giọng khác cũng cần tái huấn luyện ở mức nào đó
Những giọng “giống người” hơn thường khó theo kịp ở tốc độ cực cao, nên nhiều người thích giọng đều đều, máy móc hơn nhưng nhất quán, và vẫn chưa tin hẳn vào TTS dựa trên AI
Những giọng kiểu này thường bị vỡ khi tăng tốc độ nói vượt quá một ngưỡng nhất định
Vấn đề phải chờ đánh giá từ chính người dùng mục tiêu thực sự là vô cùng quan trọng
Ngày càng nhiều công ty và cá nhân nói về trợ năng, làm giải pháp trợ năng và rao giảng AI cho trợ năng, nhưng lại chưa từng nói chuyện với chính những người mà họ tuyên bố đang muốn giúp
Làm vậy gần như chắc chắn sẽ dẫn tới sai lầm, và nếu tệ thì còn gây hại nhiều hơn giúp
Muốn làm trợ năng cho đúng, kể cả với sản phẩm AI, thì phải tuyển những người có trải nghiệm sống thực sự
Nếu không thì sẽ ra những kết quả như văn bản dịch máy, bảo mật chống hacker chỉ bằng một cú nhấp chuột, hay quầy cà phê AI đặt hàng cả nghìn đôi găng tay cao su
Nhân tiện nói thêm, hiện giờ tôi đang có thời gian cho một dự án mới :P
Với tôi, một người đang chuyển từ thị lực “kém nhưng còn chỉnh được” sang thị lực yếu, điều này cũng rất có giá trị
Tôi không biết những ứng dụng đó tồn tại, mà đúng lúc tôi đang tìm chính loại công nghệ hỗ trợ như vậy
Có vẻ Apple làm những sản phẩm kiểu này mà chưa từng nói chuyện với người thực sự có vấn đề đó
Trớ trêu là chúng tôi đang xây một sản phẩm cạnh tranh với các ứng dụng bên thứ ba mà bạn nhắc tới, còn đồng nghiệp của tôi thì có rất nhiều kinh nghiệm nhờ có cha mẹ khiếm thị
Chúng tôi có một MVP trên mạng, nhưng vẫn chưa thật sự xuất sắc, và tôi không muốn trở thành kiểu người “ơ bọn tôi làm cái ứng dụng đó mà?”
Dù vậy tôi vẫn hơi băn khoăn ở chỗ bạn cảm thấy xử lý on-device có thể chỉ là đánh bóng bề ngoài
Theo suy nghĩ ngây thơ của tôi thì đó là một lợi thế lớn, vì nó có nghĩa là luôn hoạt động bất kể dịch vụ di động thế nào
Có thể dùng trong tàu điện ngầm, trên máy bay, ở nơi hẻo lánh, v.v.
Ngoài ra, tôi cũng tò mò không biết ứng dụng nào tạo ra khác biệt lớn nhất cho bạn trong đời sống hằng ngày