- Các công ty AI lớn đang chuyển sang mô hình kinh doanh dựa trên doanh thu quảng cáo, đồng thời phát triển trợ lý AI lấy phần cứng làm trung tâm có khả năng thu thập mọi thông tin hình ảnh và âm thanh xung quanh người dùng
- Các AI luôn bật (Always-on) như vậy được thiết kế để nhận biết các cuộc trò chuyện hằng ngày của người dùng ngay cả khi không có từ đánh thức bằng giọng nói, tích lũy ngữ cảnh dài hạn để cung cấp hỗ trợ chủ động
- Tuy nhiên, trong cấu trúc dữ liệu được gửi tới máy chủ của các công ty quảng cáo này, rủi ro có thể xuất hiện bất cứ lúc nào nếu chính sách bảo vệ quyền riêng tư thay đổi
- Ngược lại, với kiến trúc suy luận cục bộ trên thiết bị (edge inference), dữ liệu về mặt vật lý không rời khỏi thiết bị, nên có thể đạt được bảo đảm an ninh ở cấp độ kiến trúc chứ không chỉ là chính sách
- AI hữu ích nhất đồng thời cũng sẽ là công nghệ riêng tư nhất, vì vậy việc chuyển sang AI cục bộ không gửi dữ liệu ra bên ngoài là điều bắt buộc
Ngành trợ lý AI đã chuyển thành cấu trúc dựa trên quảng cáo
- OpenAI đã đưa quảng cáo vào ChatGPT, và điều này được xem như một thay đổi mang tính cấu trúc trên toàn ngành
- Năm 2025, OpenAI mua lại startup phần cứng io của Jony Ive với giá 6,5 tỷ USD và đang phát triển thiết bị AI nhỏ gọn không có màn hình
- Tất cả các công ty trợ lý AI lớn đều đang vận hành bằng doanh thu quảng cáo và chế tạo phần cứng luôn quan sát môi trường xung quanh
- Khi hai yếu tố này xung đột, chỉ có suy luận cục bộ trên thiết bị (local inference) mới được xem là lời giải duy nhất để ngăn chặn lạm dụng dữ liệu
Tính tất yếu của AI luôn bật
- Các trợ lý giọng nói trước đây chỉ hoạt động sau từ đánh thức (wake word) như “Hey Siri”, “OK Google”
- Nhưng trong các cuộc trò chuyện đời thường, người dùng không phải lúc nào cũng có thời gian dùng từ đánh thức, nên cần một AI nhận biết ngữ cảnh tự nhiên
- Thế hệ trợ lý tiếp theo sẽ liên tục nhận thức môi trường của người dùng thông qua nhiều loại cảm biến như âm thanh, thị giác, phát hiện hiện diện, thiết bị đeo
- Vì vậy, vấn đề không phải là “AI luôn bật có xuất hiện hay không”, mà là ai kiểm soát dữ liệu đó
- Hiện nay quyền kiểm soát ấy đang nằm trong tay các công ty quảng cáo
Chính sách là lời hứa, kiến trúc là sự bảo đảm
- Các công ty đưa ra các cam kết như “mã hóa dữ liệu”, “ẩn danh hóa”, “không liên quan đến quảng cáo”, nhưng trong cấu trúc xử lý trên đám mây thì không thể có sự tin cậy tuyệt đối
- Người dùng phải tin vào chính sách hiện tại và tương lai của công ty, nhân viên nội bộ, nhà cung cấp bên ngoài, yêu cầu từ chính phủ, thậm chí cả các đối tác quảng cáo không được công bố
- OpenAI tuyên bố “không bán dữ liệu cho nhà quảng cáo”, nhưng đã có tiền lệ Google sử dụng Gmail để nhắm mục tiêu quảng cáo trong suốt 13 năm
- Chính sách có thể thay đổi, nhưng kiến trúc thì không
- Trong kiến trúc xử lý cục bộ, dữ liệu về mặt vật lý không thể đi ra bên ngoài
- Không thể thực hiện gọi API, telemetry từ xa hay truyền dữ liệu sử dụng đã ẩn danh
- Luồng âm thanh và video trong gia đình còn nhạy cảm hơn email rất nhiều, vì nó bao trùm toàn bộ đời sống riêng tư của một cá nhân
- Như trong trường hợp của Amazon, việc loại bỏ xử lý giọng nói cục bộ, kế hoạch liên kết với quảng cáo, và cho phép cơ quan thực thi pháp luật truy cập Ring cho thấy rủi ro của cấu trúc tập trung
Công nghệ suy luận biên đã trưởng thành
- Trước đây từng có ý kiến phản đối rằng “mô hình cục bộ không đủ hiệu năng”, nhưng hiện nay đã đạt tới mức đủ dùng
- Có thể chạy toàn bộ pipeline AI như nhận dạng giọng nói thời gian thực, ghi nhớ ngữ nghĩa, suy luận hội thoại, tổng hợp giọng nói ngay trên thiết bị trong nhà
- Hoạt động không gây tiếng ồn quạt, chỉ cần mua phần cứng một lần, và không truyền dữ liệu ra ngoài
- Điều này trở nên khả thi nhờ sự phát triển của nén mô hình, engine suy luận mã nguồn mở, silicon hiệu quả, và hiệu suất trên mỗi watt vẫn đang tiếp tục cải thiện qua từng năm
- Ngay cả trong các gia đình dùng để thử nghiệm thực tế, vấn đề là độ khó trong việc hiểu ngữ cảnh, chứ không phải kích thước mô hình hay thiếu hiệu năng
- Vì vậy cần một mô hình kinh doanh tập trung vào bán phần cứng và phần mềm,
- trong đó nhà sản xuất phải thiết kế cấu trúc khiến họ không thể truy cập dữ liệu về mặt vật lý
Sự cần thiết của AI cục bộ và kết luận
- AI hữu ích nhất sẽ trở thành công nghệ xử lý thông tin riêng tư nhất
- Cách duy nhất để giữ an toàn cho điều đó là thiết kế cấu trúc khiến dữ liệu không thể được truyền ra bên ngoài
- Không thể bảo vệ bằng chính sách, lời hứa hay thay đổi thiết lập; cần chặn ở cấp độ kiến trúc
- Với thông điệp “Choose local. Choose edge.”, bài viết kêu gọi xây dựng AI không gửi dữ liệu ra bên ngoài
1 bình luận
Ý kiến trên Hacker News
Cảm thấy câu quảng bá này khá buồn cười khi sản phẩm mà công ty này giới thiệu là một thiết bị AI luôn bật, luôn lắng nghe
Dù chỉ chạy trên phần cứng cục bộ thì cũng không có nghĩa là mọi khoảnh khắc trong cuộc sống của chúng ta đều cần bị ghi âm và phân tích
Nếu cả những cuộc trò chuyện riêng tư của gia đình hay những khoảnh khắc của trẻ vị thành niên cũng bị lưu lại thì liệu có ổn không, điều đó khiến tôi nghi ngại
Tôi lo không biết họ đã xin sự đồng ý của khách tới nhà chưa, và liệu đảm bảo quyền riêng tư có còn được giữ vững khi xảy ra trộm cắp, có lệnh khám xét từ chính phủ, hoặc khi công ty bị mua bán sáp nhập hay không
Nếu tòa án ra lệnh thì dưới hình thức nào đó, thông tin cũng buộc phải bị giao nộp
Muốn giữ quyền riêng tư thực sự thì tốt nhất là thông tin đó ngay từ đầu không nên tồn tại
Tôi mong luật pháp sẽ được xây dựng theo hướng bảo vệ dữ liệu như thông tin trong não bộ của mỗi cá nhân, nhưng thực tế lại đang đi theo chiều ngược lại
Tuy nhiên, nếu thông tin có thể bị đưa ra ngoài mà không có sự cho phép của tôi, bị trích xuất dễ dàng bằng phương tiện vật lý, hoặc ai đó có thể mạo danh tôi để truy cập, thì hoàn toàn không thể chấp nhận được
Nếu đáp ứng được các điều kiện đó thì tôi nghĩ nó cũng sẽ không xâm phạm quyền riêng tư của người khác
Họ nhắm tới những người coi trọng quyền riêng tư, nhưng chính nhóm đó lại là những người sẽ chỉ ra các vấn đề này đầu tiên
Rốt cuộc, những người không quan tâm nhiều đến quyền riêng tư thì sẽ cứ dùng Google hay các dịch vụ tương tự
Tôi cũng từng muốn làm một thiết bị AI chỉ chạy local nhưng lười nên cứ để đó
Dù vậy, tôi nghĩ các thiết bị như thế có thể hữu ích đến mức thay đổi cuộc sống với những người đa dạng thần kinh (neurodiverse)
Có vẻ nó được thiết kế để xử lý theo thời gian thực rồi chỉ thực hiện những hành động giúp người dùng đạt được mục tiêu của mình
Tôi đồng ý rằng các công ty AI lớn đang vận hành theo hướng lấy doanh thu quảng cáo làm trung tâm
AI hiện diện thường trực trong nhà gần như không thể tránh khỏi vấn đề quyền riêng tư
Giống như The Entire History of You của Black Mirror hay The Truth of Fact, the Truth of Feeling của Ted Chiang, có cảm giác rằng cuối cùng ngay cả không gian riêng tư cũng sẽ bị lấp đầy bởi giám sát
Trong dòng chảy đó, những người từ chối công nghệ như vậy có lẽ sẽ ngày càng bị đẩy ra vùng ngoại biên xã hội
Tôi không đồng ý với nhận định rằng “tương lai luôn bật là điều không thể tránh khỏi”
Cứ dùng mã nguồn mở, trả tiền cho những dịch vụ không khai thác dữ liệu và ủng hộ các startup có đạo đức là được
Tôi nghĩ cần có Mobile Linux để thay thế Android
Cá nhân chứ không phải doanh nghiệp phải là người kiểm soát hoàn toàn thiết bị và phần mềm
Đừng để mình bị mê hoặc bởi sự tiện lợi của dịch vụ miễn phí, hãy bỏ phiếu bằng tiền
Cuối cùng mọi người vẫn chọn giữ nguyên hiện trạng
“Nhận thức ngữ cảnh” rốt cuộc chỉ là một cách gọi khác của giám sát
Mọi người sẽ dần coi việc mang theo một Big Brother thu nhỏ trong túi là điều hết sức bình thường
Nhưng đa số chỉ cam chịu, rồi hài lòng với những giải pháp nhỏ lẻ ở cấp độ cá nhân
Tôi cũng từng tham gia vào các nỗ lực lập pháp về quyền riêng tư, nhưng vì công chúng thờ ơ nên cuối cùng chẳng có gì xảy ra
Ngay cả khi không có tự động hóa bằng LLM thì giám sát vẫn là hiện thực
Dù chạy local thì trợ lý luôn lắng nghe vẫn là một sự xâm phạm quyền riêng tư
Khi bạn bè tới chơi, họ sẽ thấy khó chịu khi biết rằng cuộc trò chuyện của mình có thể bị ghi lại
Nếu không có speaker diarization (phân tách người nói) thật hoàn hảo thì chẳng bao giờ có thể yên tâm với hệ thống kiểu này
Tất cả thành viên trong gia đình chia sẻ cùng một vùng nhớ, và đây vẫn là một vấn đề quyền riêng tư chưa được giải quyết
Trong tương lai họ dự định thử gắn thẻ bộ nhớ theo từng cá nhân thông qua mô hình STT dựa trên nhận diện người nói
Dù nói là sản phẩm sẽ ra mắt vào cuối năm nay, nhưng đến cả ảnh chụp sản phẩm thật cũng không có
Thiết kế website cũng sơ sài, trông như thiếu vốn
Cuối cùng tôi lo các hacker sẽ lợi dụng kiểu thiết bị này như một cỗ máy phản quảng bá quyền riêng tư
Trong quy trình làm prototype họ đã công bố ảnh thật
So với quảng cáo lộ liễu, thiên lệch gợi ý ngầm bên trong mô hình còn nguy hiểm hơn
Dù đặt cùng một câu hỏi cho ChatGPT, Claude và Perplexity thì tỷ lệ trùng nhau trong top 5 gợi ý cũng chỉ khoảng 40%
Gần như cũng không có tương quan gì với thứ hạng tìm kiếm của Google
Cuối cùng việc bạn được gợi ý sản phẩm nào lại phụ thuộc vào những quyết định nội bộ mờ đục của mô hình
Tôi không hiểu sức hấp dẫn của trợ lý AI luôn bật
Bỏ qua chuyện quyền riêng tư, tôi thấy kiểu thiết bị này sẽ làm suy yếu quyền chủ động trong cuộc sống của mình
Nếu là một trợ lý theo yêu cầu chỉ hoạt động khi cần thì còn tốt, nhưng tự động hóa quá mức có thể làm thui chột khả năng suy nghĩ của con người
Nó có thể biến thành một biển drone giám sát được gói ghém dưới cái tên “AI như một người bạn”
Thay vì cùng nhau tiến lên, ai cũng lao vào vòng quay tranh giành miếng pho mát cho riêng mình
Kịch bản châm biếm về tương tác AI kiểu “chỉ hỏi có trứng không mà hàng xóm đã cầm trứng sang tận nơi” khá thú vị
Cảnh AI được huấn luyện trên dữ liệu hội thoại dần hoàn tất luôn lời nói của con người, rồi cuối cùng chuyển sang chế độ tường thuật trong im lặng, rất ấn tượng
Thật tiếc khi bài viết không nhắc đến Anthropic
Họ đang tạo ra agent lập trình tốt nhất hiện nay và từng là cốt lõi của trợ lý OpenClaw
Loa thông minh luôn lắng nghe có rủi ro quyền riêng tư lớn hơn rất nhiều so với OpenClaw, vốn được sử dụng một cách có chủ đích