4 điểm bởi GN⁺ 2026-02-23 | 1 bình luận | Chia sẻ qua WhatsApp
  • Các công ty AI lớn đang chuyển sang mô hình kinh doanh dựa trên doanh thu quảng cáo, đồng thời phát triển trợ lý AI lấy phần cứng làm trung tâm có khả năng thu thập mọi thông tin hình ảnh và âm thanh xung quanh người dùng
  • Các AI luôn bật (Always-on) như vậy được thiết kế để nhận biết các cuộc trò chuyện hằng ngày của người dùng ngay cả khi không có từ đánh thức bằng giọng nói, tích lũy ngữ cảnh dài hạn để cung cấp hỗ trợ chủ động
  • Tuy nhiên, trong cấu trúc dữ liệu được gửi tới máy chủ của các công ty quảng cáo này, rủi ro có thể xuất hiện bất cứ lúc nào nếu chính sách bảo vệ quyền riêng tư thay đổi
  • Ngược lại, với kiến trúc suy luận cục bộ trên thiết bị (edge inference), dữ liệu về mặt vật lý không rời khỏi thiết bị, nên có thể đạt được bảo đảm an ninh ở cấp độ kiến trúc chứ không chỉ là chính sách
  • AI hữu ích nhất đồng thời cũng sẽ là công nghệ riêng tư nhất, vì vậy việc chuyển sang AI cục bộ không gửi dữ liệu ra bên ngoài là điều bắt buộc

Ngành trợ lý AI đã chuyển thành cấu trúc dựa trên quảng cáo

  • OpenAI đã đưa quảng cáo vào ChatGPT, và điều này được xem như một thay đổi mang tính cấu trúc trên toàn ngành
    • Năm 2025, OpenAI mua lại startup phần cứng io của Jony Ive với giá 6,5 tỷ USD và đang phát triển thiết bị AI nhỏ gọn không có màn hình
  • Tất cả các công ty trợ lý AI lớn đều đang vận hành bằng doanh thu quảng cáo và chế tạo phần cứng luôn quan sát môi trường xung quanh
  • Khi hai yếu tố này xung đột, chỉ có suy luận cục bộ trên thiết bị (local inference) mới được xem là lời giải duy nhất để ngăn chặn lạm dụng dữ liệu

Tính tất yếu của AI luôn bật

  • Các trợ lý giọng nói trước đây chỉ hoạt động sau từ đánh thức (wake word) như “Hey Siri”, “OK Google”
  • Nhưng trong các cuộc trò chuyện đời thường, người dùng không phải lúc nào cũng có thời gian dùng từ đánh thức, nên cần một AI nhận biết ngữ cảnh tự nhiên
  • Thế hệ trợ lý tiếp theo sẽ liên tục nhận thức môi trường của người dùng thông qua nhiều loại cảm biến như âm thanh, thị giác, phát hiện hiện diện, thiết bị đeo
  • Vì vậy, vấn đề không phải là “AI luôn bật có xuất hiện hay không”, mà là ai kiểm soát dữ liệu đó
  • Hiện nay quyền kiểm soát ấy đang nằm trong tay các công ty quảng cáo

Chính sách là lời hứa, kiến trúc là sự bảo đảm

  • Các công ty đưa ra các cam kết như “mã hóa dữ liệu”, “ẩn danh hóa”, “không liên quan đến quảng cáo”, nhưng trong cấu trúc xử lý trên đám mây thì không thể có sự tin cậy tuyệt đối
    • Người dùng phải tin vào chính sách hiện tại và tương lai của công ty, nhân viên nội bộ, nhà cung cấp bên ngoài, yêu cầu từ chính phủ, thậm chí cả các đối tác quảng cáo không được công bố
  • OpenAI tuyên bố “không bán dữ liệu cho nhà quảng cáo”, nhưng đã có tiền lệ Google sử dụng Gmail để nhắm mục tiêu quảng cáo trong suốt 13 năm
  • Chính sách có thể thay đổi, nhưng kiến trúc thì không
  • Trong kiến trúc xử lý cục bộ, dữ liệu về mặt vật lý không thể đi ra bên ngoài
    • Không thể thực hiện gọi API, telemetry từ xa hay truyền dữ liệu sử dụng đã ẩn danh
  • Luồng âm thanh và video trong gia đình còn nhạy cảm hơn email rất nhiều, vì nó bao trùm toàn bộ đời sống riêng tư của một cá nhân
  • Như trong trường hợp của Amazon, việc loại bỏ xử lý giọng nói cục bộ, kế hoạch liên kết với quảng cáo, và cho phép cơ quan thực thi pháp luật truy cập Ring cho thấy rủi ro của cấu trúc tập trung

Công nghệ suy luận biên đã trưởng thành

  • Trước đây từng có ý kiến phản đối rằng “mô hình cục bộ không đủ hiệu năng”, nhưng hiện nay đã đạt tới mức đủ dùng
  • Có thể chạy toàn bộ pipeline AI như nhận dạng giọng nói thời gian thực, ghi nhớ ngữ nghĩa, suy luận hội thoại, tổng hợp giọng nói ngay trên thiết bị trong nhà
    • Hoạt động không gây tiếng ồn quạt, chỉ cần mua phần cứng một lần, và không truyền dữ liệu ra ngoài
  • Điều này trở nên khả thi nhờ sự phát triển của nén mô hình, engine suy luận mã nguồn mở, silicon hiệu quả, và hiệu suất trên mỗi watt vẫn đang tiếp tục cải thiện qua từng năm
  • Ngay cả trong các gia đình dùng để thử nghiệm thực tế, vấn đề là độ khó trong việc hiểu ngữ cảnh, chứ không phải kích thước mô hình hay thiếu hiệu năng
  • Vì vậy cần một mô hình kinh doanh tập trung vào bán phần cứng và phần mềm,
    • trong đó nhà sản xuất phải thiết kế cấu trúc khiến họ không thể truy cập dữ liệu về mặt vật lý

Sự cần thiết của AI cục bộ và kết luận

  • AI hữu ích nhất sẽ trở thành công nghệ xử lý thông tin riêng tư nhất
  • Cách duy nhất để giữ an toàn cho điều đó là thiết kế cấu trúc khiến dữ liệu không thể được truyền ra bên ngoài
  • Không thể bảo vệ bằng chính sách, lời hứa hay thay đổi thiết lập; cần chặn ở cấp độ kiến trúc
  • Với thông điệp “Choose local. Choose edge.”, bài viết kêu gọi xây dựng AI không gửi dữ liệu ra bên ngoài

1 bình luận

 
GN⁺ 2026-02-23
Ý kiến trên Hacker News
  • Cảm thấy câu quảng bá này khá buồn cười khi sản phẩm mà công ty này giới thiệu là một thiết bị AI luôn bật, luôn lắng nghe
    Dù chỉ chạy trên phần cứng cục bộ thì cũng không có nghĩa là mọi khoảnh khắc trong cuộc sống của chúng ta đều cần bị ghi âm và phân tích
    Nếu cả những cuộc trò chuyện riêng tư của gia đình hay những khoảnh khắc của trẻ vị thành niên cũng bị lưu lại thì liệu có ổn không, điều đó khiến tôi nghi ngại
    Tôi lo không biết họ đã xin sự đồng ý của khách tới nhà chưa, và liệu đảm bảo quyền riêng tư có còn được giữ vững khi xảy ra trộm cắp, có lệnh khám xét từ chính phủ, hoặc khi công ty bị mua bán sáp nhập hay không

    • Vấn đề cốt lõi về mặt pháp lý là một khi thông tin đã tồn tại thì nó có thể bị truy cập
      Nếu tòa án ra lệnh thì dưới hình thức nào đó, thông tin cũng buộc phải bị giao nộp
      Muốn giữ quyền riêng tư thực sự thì tốt nhất là thông tin đó ngay từ đầu không nên tồn tại
      Tôi mong luật pháp sẽ được xây dựng theo hướng bảo vệ dữ liệu như thông tin trong não bộ của mỗi cá nhân, nhưng thực tế lại đang đi theo chiều ngược lại
    • Tôi nhìn nhận tích cực nếu những thiết bị như vậy có thể hoạt động như một công cụ hỗ trợ trí nhớ cho con người
      Tuy nhiên, nếu thông tin có thể bị đưa ra ngoài mà không có sự cho phép của tôi, bị trích xuất dễ dàng bằng phương tiện vật lý, hoặc ai đó có thể mạo danh tôi để truy cập, thì hoàn toàn không thể chấp nhận được
      Nếu đáp ứng được các điều kiện đó thì tôi nghĩ nó cũng sẽ không xâm phạm quyền riêng tư của người khác
    • Marketing của sản phẩm này tạo cảm giác khá kỳ lạ
      Họ nhắm tới những người coi trọng quyền riêng tư, nhưng chính nhóm đó lại là những người sẽ chỉ ra các vấn đề này đầu tiên
      Rốt cuộc, những người không quan tâm nhiều đến quyền riêng tư thì sẽ cứ dùng Google hay các dịch vụ tương tự
    • Trên thực tế, rất có thể thiết bị kiểu này không lưu toàn bộ hội thoại mà chỉ xử lý bằng ASR (nhận dạng giọng nói tự động) rồi thực thi những lệnh cần thiết
      Tôi cũng từng muốn làm một thiết bị AI chỉ chạy local nhưng lười nên cứ để đó
      Dù vậy, tôi nghĩ các thiết bị như thế có thể hữu ích đến mức thay đổi cuộc sống với những người đa dạng thần kinh (neurodiverse)
    • Thực ra trong phần mô tả sản phẩm không hề ghi rõ là nó lưu các cuộc trò chuyện
      Có vẻ nó được thiết kế để xử lý theo thời gian thực rồi chỉ thực hiện những hành động giúp người dùng đạt được mục tiêu của mình
  • Tôi đồng ý rằng các công ty AI lớn đang vận hành theo hướng lấy doanh thu quảng cáo làm trung tâm
    AI hiện diện thường trực trong nhà gần như không thể tránh khỏi vấn đề quyền riêng tư
    Giống như The Entire History of You của Black Mirror hay The Truth of Fact, the Truth of Feeling của Ted Chiang, có cảm giác rằng cuối cùng ngay cả không gian riêng tư cũng sẽ bị lấp đầy bởi giám sát
    Trong dòng chảy đó, những người từ chối công nghệ như vậy có lẽ sẽ ngày càng bị đẩy ra vùng ngoại biên xã hội

  • Tôi không đồng ý với nhận định rằng “tương lai luôn bật là điều không thể tránh khỏi”
    Cứ dùng mã nguồn mở, trả tiền cho những dịch vụ không khai thác dữ liệu và ủng hộ các startup có đạo đức là được
    Tôi nghĩ cần có Mobile Linux để thay thế Android
    Cá nhân chứ không phải doanh nghiệp phải là người kiểm soát hoàn toàn thiết bị và phần mềm
    Đừng để mình bị mê hoặc bởi sự tiện lợi của dịch vụ miễn phí, hãy bỏ phiếu bằng tiền

    • Dù có thể kiểm soát hoàn toàn như Android đã root, người dùng phổ thông vẫn sẽ thấy bất tiện vì các ứng dụng thiết yếu như app ngân hàng không chạy
    • Mobile Linux thực ra đã tồn tại, nhưng số thiết bị được hỗ trợ ít và hiệu năng kém
      Cuối cùng mọi người vẫn chọn giữ nguyên hiện trạng
  • “Nhận thức ngữ cảnh” rốt cuộc chỉ là một cách gọi khác của giám sát
    Mọi người sẽ dần coi việc mang theo một Big Brother thu nhỏ trong túi là điều hết sức bình thường

    • Thực ra giờ ai cũng đang nói về chuyện giám sát
      Nhưng đa số chỉ cam chịu, rồi hài lòng với những giải pháp nhỏ lẻ ở cấp độ cá nhân
      Tôi cũng từng tham gia vào các nỗ lực lập pháp về quyền riêng tư, nhưng vì công chúng thờ ơ nên cuối cùng chẳng có gì xảy ra
    • Các công ty marketing từ lâu đã có quyền truy cập vào khối dữ liệu người dùng khổng lồ
      Ngay cả khi không có tự động hóa bằng LLM thì giám sát vẫn là hiện thực
  • Dù chạy local thì trợ lý luôn lắng nghe vẫn là một sự xâm phạm quyền riêng tư
    Khi bạn bè tới chơi, họ sẽ thấy khó chịu khi biết rằng cuộc trò chuyện của mình có thể bị ghi lại
    Nếu không có speaker diarization (phân tách người nói) thật hoàn hảo thì chẳng bao giờ có thể yên tâm với hệ thống kiểu này

    • Theo blog kỹ thuật của Juno Labs, hiện họ đang thử nghiệm cấu trúc bộ nhớ theo gia đình
      Tất cả thành viên trong gia đình chia sẻ cùng một vùng nhớ, và đây vẫn là một vấn đề quyền riêng tư chưa được giải quyết
      Trong tương lai họ dự định thử gắn thẻ bộ nhớ theo từng cá nhân thông qua mô hình STT dựa trên nhận diện người nói
    • Tôi tự hỏi liệu có thể xử lý dữ liệu ở dạng được mã hóa sao cho con người không thể đọc được hay không
  • Dù nói là sản phẩm sẽ ra mắt vào cuối năm nay, nhưng đến cả ảnh chụp sản phẩm thật cũng không có
    Thiết kế website cũng sơ sài, trông như thiếu vốn
    Cuối cùng tôi lo các hacker sẽ lợi dụng kiểu thiết bị này như một cỗ máy phản quảng bá quyền riêng tư

    • Họ nói bản đầu tiên sẽ làm prototype bằng in 3D và sản xuất PCB số lượng nhỏ
      Trong quy trình làm prototype họ đã công bố ảnh thật
    • Nếu họ đang hoàn thiện thiết kế và sản xuất ngoài Trung Quốc thì khả năng cao bản phát hành đầu sẽ bị trì hoãn hoặc chỉ là bản alpha
    • Có vẻ cuối cùng nó sẽ trở thành vaporslop (sản phẩm chỉ có hơi và cảm giác)
  • So với quảng cáo lộ liễu, thiên lệch gợi ý ngầm bên trong mô hình còn nguy hiểm hơn
    Dù đặt cùng một câu hỏi cho ChatGPT, Claude và Perplexity thì tỷ lệ trùng nhau trong top 5 gợi ý cũng chỉ khoảng 40%
    Gần như cũng không có tương quan gì với thứ hạng tìm kiếm của Google
    Cuối cùng việc bạn được gợi ý sản phẩm nào lại phụ thuộc vào những quyết định nội bộ mờ đục của mô hình

    • Cũng có phản hồi rằng “mỗi LLM gợi ý khác nhau” thì rốt cuộc có khác gì “mỗi người một ý” đâu
  • Tôi không hiểu sức hấp dẫn của trợ lý AI luôn bật
    Bỏ qua chuyện quyền riêng tư, tôi thấy kiểu thiết bị này sẽ làm suy yếu quyền chủ động trong cuộc sống của mình
    Nếu là một trợ lý theo yêu cầu chỉ hoạt động khi cần thì còn tốt, nhưng tự động hóa quá mức có thể làm thui chột khả năng suy nghĩ của con người

    • Cuối cùng có người đùa rằng con người thật ra chỉ muốn một cuộc sống kiểu Downton Abbey không cần người hầu là con người
    • Giống như trong phim WALL·E, con người cuối cùng vẫn là loài nghiêng về phía tiện lợi
    • Có ý kiến cho rằng sự cô đơn trong xã hội phương Tây tạo ra nhu cầu cảm xúc cho những sản phẩm kiểu này
      Nó có thể biến thành một biển drone giám sát được gói ghém dưới cái tên “AI như một người bạn”
    • AI là một công nghệ đáng kinh ngạc, nhưng dạo này có quá nhiều kiểu nhét AI vào mọi thứ như thể đang đi tìm lời giải cho những vấn đề vốn không tồn tại
    • Cuối cùng chính logic cạnh tranh và sở hữu đã khuếch đại xu hướng này
      Thay vì cùng nhau tiến lên, ai cũng lao vào vòng quay tranh giành miếng pho mát cho riêng mình
  • Kịch bản châm biếm về tương tác AI kiểu “chỉ hỏi có trứng không mà hàng xóm đã cầm trứng sang tận nơi” khá thú vị
    Cảnh AI được huấn luyện trên dữ liệu hội thoại dần hoàn tất luôn lời nói của con người, rồi cuối cùng chuyển sang chế độ tường thuật trong im lặng, rất ấn tượng

    • Có phản hồi bảo hãy viết nó thành truyện ngắn
    • Rồi lại có câu đùa rằng “Apple đã mua đống dữ liệu vi biểu cảm đó với giá 2 tỷ USD”
    • Cụm “vodka hết hạn” tạo cảm giác như một biểu tượng của enshittification
  • Thật tiếc khi bài viết không nhắc đến Anthropic
    Họ đang tạo ra agent lập trình tốt nhất hiện nay và từng là cốt lõi của trợ lý OpenClaw

    • Mistral cũng đang tích cực phát triển trợ lý AI, dù hiện tại thành quả vẫn chưa nhiều
    • Chúng tôi tập trung vào trợ lý AI dựa trên phần cứng
      Loa thông minh luôn lắng nghe có rủi ro quyền riêng tư lớn hơn rất nhiều so với OpenClaw, vốn được sử dụng một cách có chủ đích