1 điểm bởi GN⁺ 2023-12-16 | 1 bình luận | Chia sẻ qua WhatsApp

Sự hoài nghi đối với các tính năng AI mới của Dropbox

  • Dropbox đã bổ sung các tính năng AI mới.
  • Các tính năng này vấp phải chỉ trích vì gửi dữ liệu tới OpenAI.
  • Dropbox phủ nhận việc các tệp cá nhân được dùng làm dữ liệu huấn luyện cho mô hình.

Những chi tiết quan trọng

  • Dropbox có một tài liệu nêu rõ nguyên tắc không sử dụng dữ liệu khách hàng để huấn luyện mô hình AI nếu chưa có sự đồng ý của khách hàng.
  • Có một ô chọn bị ẩn trong phần cài đặt, khiến việc người dùng có thực sự đồng ý hay không trở nên không rõ ràng.

Những người không tin OpenAI

  • OpenAI, đối tác bên thứ ba của Dropbox, tuyên bố không sử dụng dữ liệu cho việc huấn luyện mô hình nội bộ và sẽ xóa dữ liệu trong vòng 30 ngày.
  • Mọi người không tin tuyên bố của OpenAI và đang trải qua một cuộc khủng hoảng niềm tin đối với AI.

Facebook không nghe lén bạn qua micro

  • Thuyết cho rằng Facebook nghe lén qua micro của người dùng rồi hiển thị quảng cáo có thể dễ dàng bị bác bỏ cả về mặt kỹ thuật lẫn phi kỹ thuật.
  • Tuy nhiên, mọi người vẫn không tin điều đó dựa trên chính trải nghiệm của họ.

Điều này thực sự quan trọng

  • Niềm tin là điều quan trọng, và việc một công ty nói dối về cách xử lý dữ liệu cá nhân là một cáo buộc nghiêm trọng.
  • Vai trò của chính phủ là bảo đảm những chuyện như vậy không xảy ra.

Những gì chúng ta có thể làm

  • Các phòng thí nghiệm AI lớn có thể cải thiện niềm tin bằng cách chia sẻ thông tin về dữ liệu huấn luyện.
  • Các tương tác với ChatGPT được dùng để cải thiện mô hình, nhưng vẫn thiếu chi tiết về cách chúng được sử dụng.

Cơ hội cho các mô hình cục bộ

  • Mọi người tin tưởng hơn vào các mô hình cục bộ chạy trên thiết bị của chính họ thay vì trên đám mây.
  • Chất lượng của các mô hình cục bộ đang được cải thiện và kích thước của chúng cũng đang giảm xuống.

Ý kiến của GN⁺

  • Giao điểm giữa AI và quyền riêng tư là một vấn đề quan trọng, và cần có những cuộc đối thoại minh bạch về nó.
  • Sự hoài nghi đối với các tuyên bố của Dropbox và OpenAI bắt nguồn từ việc thiếu hiểu biết về công nghệ và sự thiếu hụt niềm tin.
  • Bài viết này nhấn mạnh tốc độ phát triển nhanh của công nghệ AI cùng tầm quan trọng đi kèm của quyền riêng tư, đồng thời tạo sức hút khi giải thích vì sao cần có giao tiếp minh bạch dựa trên sự thấu hiểu và niềm tin.

1 bình luận

 
GN⁺ 2023-12-16
Ý kiến Hacker News
  • Ảnh chụp màn hình được chụp trực tiếp từ tài khoản của tôi. Nó được đặt là 'bật', nhưng tôi không tự bật nó.

    • Liên quan đến quyền riêng tư trên website, còn có cả khủng hoảng về mặt 'sự đồng ý'. Cần có một định nghĩa về sự đồng ý có hiệu lực pháp lý, và điều đó không nên đồng nghĩa với việc người dùng phải chủ động đồng ý cho dữ liệu của họ được chuyển cho bên thứ ba. Đây là một bài viết hay, nhưng phép so sánh giữa 'điện thoại của tôi đang nghe lén tôi' và 'OpenAI có thể đang nói dối về cách họ sử dụng dữ liệu của tôi' có phần khiếm khuyết. Việc kiểm soát chặt chẽ các ứng dụng bên thứ ba truy cập microphone trên iPhone không tương đương với việc dữ liệu được chuyển cho bên thứ ba. Với người bình thường thì có thể là như nhau, nhưng trên thực tế chúng ta đang được bảo vệ khỏi vế đầu. Hành xử như thể cuộc chiến vì quyền riêng tư và chủ quyền dữ liệu của người dùng đã thua từ lâu là cực kỳ phản tác dụng. Tôi thấy khá nhiều người tương đối rành công nghệ phản ứng trước các hành vi lạm dụng mới của doanh nghiệp kiểu như 'chuyện cũ rồi'. Những người này đáng lẽ phải làm gương tốt hơn. Sự bất lực đó làm xói mòn lòng tin, và không tạo được cảm giác rằng một thế giới tốt đẹp hơn là điều có thể. Sai lầm của Dropbox dường như là hệ quả quay ngược của lối suy nghĩ này: họ cho rằng người dùng sẽ không bận tâm nếu chúng ta gửi các tệp riêng tư của họ cho bên thứ ba mà không hỏi trước. Tôi đã rút phần lớn dữ liệu khỏi Dropbox rồi, và hôm qua cảm thấy cần phải hủy Dropbox lần cuối. Cảm ơn nhé, Dropbox!
  • Bài này có phần ngây thơ và tạo cảm giác 'giả định thiện chí'. Hãy nhìn những gì đã xảy ra ngoài lĩnh vực AI trong 10 năm qua: ai cũng đang ngấu nghiến dữ liệu như một kẻ tích trữ cưỡng chế. Không chỉ Google và Facebook mà là tất cả mọi người. Hôm nay tôi phát hiện một microsite về món ăn truyền thống Thụy Điển còn thêm video tự phát, banner xin chấp thuận cookie với dark pattern, v.v. Gần như mọi app/site mới đều được xây quanh trục kinh tế này. Rồi đúng lúc LLM bắt đầu mạnh lên thì đột nhiên có một đợt phong tỏa phối hợp đối với API bên thứ ba. Giờ chúng ta có ChatGPT/OpenAI và các đối thủ của họ. Nếu những tay chơi khác ăn dữ liệu như bữa ăn khuya bí mật, thì thế hệ AI hiện tại giống như lũ zombie nhanh nhẹn đang thèm khát máu và não. Một phần vì dữ liệu giữ vai trò trực tiếp hơn trong sản phẩm, nhưng cũng vì tâm lý cạnh tranh kiểu tàu cường điệu VC công nghệ điển hình lần đầu tiên tỉnh giấc sau nhiều thập kỷ. Mọi thứ đều chỉ về kiểu zombie apocalypse/cơn sốt đào vàng/xin lỗi sau, v.v. Vì vậy tôi thực sự tin rằng đó là lý do họ (tất cả họ) tập trung mạnh hơn vào lời lẽ về an toàn/trách nhiệm. Họ đang tích sẵn đạn dược để làm đục nước trước khi khủng hoảng PR về danh tiếng chắc chắn ập tới. Trong khi đó, giới kỹ sư chúng ta lại lững thững như thể chưa sống trọn 10 năm vừa qua, và lần này lại nghĩ sẽ khác vì AI có nền tảng học thuật, vì những công ty hào nhoáng mới, vì các khẩu hiệu an toàn, vì những phát ngôn edgy trên Twitter của các founder 'đứng vững trên mặt đất'. Tôi không biết chính xác chuyện gì đang diễn ra, nhưng tôi đã biết con người vận hành ra sao đủ lâu rồi. Và họ không hề khá hơn.

  • Tôi nghĩ bài viết của bạn đang bỏ qua các vấn đề quyền riêng tư vượt ra ngoài chuyện huấn luyện trên dữ liệu của tôi.

    • Với tư cách một người làm nghề chuyên môn, tôi có khách hàng tuân thủ các thỏa thuận bảo mật và quy định về việc thông tin của tôi đi đâu. Tôi thích các dịch vụ nơi dữ liệu của tôi ở lại trên server của họ. Tôi không hiểu tại sao dữ liệu của tôi lúc nào cũng không được mã hóa hoàn toàn để chỉ mình tôi có thể xem, nhưng việc nó bị gửi qua Internet sang công ty khác để xử lý mà không có sự đồng ý hay quan tâm của tôi là điều kinh khủng. Khi dùng tính năng AI thì tôi đồng ý, nhưng gửi các tệp riêng tư của tôi ra toàn Internet mà không có sự đồng ý của tôi thì thật điên rồ. Thành thật mà nói, OneDrive có công cụ migration, và tôi đã nhận bản dùng thử Dropbox Business rồi đêm qua tự động chuyển toàn bộ tệp sang. Đây là giọt nước tràn ly cuối cùng về việc công ty này cứ tiếp tục làm những thứ tôi không yêu cầu, và không cung cấp tính năng tôi liên tục yêu cầu... mã hóa đầu cuối. Nếu bạn muốn migration từ Dropbox Business sang tài khoản Office 365 OneDrive chỉ với vài cú nhấp chuột, đây nhé: [liên kết công cụ migration]
  • Vấn đề cốt lõi ở đây là mọi người lo rằng các tệp riêng tư trên Dropbox đang được dùng cho OpenAI để huấn luyện mô hình.

    • Đó chỉ là một phần của vấn đề. Tôi không muốn dữ liệu của mình bị gửi đi bất cứ đâu trừ khi tôi phê duyệt. Trong trường hợp này, chúng ta không có lý do gì để nghi ngờ điều họ nói rằng OpenAI sẽ không dùng tệp của chúng ta để huấn luyện, nhưng chúng ta vẫn phải tin rằng họ có thể xử lý tệp của chúng ta một cách an toàn.
  • Facebook nói rằng họ không làm điều này. Nếu bị bắt quả tang nói dối, rủi ro đối với danh tiếng của họ sẽ là cực lớn.

    • Tôi không tin Facebook đang lén nghe qua microphone điện thoại của ai đó, nhưng lập luận cụ thể ấy hoàn toàn không thuyết phục. Danh tiếng của Facebook, ít nhất là trong nhóm người bình thường không rành công nghệ mà tôi biết, đã ở mức tệ nhất rồi. Tôi sống ở Mỹ, và mọi người biết Facebook đã góp phần kích động cuộc bạo loạn ngày 6 tháng 1 năm 2021, rồi sau đó né mọi trách nhiệm và chẳng sửa được gì. Thiệt hại danh tiếng mà họ có thể gánh thêm từ việc này, điều mà nhiều người vốn đã nghĩ là có lẽ họ đang làm, là không đáng kể để so sánh.
  • Trong bài, khía cạnh lòng tin đối với microphone có vẻ là một red herring làm phân tán khỏi điểm chính vốn có thể được nêu rõ hơn.

    • Facebook lấy dữ liệu của bạn từ ứng dụng của họ và từ Internet để theo dõi hành vi của bạn trên mạng, rồi đưa dữ liệu này vào <i>mô hình</i> của họ. Những mô hình đó đôi khi chính xác đến mức gần như dự đoán được bạn đang nghĩ gì. Vì thế người bình thường đi đến kết luận rằng hẳn họ phải đang nghe lén qua microphone. Các công ty LLM như OpenAI và các đối tác của họ dùng gần như chính xác các loại mô hình như vậy. Họ lấy dữ liệu ở bất cứ đâu họ muốn để cải thiện mô hình, để khiến bạn tiếp tục nhấp vào chỗ họ muốn bạn nhấp, và để kiếm tiền từ bạn.
  • Tôi không 'tin' OpenAI hay bất kỳ tập đoàn lớn nào về những gì họ nói họ đã làm, sẽ làm, hoặc đang làm.

    • Nhưng tôi tin OpenAI không dùng dữ liệu từ Dropbox để <i>huấn luyện</i> mà không có sự đồng ý của người dùng. Tuy nhiên, đó không phải vấn đề ở đây. Vấn đề phát sinh khi dữ liệu di chuyển; bạn đang gửi dữ liệu cho bên thứ ba thực sự có thể đọc được nó, có thể có nhân viên xấu mà Dropbox không kiểm soát được, dữ liệu có thể xuất hiện trong log hoặc bị xử lý theo các chính sách khác. Nếu tôi gửi dữ liệu cá nhân cho Dropbox, họ không được phép gửi nó cho bất kỳ bên thứ ba nào vì bất kỳ lý do gì nếu không có sự đồng ý rõ ràng và đầy đủ thông tin của tôi. Tôi không hiểu sao điều này lại còn gây tranh cãi. Nếu Dropbox muốn tự lưu mô hình và cung cấp tìm kiếm RAG cho những người dùng đồng ý thì đó là một chuyện. Nếu Dropbox lặng lẽ gửi toàn bộ dữ liệu của mọi người dùng cho bên thứ ba mà không báo trước cho bất kỳ ai thì đó là một chuyện khác. Thật kinh khủng.
  • Khủng hoảng niềm tin với AI ư?

    • Chuyện gì xảy ra sau khi nghe tin hội đồng quản trị/CEO của một công ty bị sa thải/thay thế vì bị cáo buộc nói dối hoặc thao túng? Nếu Dropbox quét dữ liệu người dùng và thu được dữ liệu phái sinh từ đó, thì dữ liệu 'phái sinh' đó không còn là 'dữ liệu người dùng' nữa mà trở thành dữ liệu của Dropbox và có thể được chia sẻ. Nó có thể mang tính thống kê, không trực tiếp gắn với từng người dùng riêng lẻ, nhưng chẳng phải đó chính là dữ liệu huấn luyện sao? Chẳng phải đó là cách nó hoạt động sao? Đó không phải nói dối mà là lách chữ nghĩa. Không, đó là hành vi phi đạo đức, và đã trở thành chuẩn mực với các tập đoàn lớn.
  • Tôi nghĩ những người không tin các công ty AI có lẽ cũng có cảm xúc tương tự với các công ty ở nhiều ngành khác nhau, các tổ chức phi lợi nhuận, thậm chí cả cơ quan chính phủ.

    • Với tôi, có vẻ đây là một vấn đề lòng tin lớn hơn rất nhiều, vượt ra ngoài các công ty dựa trên AI. Vì vậy việc lĩnh vực cụ thể này cố chống lại sự mất niềm tin đến từ mọi mặt dường như là một nhiệm vụ bất khả thi, vượt ngoài phạm vi của chính các doanh nghiệp đó. Tôi không chắc câu trả lời cho vấn đề này là gì, liệu có một vấn đề thực sự ở đây hay không, hay nếu sự hoài nghi tràn lan này lan sang mọi thứ và mọi người thì chúng ta sẽ đi về đâu. Có lẽ chúng ta chỉ đơn giản bị nguyền phải sống trong những thời đại thú vị mà thôi.