2 điểm bởi GN⁺ 2025-06-05 | 1 bình luận | Chia sẻ qua WhatsApp
  • Do lệnh của tòa án, OpenAI phải lưu giữ mọi nhật ký người dùng ChatGPT, bao gồm cả các cuộc trò chuyện đã xóa, và OpenAI phản bác rằng biện pháp này là xâm phạm quyền riêng tư nghiêm trọng
  • OpenAI cho rằng lệnh này được ban hành ngay lập tức mà không có đủ căn cứ, theo yêu cầu bảo toàn chứng cứ từ các hãng tin trong một vụ kiện bản quyền
  • OpenAI cảnh báo rằng lệnh này buộc công ty phải lưu giữ dữ liệu cá nhân của hàng trăm triệu người dùng và cả dữ liệu bí mật của doanh nghiệp, kéo theo nguy cơ vi phạm các quy định quyền riêng tư toàn cầu và gánh nặng kỹ thuật
  • Sau khi lệnh có hiệu lực, ngay cả các cuộc trò chuyện đã xóa và trò chuyện tạm thời cũng bị ép lưu vĩnh viễn, làm dấy lên lo lắng và bất an mạnh mẽ trên mạng xã hội
  • OpenAI một lần nữa yêu cầu hủy bỏ lệnh để bảo vệ quyền kiểm soát dữ liệuquyền riêng tư của người dùng, đồng thời tuyên bố sẽ tiếp tục đấu tranh pháp lý

OpenAI phản đối lệnh lưu giữ dữ liệu “mang tính cá nhân nghiêm trọng”

Bối cảnh lệnh của tòa và các điểm tranh cãi chính

  • OpenAI đã phản đối trước tòa để bảo vệ quyền riêng tư của hàng triệu người dùng ChatGPT, đồng thời phản ứng mạnh với lệnh lưu toàn bộ nhật ký người dùng, bao gồm cả các cuộc trò chuyện đã xóa và hội thoại API
  • Lệnh này được ban hành trong quá trình vụ kiện vi phạm bản quyền, sau khi phía các hãng tin cho rằng OpenAI đang hủy chứng cứ; OpenAI chỉ ra rằng quyết định này được đưa ra vội vàng mà không có đủ xác minh thực tế hay giải trình
  • Phía nguyên đơn cho rằng khi dùng ChatGPT để truy cập vòng qua các bài báo trả phí, người dùng có thể xóa cuộc trò chuyện để xóa dấu vết, nhưng không có bằng chứng nào thực sự được đưa ra để chứng minh lập luận đó
  • Dựa trên giả định này, tòa án đã ra lệnh cho OpenAI từ nay phải lưu riêng mọi nhật ký hội thoại (bao gồm cả phần đã xóa), và OpenAI cảnh báo biện pháp này làm tăng nguy cơ xâm phạm quyền kiểm soát dữ liệu của người dùng cũng như vi phạm luật quyền riêng tư toàn cầu

Lập luận của OpenAI và phản ứng pháp lý

  • OpenAI nhấn mạnh rằng lệnh bảo toàn lần này có phạm vi rộng bất thường, xâm phạm quyền riêng tư của người dùng, và người dùng phải có quyền tự quyết việc dữ liệu của họ được lưu giữ khi nào và bằng cách nào
  • Trước khi có lệnh của tòa, nếu người dùng tự xóa cuộc trò chuyện hoặc sử dụng tính năng trò chuyện tạm thời, dữ liệu đó sẽ được xóa hoàn toàn khỏi hệ thống trong vòng 30 ngày
  • Tuy nhiên, lệnh lần này khiến công ty phải cưỡng chế lưu cả mọi yêu cầu xóa lẫn các cuộc trò chuyện tạm thời, dẫn tới việc dữ liệu cá nhân của hàng trăm triệu người dùng và dữ liệu API doanh nghiệp (bao gồm thông tin bí mật) bị lưu giữ dài hạn
  • Ngoài lo ngại về quyền riêng tư, OpenAI còn chỉ ra rằng việc thực thi lệnh sẽ tiêu tốn nguồn lực kỹ thuật và chi phí rất lớn, đồng thời cho rằng thiệt hại đối với OpenAI và người dùng lớn hơn nhiều so với lợi ích mang tính suy đoán mà phía các hãng tin nêu ra
  • OpenAI đã đề nghị tổ chức phiên điều trần bằng lời và yêu cầu hủy lệnh (hủy bỏ ngay lập tức)

Phản ứng của người dùng và ngành

  • Khi thông tin về việc thi hành lệnh được công bố, rất nhiều người dùng và khách hàng doanh nghiệp đã bày tỏ sự bất an trên mạng xã hội (LinkedIn, X, v.v.)
  • Một số chuyên gia cảnh báo rằng lệnh này có thể trở thành vi phạm hợp đồng nghiêm trọng đối với mọi khách hàng doanh nghiệp của OpenAI, và các công ty xử lý dữ liệu bí mật qua API sẽ đối mặt với rủi ro bảo mật lớn hơn
  • Trên mạng xã hội, nhiều ý kiến lan truyền như “mọi dịch vụ AI thông qua OpenAI đều đã bị đặt dưới mối đe dọa về quyền riêng tư” hay “nên chuyển sang các dịch vụ thay thế (Mistral AI, Google Gemini, v.v.)”
  • Một chuyên gia bảo mật đánh giá rằng “kiểu lệnh như thế này là rủi ro an ninh không thể chấp nhận
  • Cũng xuất hiện chỉ trích như: “Thẩm phán Wang cho rằng lập luận bản quyền của NYT quan trọng hơn quyền riêng tư của mọi người dùng OpenAI — thật điên rồ”

Chính sách của OpenAI và triển vọng sắp tới

  • Trước đây, OpenAI đã tuân thủ nghiêm ngặt chính sách lưu giữ dữ liệu người dùng và xóa toàn bộ lịch sử trò chuyện trong vòng 30 ngày khi tài khoản bị xóa
  • Vì lệnh của tòa, quy trình quản lý và xóa dữ liệu hiện có đã bị vô hiệu hóa gần như ngay lập tức, và người dùng hiện khó có thể tiếp tục tin tưởng rằng dữ liệu của mình sẽ được xóa an toàn
  • OpenAI cho biết sẽ tiếp tục đấu tranh pháp lý và chủ động làm rõ tính bất hợp lý của lệnh cũng như những thiệt hại thực tế mà nó gây ra

1 bình luận

 
GN⁺ 2025-06-05
Ý kiến trên Hacker News
  • Có ý kiến lưu ý rằng rủi ro tương tự cũng tồn tại khi dùng mô hình GPT qua API

    OpenAI cho biết rủi ro này mở rộng tới cả người dùng ChatGPT Free, Plus, Pro và cả người dùng API
    Tình huống này được cho là cực kỳ bất lợi cho hoạt động kinh doanh của OpenAI

    • Có người cho rằng đây sẽ sớm là vấn đề mà mọi công ty AI đều phải đối mặt
      Trừ khi mọi thứ chuyển sang môi trường tự host mô hình trực tiếp, còn với mô hình kinh doanh kiểu SaaS thì thực tế là việc bảo vệ quyền riêng tư của người dùng không được coi trọng đến mức lớn khi xét tới lợi nhuận
      Thành thật mà nói, phần lớn mọi người đã quen với thực tế rằng trên Internet gần như không còn quyền riêng tư
      Tuy vậy, các doanh nghiệp hoặc cá nhân giao phó mã nguồn đóng hay dữ liệu liên quan đến bảo mật dựa trên niềm tin chắc chắn sẽ chịu ảnh hưởng nặng nề
      Nhưng cũng có quan điểm rằng ngay từ đầu những phần như vậy vốn không nên thuê ngoài cho bất kỳ nhà cung cấp nào

    • Các công ty đã ổn định hoạt động cần xem lại các hợp đồng hiện có, quy định và mức chấp nhận rủi ro sau vụ việc này
      Các startup dạng wrapper xây trên ChatGPT cũng cần rà soát lại chính sách quyền riêng tư và nói rõ rằng người dùng đang phải từ bỏ quyền riêng tư của mình

    • Tất cả các tích hợp GPT mà tôi từng triển khai đều thông qua dịch vụ Azure vì có nghĩa vụ theo hợp đồng là không được huấn luyện bằng dữ liệu của tôi
      Theo hiểu biết của tôi thì dịch vụ Azure, tức là Microsoft, không bị áp dụng phán quyết lần này

    • Nếu bạn làm việc với mã độc quyền, thì ngay từ đầu đã không nên dùng cloud LLM, và vụ việc này chỉ khiến điều đó trở nên rõ ràng hơn

    • Trước câu hỏi vì sao việc này lại gây hại cho kinh doanh, có ý kiến nhấn mạnh đây là biện pháp lưu trữ dữ liệu để phòng rủi ro pháp lý chứ không phải nhằm phục vụ huấn luyện
      Cũng có thể ghi rõ trong hợp đồng với các công ty khác rằng dữ liệu sẽ không được dùng để huấn luyện

  • Có thể xem bài viết nền chi tiết hơn ở đây

    • Đây mới là nguồn tài liệu thực sự
      Có lẽ nên cập nhật liên kết sang bài này

    • Có người giới thiệu phần bình luận dưới bài báo vì bầu không khí khá hài hước
      Nó mang tính châm biếm khi khắc họa những người ủng hộ bản quyền như phe phản AI
      Cá nhân tôi không thích thái độ ngạo mạn của OpenAI với nội dung của người khác, nhưng đồng thời cũng khó đồng cảm với việc các chủ sở hữu bản quyền đưa ra yêu cầu quá mức
      Vấn đề AI tạo sinh và huấn luyện cho thấy rất rõ những yếu tố lỗi thời trong luật sở hữu trí tuệ hiện hành
      Trong tương lai chắc chắn cần thay đổi, nhưng sự thay đổi đó không nên chỉ có lợi cho các tập đoàn lớn hay người giàu mà phải hữu ích với người bình thường

    • Dù nhìn chung có quan điểm phê phán việc LLM xâm phạm bản quyền, vẫn có người thấy cách triển khai lập luận trong phán quyết lần này hơi kỳ lạ
      Có ý kiến rằng thẩm phán đưa ra tình huống giả định: một người dùng nào đó dùng ChatGPT để vượt paywall và trích xuất nội dung của New York Times, rồi sau khi biết về vụ việc lại yêu cầu xóa toàn bộ lịch sử mà mình đã xuất ra, như vậy chẳng phải là né tránh tinh thần của phán quyết sao
      Thực ra khi nghe có một phán quyết như vậy, người dùng chẳng phải sẽ thận trọng hơn trong khoảng thời gian đó hay sao

    • Có ý kiến chỉ trích rằng giờ đây ngay cả khi người dùng xóa lịch sử trò chuyện hoặc dùng tính năng Temporary Chat, OpenAI vẫn phải giữ log theo lệnh pháp lý, vậy điều này khác gì lịch sử trình duyệt web thông thường
      Nếu Safari cũng bị buộc phải lưu lại cả lịch sử người dùng đã xóa thì còn hiểu được, nhưng không rõ vì sao chỉ OpenAI lại bị cưỡng chế đặc biệt như vậy

  • Có người đưa ra liên kết bài báo tốt hơn trong thread
    Đây là link bài gốc trên Ars Technica
    Và nói thêm rằng nên tham khảo bài báo có thông tin thực tế thay vì chỉ một bài đăng Mastodon đơn thuần

  • Gần đây trên Hacker News có khá nhiều bài viết mang tính quan điểm cá nhân bàn về ưu nhược điểm của LLM, nhưng lại có xu hướng hoàn toàn không nhắc đến vấn đề quyền riêng tư
    Lý do cốt lõi khiến tôi không dùng LLM hoặc không dán mã nguồn vào cửa sổ prompt là vì quyền riêng tư
    Công ty chúng tôi chịu các quy định của chính phủ như NDA và ITAR, nên chỉ cần mã nguồn đi ra ngoài máy chủ là đã vi phạm ngay
    Vụ việc lần này cho thấy quyền riêng tư chính là gót chân Achilles của LLM
    Trước khi LLM trở nên phổ biến theo dạng on-premises thì sẽ không thể thoát khỏi vấn đề này

    • Vì vẫn có cách tự host LLM trên máy chủ của mình, nên với những băn khoăn như vậy thì mô hình hoàn toàn tự quản mới là đáp án đúng
      Có thể tự xây dựng LLM một cách rất dễ dàng và đơn giản
  • Việc OpenAI buộc phải lưu dữ liệu trên máy chủ sẽ dẫn tới tình huống đội ngũ pháp lý của các công ty đang kiện có thể xem được lịch sử hội thoại giữa người dùng và ChatGPT trong quá trình Discovery
    Ví dụ, luật sư của NYT có thể đọc các cuộc trò chuyện riêng tư của đương sự như tài liệu chứng cứ trước tòa

    • Có ý kiến cho rằng giải pháp có thể là lưu log hội thoại ở dạng ẩn danh
      OpenAI về mặt kỹ thuật hoàn toàn có thể thực hiện việc ẩn danh hóa, và đây có vẻ là cách giải quyết tối ưu

    • Dữ liệu kiểu này có thể được sao lưu vào các hệ thống lưu trữ lưu trữ sâu như giải pháp dựa trên tape storage kiểu Spectra TFinity ExaScale library hoặc AWS Glacier
      Với cấu trúc mà việc khôi phục dữ liệu mất từ vài giờ đến vài ngày như vậy, vừa có thể tuân thủ lệnh tòa, vừa giữ chi phí thấp
      Đồng thời ngay cả khi xảy ra rò rỉ dữ liệu quy mô lớn thì kẻ xấu cũng phải tốn rất nhiều thời gian và công sức mới đánh cắp được, nên có lợi cho phát hiện và phòng vệ

    • Giờ đây cần mặc định nghi ngờ rằng mọi cuộc chat/API call với AI chạy trên cloud tại Mỹ đều là đối tượng có thể bị khám xét pháp lý
      Nếu đây là rủi ro không thể chấp nhận thì nên nghiêm túc cân nhắc chuyển sang local LLM

  • Có người thắc mắc vì sao các bên như Times lại có quyền xem dữ liệu của người dùng
    Rốt cuộc những phán quyết kiểu này dẫn tới việc phía tòa soạn báo có thể nhìn vào dữ liệu người dùng

  • Lệnh của tòa này có khả năng vi phạm luật quyền riêng tư ở hơn một khu vực tài phán, đồng thời cũng có thể khiến OpenAI vi phạm các hợp đồng đã ký với khách hàng hiện tại

    • Có giải thích rằng các hợp đồng hiện có hoàn toàn không ảnh hưởng gì tới việc tòa án ra lệnh
      Lệnh pháp lý là ưu tiên cao nhất

    • Bản thân mệnh lệnh lần này không tạo thêm một hành vi vi phạm luật quyền riêng tư mới nào
      Ngay từ đầu việc lưu trữ dữ liệu và cung cấp cho bên thứ ba đã là hành vi vi phạm rồi

    • Lệnh này trên thực tế được áp dụng hồi tố từ ngày 13 tháng 5
      Có cảm giác OpenAI không gửi email hay thông báo riêng cho người dùng đến giờ là vì lo ngại ảnh hưởng kinh doanh
      Nhưng điều đó khiến người ta cảm thấy đây rõ ràng là hành động phản bội lòng tin của người dùng

  • Các công ty từng trao đổi dữ liệu nhạy cảm qua ChatGPT API hẳn đã tin vào mô tả rằng dữ liệu đầu vào và đầu ra sẽ không bị lưu trữ
    Nhưng trên thực tế, chỉ cần OpenAI đổi thiết lập là dữ liệu có thể bị giữ lại
    Có người thắc mắc không biết đã có thông báo riêng nào được gửi đi chưa, hay tất cả đều chỉ biết chuyện này qua tin báo chí

  • Liên kết bài gốc ban đầu không truy cập được vì quá tải lưu lượng (HN hug of death), nhưng có người đọc được qua Wayback Machine
    Vì đó là một instance Mastodon cá nhân nên việc bị quá tải khi lượng truy cập tăng vọt là điều dễ hiểu