2 điểm bởi GN⁺ 2025-06-25 | 1 bình luận | Chia sẻ qua WhatsApp
  • Sau khi tòa án Mỹ ra lệnh OpenAI phải lưu giữ vô thời hạn mọi nhật ký ChatGPT, bao gồm cả các cuộc trò chuyện đã xóa, hai người dùng đã tìm cách can thiệp với lập luận đây là hành vi "giám sát quy mô lớn", nhưng đã bị bác bỏ
  • Một người dùng cho biết từng nhập thông tin cá nhân nhạy cảm và thông tin thương mại vào hệ thống, và lập luận rằng lệnh này tương đương với một chương trình giám sát quy mô lớn trên toàn nước Mỹ
  • Thẩm phán nhấn mạnh rõ rằng một lệnh bảo toàn chứng cứ đơn thuần không phải là chương trình giám sát, và ngành tư pháp không phải cơ quan điều tra
  • Tổ chức bảo vệ quyền số EFF cũng bày tỏ lo ngại về rủi ro đối với quyền riêng tư của người dùng và khả năng bị lạm dụng trong tương lai
  • Người dùng đang bày tỏ sự bất an về lập trường phản ứng cứng rắn của OpenAI cũng như khả năng dữ liệu bị tiết lộ hoặc thiếu minh bạch trong tương lai

Bối cảnh và lệnh của tòa án

  • Gần đây, tòa án đã ra lệnh cho OpenAI lưu giữ vô thời hạn mọi nhật ký của ChatGPT, kể cả các cuộc trò chuyện đã xóa
  • Biện pháp này được đưa ra nhằm bảo toàn chứng cứ cho một vụ kiện bản quyền do các công ty truyền thông khởi xướng
  • Một số người dùng lo ngại rằng lệnh này bao gồm cả các cuộc trò chuyện đã xóa và ẩn danh, đồng thời được thực thi mà không thông báo cho người dùng

Nỗ lực can thiệp của người dùng và tranh cãi về quyền riêng tư

  • Một người dùng yêu cầu được can thiệp, cho rằng mình đã nhập thông tin cá nhân và thương mại nhạy cảm, và vì vậy lệnh này dẫn tới giám sát quy mô lớn trên toàn nước Mỹ
  • Người này phản đối việc các cuộc trò chuyện đã xóa và ẩn danh bị lưu giữ mà không có thông báo trước, đồng thời yêu cầu áp dụng ngoại lệ cho các cuộc trò chuyện về những chủ đề nhạy cảm như y tế, tài chính, pháp lý
  • Tòa án nêu rõ lý do bác bỏ: "Lệnh bảo toàn tài liệu không liên quan đến giám sát, và tòa án không phải là cơ quan điều tra"

Góc nhìn của tổ chức bảo vệ quyền số

  • Corynne McSherry, Giám đốc pháp lý của Electronic Frontier Foundation(EFF), lo ngại rằng "lệnh này tạo ra rủi ro thực chất đối với quyền riêng tư của người dùng và có thể gây tác động tiêu cực đến các vụ kiện tương tự"
  • Bà chỉ ra rằng đây có thể trở thành tiền lệ để cơ quan thực thi pháp luật hoặc các bên trong kiện tụng yêu cầu OpenAI cung cấp hồ sơ người dùng
  • Đặc biệt, bà nhấn mạnh rằng nếu quyền kiểm soát hồ sơ người dùng và nghĩa vụ thông báo còn yếu kém, chatbot AI có thể trở thành một kênh giám sát mới

Logic trong phán quyết của tòa án

  • Thẩm phán cho rằng "lệnh bảo toàn tài liệu là biện pháp nhằm bảo toàn chứng cứ cho một vụ kiện cụ thể", và kết luận rằng các vấn đề như xâm phạm quyền hiến định không liên quan đến nội dung chính của vụ kiện này
  • Tòa cho rằng nỗ lực can thiệp không liên quan đến việc làm rõ sự thật hay các vấn đề tranh tụng, mà chỉ làm chậm tiến trình vụ kiện, nên không công nhận quyền can thiệp
  • Hiện tại chưa có trường hợp dữ liệu thực sự được chuyển cho các công ty truyền thông, vì vậy tòa ngụ ý rằng có thể thảo luận thêm nếu sau này dữ liệu được chia sẻ

Sự bất an của người dùng và các vấn đề sắp tới

  • Người dùng lo ngại rằng "OpenAI có thể ưu tiên các lợi ích khác như chi phí kiện tụng hay quản lý danh tiếng hơn là bảo vệ quyền riêng tư"
  • EFF và các bên khác nhấn mạnh rằng các công ty cung cấp ứng dụng chat AI cần thực sự xóa hồ sơ khi có yêu cầu xóa, đồng thời thông báo minh bạch về các yêu cầu truy xuất dữ liệu
  • Cuối cùng, tính minh bạch trong việc lưu giữ và công bố dữ liệu người dùng, quy trình thông báo và biện pháp khắc phục sau sự việc sẽ nổi lên như những vấn đề lớn trong thời gian tới

1 bình luận

 
GN⁺ 2025-06-25
Ý kiến trên Hacker News
  • Nhìn vào phát biểu của thẩm phán được trích trong bài, tôi có cảm giác thẩm phán không thực sự hiểu đúng bản chất của vấn đề đang được nêu ra, đồng thời lý do ra phán quyết cũng có gì đó kỳ lạ
    Lập luận là: "Nếu xem xét những câu hỏi kiểu này, điều đó sẽ chỉ gây trì hoãn một cách không phù hợp trong việc giải quyết các vấn đề pháp lý thực sự cần được xử lý"
    Khi đây là một vụ kiện liên quan đến bản quyền, phải chăng các vấn đề mang tính hiến pháp có thể bị bỏ qua?
    Ngoài ra, tôi cho rằng việc bác yêu cầu ngay chỉ vì nó không do luật sư soạn là hành động không đúng với vai trò của một thẩm phán
    Có vẻ như họ đã bỏ qua việc người ta vẫn có thể tự mình khởi kiện mà không cần luật sư

    • Đọc toàn bộ phán quyết đính kèm trong bài (ở đây) thì bối cảnh trở nên rõ ràng hơn
      Bên nêu vấn đề đã nộp một dạng "yêu cầu can thiệp" cụ thể, và loại này có những điều kiện rất nghiêm ngặt
      Họ đã không đáp ứng được các điều kiện đó
      Việc bị bác vì nộp mà không có luật sư cũng có được nhắc đến trong phán quyết
      Cá nhân có thể tự đại diện cho chính mình, nhưng pháp nhân (doanh nghiệp) thì bắt buộc phải có luật sư
      Vì hồ sơ ban đầu được nộp dưới tên công ty, có vẻ thẩm phán đã xử lý đúng theo luật

    • Tôi cũng có cảm giác tương tự, và điều khiến tôi lo hơn là có rất nhiều dịch vụ tương tự khác cũng có thể bị ảnh hưởng bởi kiểu vấn đề riêng tư này
      Chúng ta cần những đạo luật bảo vệ quyền riêng tư đủ mạnh để ngăn các lệnh tòa quá mức như vậy, nhưng hiện vẫn chưa có
      Ví dụ như lệnh tòa buộc lưu toàn bộ tin nhắn giữa người dùng trên một dịch vụ hẹn hò, buộc nhà mạng lưu mọi tin nhắn văn bản, hay lưu hàng tỷ Google Docs được tạo ra
      Tôi tự hỏi vì sao chính phủ vẫn chưa yêu cầu các dịch vụ như Signal thêm backdoor và lưu mọi tin nhắn văn bản
      Tôi nghĩ để thực sự làm được điều đó thì phải cần một lý do chính đáng rất mạnh
      Tôi nghi ngờ liệu chính phủ Mỹ có thể đã tiến hành kiểu giám sát diện rộng như vậy ngay trong các dịch vụ thương mại phổ thông hay chưa
      Trước đây vào thời các tiết lộ của Edward Snowden cũng từng có chuyện nghe lén liên lạc của Google

    • Thẩm phán nói chung thường xuất thân từ nghề luật hoặc có kinh nghiệm pháp lý
      Vị thẩm phán này cũng từng hành nghề luật, và còn có lý lịch khá đặc biệt là gần hoàn thành chương trình tiến sĩ động vật học
      Việc tầng lớp được xã hội bảo vệ không muốn đối xử bình đẳng với tầng lớp không được bảo vệ là điều rất tự nhiên
      Tôi cũng không thấy vụ này thực sự có vấn đề hiến pháp nào, và kể cả có thì đây cũng không phải nơi để phán xét chuyện đó

    • Chỉ trích việc họ phớt lờ vì không có luật sư là hiểu lầm 100%
      Pro Se (tự mình kiện tụng) đã có quy định rất rõ ràng
      Nếu khởi kiện thay mặt cho một pháp nhân khác mà không phải chính đương sự, thì bắt buộc phải có luật sư
      Đây không hẳn là kiểu "vì là vụ bản quyền nên có thể bỏ qua vấn đề hiến pháp", mà đúng hơn là thẩm phán cho rằng vấn đề hiến pháp ở đây khó có cơ sở hình thành nên chỉ tốn thời gian

    • Về chỗ "vì là vụ kiện bản quyền nên có thể bỏ qua vấn đề hiến pháp sao?"
      Tôi muốn biết cụ thể người ta cho rằng ở đây có vấn đề hiến pháp nào
      Khẳng định rằng "không có luật sư vẫn được" cũng không đúng với thực tế pháp lý, vì doanh nghiệp bắt buộc phải có luật sư
      Nếu là cá nhân tự làm thì có thể còn được linh động phần nào, nhưng doanh nghiệp thì không
      Nếu lập luận đã lung lay từ những điểm cơ bản như thế, thì tôi khó mà tin cậy các luận điểm khác

  • Tôi không thấy vụ này có giá trị tin tức lớn đến vậy
    OpenAI sắp trực tiếp tranh luận miệng để ngăn lệnh lưu giữ dữ liệu, và hai yêu cầu đi trước do người dùng ChatGPT thông thường nộp không phải là yếu tố có thể quyết định kết quả vụ việc

    • Có ý kiến cho rằng giá trị tin tức nằm ở chỗ thẩm phán dường như không thực sự hiểu tác động ngoài đời thực của lệnh "lưu toàn bộ dữ liệu" đối với một công ty, và cũng không có ý định nhanh chóng xem xét lại
      Bản thân phán quyết ban đầu đã đủ có sức lan tỏa để thành tin tức

    • Dạo này tôi tin rằng ngay cả những kết luận quá hiển nhiên cũng vẫn có giá trị tin tức rất lớn

    • Chúng ta xác nhận được theo cách này rằng người dùng có quyền trực tiếp tham gia
      Họ cũng có thể tự mình khởi kiện như nguyên đơn đã làm
      Kết quả ra sao là chuyện khác, nhưng bản thân đó là một quyền

  • Có vẻ thẩm phán không quan tâm đến vấn đề này, nên kết luận là việc thuyết phục cũng vô ích
    Tôi tự hỏi OpenAI và người dùng còn có lựa chọn hay phương án nào khác

    • Không hẳn là câu trả lời trực tiếp, nhưng tôi nghĩ dùng LLM cục bộ sẽ là lựa chọn thực tế nhất trong tương lai
      Gần đây tôi cũng đang tự chạy thử, và dù vẫn còn hạn chế về lưu ngữ cảnh hay hiệu năng cao, tôi nghĩ trong 1~2 năm nữa việc có một LLM cục bộ đủ thực dụng sẽ không còn là điều viển vông
      Với tôi, điểm hấp dẫn còn nằm ở khả năng dùng offline hơn là quyền riêng tư

    • Theo luật Mỹ thì không có lựa chọn nào
      Đây là trường hợp điển hình của "học thuyết bên thứ ba"
      Dù là dữ liệu của chính bạn, nếu bạn tự nguyện cung cấp cho bên thứ ba (OpenAI), thì dữ liệu đó không còn được xem là của riêng bạn nữa và kỳ vọng về quyền riêng tư cũng không còn được thiết lập
      Ngoại lệ chỉ có thể được công nhận nếu có luật mới được ban hành riêng, và hiện tại OpenAI không thuộc diện đó
      Phán quyết này cũng được đưa ra trong khuôn khổ pháp luật Mỹ như vậy, nên ở thời điểm hiện tại quyền riêng tư đối với dữ liệu hội thoại gửi cho OpenAI không được bảo vệ

    • Có lẽ nên từ bỏ kỳ vọng về quyền riêng tư ở bên thứ ba
      Ngay cả thông tin ngân hàng cũng có thể bị công khai nếu có lệnh điều tra
      Có nhiều lập trình viên không hiểu thực tế này mà lại ngộ nhận những tranh cãi đang nóng hiện nay

    • Dù phán quyết sau này ra sao, kháng cáo có thể vẫn là một phương án

    • Với câu hỏi "OpenAI và người dùng còn lựa chọn gì?"
      Một cách là tìm dịch vụ ở các quốc gia không nộp dữ liệu cho Mỹ

  • Nếu có ai nghĩ rằng OpenAI sẽ không lưu tất cả những gì được nhập vào chat hay API, tôi khuyên nên xem kỹ thành phần hội đồng quản trị của OpenAI hiện nay

    • Xét đến việc một trong các đồng sáng lập OpenAI còn đang thu thập cả dữ liệu sinh trắc học, thì tình huống này cũng không có gì lạ
  • Ngay cả khi các nhà cung cấp LLM như OpenAI bị pháp luật cấm lưu dữ liệu, tôi vẫn khó tin rằng họ sẽ thực sự tuân thủ chính sách đó một cách nghiêm túc
    Tôi đề xuất dữ liệu nhạy cảm phải luôn được nhập trực tiếp vào LLM cục bộ

    • "Bị cấm lưu" thực chất cũng đồng nghĩa với việc không có chuyện bị buộc phải lưu
      Mong mọi người nhận ra phép phủ định kép ở đây
  • Giờ đây cả thế giới đã có năng lực kỹ thuật để giám sát mọi mặt của đời sống thường nhật, nên vấn đề là chúng ta sẽ xử lý điều đó như thế nào
    Tôi nghĩ trong tương lai, khối dữ liệu khổng lồ này có thể tạo ra các lĩnh vực mới như y học, dịch tễ học, tâm lý học quy mô lớn (tôi gọi đùa là Massive open online psychology, moop), và chính phủ cũng có thể phục vụ tốt hơn cho những người dân bị bỏ quên nhờ big data thời gian thực
    Nhưng để có được tương lai như vậy thì nhất thiết phải có một khuôn khổ pháp lý đáng tin cậy, chứ khó có thể xây dựng từng mảnh vụn chỉ qua từng phán quyết riêng lẻ
    Cá nhân tôi cho rằng cần một nguyên tắc: mọi dữ liệu không thể tồn tại nếu không có hành vi trực tiếp của một con người thì mặc nhiên phải thuộc sở hữu của chính người đó, và chỉ nên cho phép lưu ký khi dữ liệu đó được dùng vì lợi ích của chính con người ấy
    Nếu đưa vào một tiêu chuẩn cao kiểu "vì lợi ích của người dùng/công dân", thì cách tư duy của các công ty dữ liệu sẽ thay đổi hoàn toàn
    Tôi muốn biết người khác nghĩ gì về chuyện này

    • Có thể có hướng giải quyết bằng cách kết hợp Zero knowledge proof, thanh toán luồng trên blockchain, lưu trữ phân tán như IPFS, mã hóa và cơ chế bồi hoàn
      Dù hiện tại đây vẫn là hướng đi khá bị né tránh trên HN và những nơi tương tự, tôi nghĩ chỉ khi dữ liệu được khóa xoay quanh người dùng và được phân tán thay vì nằm trong các silo tập trung, chúng ta mới có thể theo đuổi đồng thời cả quyền riêng tư lẫn lợi ích của big data
  • Thực ra thẩm phán trong vụ này là một magistrate chỉ còn khoảng hơn 1 năm nhiệm kỳ
    Trước đây cũng từng có trường hợp magistrate đưa ra những quyết định yếu kém như thế này rồi không được gia hạn nhiệm kỳ, nên tôi hy vọng lần này cũng vậy
    Liên kết thông báo gia hạn nhiệm kỳ

    • Tôi không hiểu vì sao phải đặt chức danh thẩm phán trong dấu ngoặc kép
      Magistrate vẫn là thẩm phán đúng nghĩa
      Tham khảo: các loại thẩm phán liên bang tại Mỹ

    • Tôi không cho rằng chỉ vì áp dụng thông thường học thuyết bên thứ ba mà nhiệm kỳ hay danh tiếng của magistrate này phải bị ảnh hưởng xấu

  • Tham khảo thảo luận trước đây về cùng chủ đề OpenAI phản đối lệnh của tòa yêu cầu lưu toàn bộ log ChatGPT, kể cả các cuộc trò chuyện đã xóa

  • Không một thẩm phán nào có thể chặn được một chương trình giám sát quy mô lớn đã kéo dài hơn 10 năm
    Giờ đây nó chỉ còn là chuyện để đùa cợt và tranh cãi vô nghĩa
    OpenAI cũng như các công ty khác, thu thập mọi thông tin có thể và lập hồ sơ về chúng ta

    • Chính thông tin mà chúng ta gõ vào ô văn bản còn có giá trị lớn hơn nhiều so với kết quả mà LLM trả về
  • Tôi thấy lạ khi nhiều người tỏ ra sốc hoặc phẫn nộ trước tình huống này
    Có vẻ phần lớn либо không biết, либо bỏ qua thực tế rằng hầu hết các dịch vụ trực tuyến họ dùng hằng ngày cũng lưu giữ dữ liệu y hệt như vậy
    Thực tế mà nói, trừ Signal và các dịch vụ E2EE tương tự, Gmail, nhà mạng, Reddit, Xitter và hầu hết các dịch vụ lớn đều lưu dữ liệu và metadata
    Bất kể đúng hay sai, đó là thực tế hiển nhiên của các dịch vụ trực tuyến hiện nay

    • Lý do người ta phẫn nộ là vì họ cảm thấy thực tế đó đã chạm đến mức không thể chấp nhận
      Bất kể điều khoản hay chính sách nói gì, OpenAI giờ rơi vào tình huống phải cưỡng bức lưu cả những dữ liệu mà đáng lẽ họ muốn xóa cho người dùng
      Tôi không hề thấy lạ khi mọi người tích cực bày tỏ quan điểm về chuyện này

    • Tôi nghĩ đa số mọi người hoàn toàn không biết điều này
      Chỉ cần hỏi bạn bè không làm kỹ thuật xung quanh bạn hay một người bất kỳ ngoài đường, rất có thể họ thực sự không nhận thức được thực tế đó