- Sau khi tòa án Mỹ ra lệnh OpenAI phải lưu giữ vô thời hạn mọi nhật ký ChatGPT, bao gồm cả các cuộc trò chuyện đã xóa, hai người dùng đã tìm cách can thiệp với lập luận đây là hành vi "giám sát quy mô lớn", nhưng đã bị bác bỏ
- Một người dùng cho biết từng nhập thông tin cá nhân nhạy cảm và thông tin thương mại vào hệ thống, và lập luận rằng lệnh này tương đương với một chương trình giám sát quy mô lớn trên toàn nước Mỹ
- Thẩm phán nhấn mạnh rõ rằng một lệnh bảo toàn chứng cứ đơn thuần không phải là chương trình giám sát, và ngành tư pháp không phải cơ quan điều tra
- Tổ chức bảo vệ quyền số EFF cũng bày tỏ lo ngại về rủi ro đối với quyền riêng tư của người dùng và khả năng bị lạm dụng trong tương lai
- Người dùng đang bày tỏ sự bất an về lập trường phản ứng cứng rắn của OpenAI cũng như khả năng dữ liệu bị tiết lộ hoặc thiếu minh bạch trong tương lai
Bối cảnh và lệnh của tòa án
- Gần đây, tòa án đã ra lệnh cho OpenAI lưu giữ vô thời hạn mọi nhật ký của ChatGPT, kể cả các cuộc trò chuyện đã xóa
- Biện pháp này được đưa ra nhằm bảo toàn chứng cứ cho một vụ kiện bản quyền do các công ty truyền thông khởi xướng
- Một số người dùng lo ngại rằng lệnh này bao gồm cả các cuộc trò chuyện đã xóa và ẩn danh, đồng thời được thực thi mà không thông báo cho người dùng
Nỗ lực can thiệp của người dùng và tranh cãi về quyền riêng tư
- Một người dùng yêu cầu được can thiệp, cho rằng mình đã nhập thông tin cá nhân và thương mại nhạy cảm, và vì vậy lệnh này dẫn tới giám sát quy mô lớn trên toàn nước Mỹ
- Người này phản đối việc các cuộc trò chuyện đã xóa và ẩn danh bị lưu giữ mà không có thông báo trước, đồng thời yêu cầu áp dụng ngoại lệ cho các cuộc trò chuyện về những chủ đề nhạy cảm như y tế, tài chính, pháp lý
- Tòa án nêu rõ lý do bác bỏ: "Lệnh bảo toàn tài liệu không liên quan đến giám sát, và tòa án không phải là cơ quan điều tra"
Góc nhìn của tổ chức bảo vệ quyền số
- Corynne McSherry, Giám đốc pháp lý của Electronic Frontier Foundation(EFF), lo ngại rằng "lệnh này tạo ra rủi ro thực chất đối với quyền riêng tư của người dùng và có thể gây tác động tiêu cực đến các vụ kiện tương tự"
- Bà chỉ ra rằng đây có thể trở thành tiền lệ để cơ quan thực thi pháp luật hoặc các bên trong kiện tụng yêu cầu OpenAI cung cấp hồ sơ người dùng
- Đặc biệt, bà nhấn mạnh rằng nếu quyền kiểm soát hồ sơ người dùng và nghĩa vụ thông báo còn yếu kém, chatbot AI có thể trở thành một kênh giám sát mới
Logic trong phán quyết của tòa án
- Thẩm phán cho rằng "lệnh bảo toàn tài liệu là biện pháp nhằm bảo toàn chứng cứ cho một vụ kiện cụ thể", và kết luận rằng các vấn đề như xâm phạm quyền hiến định không liên quan đến nội dung chính của vụ kiện này
- Tòa cho rằng nỗ lực can thiệp không liên quan đến việc làm rõ sự thật hay các vấn đề tranh tụng, mà chỉ làm chậm tiến trình vụ kiện, nên không công nhận quyền can thiệp
- Hiện tại chưa có trường hợp dữ liệu thực sự được chuyển cho các công ty truyền thông, vì vậy tòa ngụ ý rằng có thể thảo luận thêm nếu sau này dữ liệu được chia sẻ
Sự bất an của người dùng và các vấn đề sắp tới
- Người dùng lo ngại rằng "OpenAI có thể ưu tiên các lợi ích khác như chi phí kiện tụng hay quản lý danh tiếng hơn là bảo vệ quyền riêng tư"
- EFF và các bên khác nhấn mạnh rằng các công ty cung cấp ứng dụng chat AI cần thực sự xóa hồ sơ khi có yêu cầu xóa, đồng thời thông báo minh bạch về các yêu cầu truy xuất dữ liệu
- Cuối cùng, tính minh bạch trong việc lưu giữ và công bố dữ liệu người dùng, quy trình thông báo và biện pháp khắc phục sau sự việc sẽ nổi lên như những vấn đề lớn trong thời gian tới
1 bình luận
Ý kiến trên Hacker News
Nhìn vào phát biểu của thẩm phán được trích trong bài, tôi có cảm giác thẩm phán không thực sự hiểu đúng bản chất của vấn đề đang được nêu ra, đồng thời lý do ra phán quyết cũng có gì đó kỳ lạ
Lập luận là: "Nếu xem xét những câu hỏi kiểu này, điều đó sẽ chỉ gây trì hoãn một cách không phù hợp trong việc giải quyết các vấn đề pháp lý thực sự cần được xử lý"
Khi đây là một vụ kiện liên quan đến bản quyền, phải chăng các vấn đề mang tính hiến pháp có thể bị bỏ qua?
Ngoài ra, tôi cho rằng việc bác yêu cầu ngay chỉ vì nó không do luật sư soạn là hành động không đúng với vai trò của một thẩm phán
Có vẻ như họ đã bỏ qua việc người ta vẫn có thể tự mình khởi kiện mà không cần luật sư
Đọc toàn bộ phán quyết đính kèm trong bài (ở đây) thì bối cảnh trở nên rõ ràng hơn
Bên nêu vấn đề đã nộp một dạng "yêu cầu can thiệp" cụ thể, và loại này có những điều kiện rất nghiêm ngặt
Họ đã không đáp ứng được các điều kiện đó
Việc bị bác vì nộp mà không có luật sư cũng có được nhắc đến trong phán quyết
Cá nhân có thể tự đại diện cho chính mình, nhưng pháp nhân (doanh nghiệp) thì bắt buộc phải có luật sư
Vì hồ sơ ban đầu được nộp dưới tên công ty, có vẻ thẩm phán đã xử lý đúng theo luật
Tôi cũng có cảm giác tương tự, và điều khiến tôi lo hơn là có rất nhiều dịch vụ tương tự khác cũng có thể bị ảnh hưởng bởi kiểu vấn đề riêng tư này
Chúng ta cần những đạo luật bảo vệ quyền riêng tư đủ mạnh để ngăn các lệnh tòa quá mức như vậy, nhưng hiện vẫn chưa có
Ví dụ như lệnh tòa buộc lưu toàn bộ tin nhắn giữa người dùng trên một dịch vụ hẹn hò, buộc nhà mạng lưu mọi tin nhắn văn bản, hay lưu hàng tỷ Google Docs được tạo ra
Tôi tự hỏi vì sao chính phủ vẫn chưa yêu cầu các dịch vụ như Signal thêm backdoor và lưu mọi tin nhắn văn bản
Tôi nghĩ để thực sự làm được điều đó thì phải cần một lý do chính đáng rất mạnh
Tôi nghi ngờ liệu chính phủ Mỹ có thể đã tiến hành kiểu giám sát diện rộng như vậy ngay trong các dịch vụ thương mại phổ thông hay chưa
Trước đây vào thời các tiết lộ của Edward Snowden cũng từng có chuyện nghe lén liên lạc của Google
Thẩm phán nói chung thường xuất thân từ nghề luật hoặc có kinh nghiệm pháp lý
Vị thẩm phán này cũng từng hành nghề luật, và còn có lý lịch khá đặc biệt là gần hoàn thành chương trình tiến sĩ động vật học
Việc tầng lớp được xã hội bảo vệ không muốn đối xử bình đẳng với tầng lớp không được bảo vệ là điều rất tự nhiên
Tôi cũng không thấy vụ này thực sự có vấn đề hiến pháp nào, và kể cả có thì đây cũng không phải nơi để phán xét chuyện đó
Chỉ trích việc họ phớt lờ vì không có luật sư là hiểu lầm 100%
Pro Se (tự mình kiện tụng) đã có quy định rất rõ ràng
Nếu khởi kiện thay mặt cho một pháp nhân khác mà không phải chính đương sự, thì bắt buộc phải có luật sư
Đây không hẳn là kiểu "vì là vụ bản quyền nên có thể bỏ qua vấn đề hiến pháp", mà đúng hơn là thẩm phán cho rằng vấn đề hiến pháp ở đây khó có cơ sở hình thành nên chỉ tốn thời gian
Về chỗ "vì là vụ kiện bản quyền nên có thể bỏ qua vấn đề hiến pháp sao?"
Tôi muốn biết cụ thể người ta cho rằng ở đây có vấn đề hiến pháp nào
Khẳng định rằng "không có luật sư vẫn được" cũng không đúng với thực tế pháp lý, vì doanh nghiệp bắt buộc phải có luật sư
Nếu là cá nhân tự làm thì có thể còn được linh động phần nào, nhưng doanh nghiệp thì không
Nếu lập luận đã lung lay từ những điểm cơ bản như thế, thì tôi khó mà tin cậy các luận điểm khác
Tôi không thấy vụ này có giá trị tin tức lớn đến vậy
OpenAI sắp trực tiếp tranh luận miệng để ngăn lệnh lưu giữ dữ liệu, và hai yêu cầu đi trước do người dùng ChatGPT thông thường nộp không phải là yếu tố có thể quyết định kết quả vụ việc
Có ý kiến cho rằng giá trị tin tức nằm ở chỗ thẩm phán dường như không thực sự hiểu tác động ngoài đời thực của lệnh "lưu toàn bộ dữ liệu" đối với một công ty, và cũng không có ý định nhanh chóng xem xét lại
Bản thân phán quyết ban đầu đã đủ có sức lan tỏa để thành tin tức
Dạo này tôi tin rằng ngay cả những kết luận quá hiển nhiên cũng vẫn có giá trị tin tức rất lớn
Chúng ta xác nhận được theo cách này rằng người dùng có quyền trực tiếp tham gia
Họ cũng có thể tự mình khởi kiện như nguyên đơn đã làm
Kết quả ra sao là chuyện khác, nhưng bản thân đó là một quyền
Có vẻ thẩm phán không quan tâm đến vấn đề này, nên kết luận là việc thuyết phục cũng vô ích
Tôi tự hỏi OpenAI và người dùng còn có lựa chọn hay phương án nào khác
Không hẳn là câu trả lời trực tiếp, nhưng tôi nghĩ dùng LLM cục bộ sẽ là lựa chọn thực tế nhất trong tương lai
Gần đây tôi cũng đang tự chạy thử, và dù vẫn còn hạn chế về lưu ngữ cảnh hay hiệu năng cao, tôi nghĩ trong 1~2 năm nữa việc có một LLM cục bộ đủ thực dụng sẽ không còn là điều viển vông
Với tôi, điểm hấp dẫn còn nằm ở khả năng dùng offline hơn là quyền riêng tư
Theo luật Mỹ thì không có lựa chọn nào
Đây là trường hợp điển hình của "học thuyết bên thứ ba"
Dù là dữ liệu của chính bạn, nếu bạn tự nguyện cung cấp cho bên thứ ba (OpenAI), thì dữ liệu đó không còn được xem là của riêng bạn nữa và kỳ vọng về quyền riêng tư cũng không còn được thiết lập
Ngoại lệ chỉ có thể được công nhận nếu có luật mới được ban hành riêng, và hiện tại OpenAI không thuộc diện đó
Phán quyết này cũng được đưa ra trong khuôn khổ pháp luật Mỹ như vậy, nên ở thời điểm hiện tại quyền riêng tư đối với dữ liệu hội thoại gửi cho OpenAI không được bảo vệ
Có lẽ nên từ bỏ kỳ vọng về quyền riêng tư ở bên thứ ba
Ngay cả thông tin ngân hàng cũng có thể bị công khai nếu có lệnh điều tra
Có nhiều lập trình viên không hiểu thực tế này mà lại ngộ nhận những tranh cãi đang nóng hiện nay
Dù phán quyết sau này ra sao, kháng cáo có thể vẫn là một phương án
Với câu hỏi "OpenAI và người dùng còn lựa chọn gì?"
Một cách là tìm dịch vụ ở các quốc gia không nộp dữ liệu cho Mỹ
Nếu có ai nghĩ rằng OpenAI sẽ không lưu tất cả những gì được nhập vào chat hay API, tôi khuyên nên xem kỹ thành phần hội đồng quản trị của OpenAI hiện nay
Ngay cả khi các nhà cung cấp LLM như OpenAI bị pháp luật cấm lưu dữ liệu, tôi vẫn khó tin rằng họ sẽ thực sự tuân thủ chính sách đó một cách nghiêm túc
Tôi đề xuất dữ liệu nhạy cảm phải luôn được nhập trực tiếp vào LLM cục bộ
Mong mọi người nhận ra phép phủ định kép ở đây
Giờ đây cả thế giới đã có năng lực kỹ thuật để giám sát mọi mặt của đời sống thường nhật, nên vấn đề là chúng ta sẽ xử lý điều đó như thế nào
Tôi nghĩ trong tương lai, khối dữ liệu khổng lồ này có thể tạo ra các lĩnh vực mới như y học, dịch tễ học, tâm lý học quy mô lớn (tôi gọi đùa là Massive open online psychology, moop), và chính phủ cũng có thể phục vụ tốt hơn cho những người dân bị bỏ quên nhờ big data thời gian thực
Nhưng để có được tương lai như vậy thì nhất thiết phải có một khuôn khổ pháp lý đáng tin cậy, chứ khó có thể xây dựng từng mảnh vụn chỉ qua từng phán quyết riêng lẻ
Cá nhân tôi cho rằng cần một nguyên tắc: mọi dữ liệu không thể tồn tại nếu không có hành vi trực tiếp của một con người thì mặc nhiên phải thuộc sở hữu của chính người đó, và chỉ nên cho phép lưu ký khi dữ liệu đó được dùng vì lợi ích của chính con người ấy
Nếu đưa vào một tiêu chuẩn cao kiểu "vì lợi ích của người dùng/công dân", thì cách tư duy của các công ty dữ liệu sẽ thay đổi hoàn toàn
Tôi muốn biết người khác nghĩ gì về chuyện này
Dù hiện tại đây vẫn là hướng đi khá bị né tránh trên HN và những nơi tương tự, tôi nghĩ chỉ khi dữ liệu được khóa xoay quanh người dùng và được phân tán thay vì nằm trong các silo tập trung, chúng ta mới có thể theo đuổi đồng thời cả quyền riêng tư lẫn lợi ích của big data
Thực ra thẩm phán trong vụ này là một magistrate chỉ còn khoảng hơn 1 năm nhiệm kỳ
Trước đây cũng từng có trường hợp magistrate đưa ra những quyết định yếu kém như thế này rồi không được gia hạn nhiệm kỳ, nên tôi hy vọng lần này cũng vậy
Liên kết thông báo gia hạn nhiệm kỳ
Tôi không hiểu vì sao phải đặt chức danh thẩm phán trong dấu ngoặc kép
Magistrate vẫn là thẩm phán đúng nghĩa
Tham khảo: các loại thẩm phán liên bang tại Mỹ
Tôi không cho rằng chỉ vì áp dụng thông thường học thuyết bên thứ ba mà nhiệm kỳ hay danh tiếng của magistrate này phải bị ảnh hưởng xấu
Tham khảo thảo luận trước đây về cùng chủ đề OpenAI phản đối lệnh của tòa yêu cầu lưu toàn bộ log ChatGPT, kể cả các cuộc trò chuyện đã xóa
Không một thẩm phán nào có thể chặn được một chương trình giám sát quy mô lớn đã kéo dài hơn 10 năm
Giờ đây nó chỉ còn là chuyện để đùa cợt và tranh cãi vô nghĩa
OpenAI cũng như các công ty khác, thu thập mọi thông tin có thể và lập hồ sơ về chúng ta
Tôi thấy lạ khi nhiều người tỏ ra sốc hoặc phẫn nộ trước tình huống này
Có vẻ phần lớn либо không biết, либо bỏ qua thực tế rằng hầu hết các dịch vụ trực tuyến họ dùng hằng ngày cũng lưu giữ dữ liệu y hệt như vậy
Thực tế mà nói, trừ Signal và các dịch vụ E2EE tương tự, Gmail, nhà mạng, Reddit, Xitter và hầu hết các dịch vụ lớn đều lưu dữ liệu và metadata
Bất kể đúng hay sai, đó là thực tế hiển nhiên của các dịch vụ trực tuyến hiện nay
Lý do người ta phẫn nộ là vì họ cảm thấy thực tế đó đã chạm đến mức không thể chấp nhận
Bất kể điều khoản hay chính sách nói gì, OpenAI giờ rơi vào tình huống phải cưỡng bức lưu cả những dữ liệu mà đáng lẽ họ muốn xóa cho người dùng
Tôi không hề thấy lạ khi mọi người tích cực bày tỏ quan điểm về chuyện này
Tôi nghĩ đa số mọi người hoàn toàn không biết điều này
Chỉ cần hỏi bạn bè không làm kỹ thuật xung quanh bạn hay một người bất kỳ ngoài đường, rất có thể họ thực sự không nhận thức được thực tế đó