Áp lực bản quyền lớn hơn đang đến với AI tạo sinh

(garymarcus.substack.com)

2 điểm bởi GN⁺ 2023-12-31 | 1 bình luận | Chia sẻ qua WhatsApp

Sau vụ kiện của New York Times đối với OpenAI, vấn đề AI tạo sinh phải chịu trách nhiệm đến đâu về vi phạm bản quyền ở giai đoạn huấn luyện và đầu ra đang trở thành chủ đề tranh luận lớn hơn
Trọng tâm của vụ kiện là việc chatbot có thể tái tạo văn bản gần như nguyên xi, và thí nghiệm của Marcus cùng Reid Southen cho thấy DALL-E cũng có thể tạo ra sự lặp lại tương tự với hình ảnh
Ngay cả khi có các biện pháp an toàn như chặn danh từ riêng, người dùng vẫn có thể nhận được kết quả giống SpongeBob SquarePants, RoboCop hoặc nhân vật trò chơi điện tử từ những prompt không trực tiếp viết tên nhân vật hay tên phim
Các hệ thống hiện nay không cho người dùng biết thông tin nguồn gốc và khả năng vi phạm của nguồn dữ liệu huấn luyện cũng như nội dung được tạo ra, khiến người dùng có thể vô tình tạo ra sản phẩm vi phạm
Marcus cho rằng tranh cãi về vi phạm sẽ tiếp diễn cho đến khi xuất hiện kiến trúc mới có thể truy vết nguồn gốc, và vụ kiện của New York Times có thể chỉ là khởi đầu cho nhiều vụ kiện hơn

Vụ kiện New York Times và thí nghiệm lặp lại hình ảnh

Vào thời điểm New York Times đệ đơn kiện OpenAI, Gary Marcus đã cùng nghệ sĩ ý tưởng trong ngành điện ảnh Reid Southen tiến hành một thí nghiệm
- Southen được giới thiệu là người có kinh nghiệm liên quan đến Marvel, DC, Matrix Resurrections, Hunger Games và nhiều dự án khác
- Báo cáo đầy đủ dự kiến được công bố vào tuần tới, và IEEE Spectrum sẽ tiếp tục đưa tin vào ngày 3 tháng 1
Trọng tâm của vụ kiện là việc chatbot của OpenAI có thể tái tạo văn bản gần như nguyên văn
Trong thí nghiệm của Marcus và Southen, khi dùng phần mềm tạo ảnh của OpenAI thông qua Bing, hệ thống cũng có thể tạo ra hình ảnh giống hệt hoặc lặp lại gần với bản gốc

Việc tạo nội dung tương tự mà các biện pháp an toàn không chặn được

DALL-E được cho là có các biện pháp an toàn nhằm chặn một phần danh từ riêng và các nỗ lực vi phạm có chủ ý, nhưng chúng không hoạt động một cách ổn định
Khả năng vi phạm có thể phát sinh ngay cả khi người dùng không cố ý vi phạm hoặc không nhắc đến tên nhân vật hay tên phim
- Một prompt ngắn không nhắc đến SpongeBob SquarePants vẫn có thể cho ra kết quả liên quan
- Các ví dụ cũng bao gồm trường hợp không nhắc đến RoboCop, nhân vật trò chơi điện tử và kết quả có khả năng vi phạm nhãn hiệu
- Người dùng X Blanket_Man01 và Justine Moore của A16Z cũng được cho là đã độc lập phát hiện hiện tượng tương tự

Vấn đề hộp đen không thể biết nguồn gốc

Theo Marcus, vấn đề cốt lõi của AI tạo sinh nằm ở cấu trúc không hiển thị cho người dùng nguồn dữ liệu huấn luyện và nguồn gốc của nội dung tạo ra
- Các hệ thống như DALL-E và ChatGPT được huấn luyện bằng tài liệu có bản quyền
- OpenAI không công khai minh bạch đã huấn luyện bằng dữ liệu gì
- Các hệ thống AI tạo sinh có thể tạo ra tài liệu có khả năng vi phạm bản quyền
- Hệ thống không thông báo cho người dùng khi kết quả như vậy xuất hiện
- Hệ thống cũng không cung cấp thông tin nguồn gốc của hình ảnh được tạo ra
- Người dùng có thể không biết hình ảnh mình tạo ra có vi phạm hay không
Các hệ thống hiện tại như DALL-E và ChatGPT gần như là hộp đen, và với cấu trúc hiện nay, việc ghi nhận nguồn tài liệu gốc được cho là rất khó
- Một số công ty đang nghiên cứu vấn đề liên quan, nhưng Marcus nói rằng ông vẫn chưa biết đến giải pháp nào thuyết phục
- Ông cho rằng vi phạm có thể tiếp diễn cho đến khi xuất hiện kiến trúc mới có thể truy vết ổn định nguồn gốc của văn bản hoặc hình ảnh được tạo ra
- Một hệ thống tốt nên cung cấp cho người dùng danh sách nguồn, nhưng các hệ thống hiện tại không làm như vậy

Sự lan rộng của các vụ kiện và rủi ro của Microsoft

Vụ kiện của New York Times nhiều khả năng là trường hợp đầu tiên trong nhiều vụ kiện
- Trong cuộc khảo sát Marcus thực hiện trên X, đa số dự đoán sẽ có dàn xếp
- Về quy mô dàn xếp, nhiều người trả lời dự đoán từ 100 triệu USD trở lên, và 20% dự đoán 1 tỷ USD
- Nếu mở rộng sang các hãng phim, công ty trò chơi điện tử và những tòa soạn khác, quy mô số tiền có thể tăng lên
Vì các trường hợp này được thực hiện trên Bing thông qua DALL-E, Microsoft cũng được cho là đối mặt với rủi ro trách nhiệm pháp lý

1 bình luận

GN⁺ 2023-12-31

Ý kiến trên Hacker News

Mọi người đang quá dễ dàng chấp nhận kiểu tường thuật mang tính doanh nghiệp rằng ai đó có thể thực sự sở hữu những thứ như thế này
Rốt cuộc ai thực sự sở hữu các câu chuyện về Bạch Tuyết và Lọ Lem? Những câu chuyện này không xuất phát từ Disney mà là một phần của kho tàng dân gian được truyền lại qua nhiều thế hệ, và thành công của Disney cũng phần nào dựa trên việc chuyển thể những câu chuyện có sẵn mà cộng đồng đã chia sẻ và biến đổi suốt nhiều thế kỷ
Cuộc thảo luận này không chỉ nên xoay quanh chi tiết kỹ thuật của AI hay lập luận pháp lý về bản quyền, mà còn phải là vấn đề hiểu được những gốc rễ sâu xa của nền văn hóa mà chúng ta cùng chia sẻ
Văn hóa về bản chất là tài sản chung, và nó tiến hóa, phát triển thông qua kể chuyện tập thể và diễn giải lại
Tranh luận về AI tạo sinh và xâm phạm bản quyền dường như đang bỏ lỡ chính nền tảng này của sự tiến hóa văn hóa. Thuật toán có thể là mới, nhưng việc tái tưởng tượng và tái sử dụng câu chuyện thì đã lâu đời như chính loài người
Disney đã dựng nên “ngôi nhà chuột” của mình trên nền văn hóa và các câu chuyện có sẵn, nên giờ lại đòi hạn chế các công cụ biểu đạt văn hóa để phục vụ một thứ bản quyền cũ kỹ và kỳ quặc thì thật vô lý
- Muốn đưa ra lập luận đó thì phải chọn ví dụ vốn chưa nằm trong phạm vi công cộng. Disney chỉ sở hữu cách diễn giải của riêng họ, và có thể đòi hỏi cả những vùng phái sinh mơ hồ nếu thuyết phục được tòa, nhưng không sở hữu toàn bộ câu chuyện Bạch Tuyết hay Lọ Lem
  Hình minh họa trong bài dùng khá nhiều thứ còn rất mới, và thậm chí không có gì phải nghi ngờ về việc đó có phải Mario hay Coca Cola hay không. Nếu Nintendo và Coca Cola từng làm chiến dịch quảng bá chung thì người ta hoàn toàn có thể tin hình ảnh đó nguyên xi
  Nếu lập luận là về toàn bộ khái niệm một anh thợ sửa ống nước thấp đậm mặc đồ trông giống Mario thì lại là chuyện khác, nhưng ở đây đơn giản là Mario và Luigi. Là Robocop và C3PO. Chẳng hề tinh tế chút nào. Nếu có thể xóa những nhãn hiệu như thế bằng cách giặt qua AI thì cái gì cũng có thể giặt qua AI được
- Trong thực tế, chúng ta đang sống dưới một hệ thống pháp luật mà không ai trong chúng ta tự thiết kế và vốn được biết là không hoàn hảo. Có thể kêu gọi cải cách, nhưng các nhà làm LLM sẽ bị phán xét theo luật hiện hành như nó đang được ban hành
  Cái mới nằm ở LLM và công nghệ của nó, chứ không phải ở việc dùng lý tưởng cao đẹp về tính mở văn hóa để xem xét lại toàn bộ bản quyền
  Vì vậy đây không đơn thuần là một tường thuật doanh nghiệp, mà là luật pháp làm nền cho tường thuật đó, đúng hay sai thì vẫn thế. Doanh nghiệp có thể đã đóng vai trò lớn trong việc định hình luật, nhưng bản quyền cũng mang lại lợi ích cho cá nhân. Đây không phải chỉ là tuyên truyền hay thao túng thực tại chung bằng tường thuật doanh nghiệp; đó là thứ được thẩm phán phân xử và được thực thi bởi những người có súng và nhà tù
  Vì đây là một vấn đề pháp lý nên bắt buộc phải bàn đến chi tiết kỹ thuật của luật. Nếu gạt đi và nói rằng chỉ nên bàn về tường thuật xã hội thì sẽ thay thế hệ quả vật chất và hiện thực bằng tưởng tượng. Cũng nên bàn về việc bản quyền và quyền sở hữu trí tuệ có thể kìm hãm sáng tạo, nhưng đồng thời không thể phớt lờ những gì đang thực sự diễn ra
- Câu trả lời này quá tách rời thực tế. Luật bản quyền rất rõ ràng. Ở đây, tường thuật doanh nghiệp thực ra lại là lập luận rằng “AI” là thứ gì đó mới và khác đến mức luật hiện hành không áp dụng được, mà điều đó thì vô lý
- Phạm vi công cộng hay tài sản chung cũng là một phần của bản quyền, nên không thể nói như thể đó là một khái niệm bị lãng quên cần được khôi phục lại trong diễn ngôn
  Tuy vậy, Georgism thì quả thực chưa được xem xét đầy đủ
  Hàm ý pháp lý cũng là hàm ý nhân văn, và cũng là một phần của văn hóa như mọi thứ khác. Nó liên quan đến điều gì là công bằng, và việc ghi nhận, phân phối phần thưởng cho nỗ lực như thế nào
  Trong những nền văn hóa không lấy kinh tế thị trường làm trung tâm, kiểu hình thức hóa này có thể kém quan trọng hơn, và những cách nói như “tấm thảm dân gian phong phú được dệt nên” gợi cảm giác muốn quay lại thế giới đó, nhưng xã hội đang cân nhắc cách đối xử với AI không phải là một xã hội như vậy
  Chính ý tưởng cho rằng bản quyền trở nên vô hiệu hoặc lỗi thời vì năng lực sao chép mới mới là một cách nghĩ đảo ngược theo nghĩa đen. Bản quyền có sức thuyết phục chính vì năng lực sao chép mới
  Năng lực cụ thể lúc đó là in ấn công nghiệp, và những người trông thông minh hơn hẳn một kỹ sư phần mềm điển hình ngày nay đã hiểu rằng năng lực đó tạo ra các động lực bị lệch giữa bên có khả năng sao chép mới và bên tạo ra tác phẩm làm nền cho giá trị ấy. Cốt lõi của thỏa thuận về bản quyền là căn chỉnh lại những động lực này
  Công nghệ sao chép mới có thể thay đổi chi tiết về việc cấm, hạn chế hay cho phép điều gì, cũng như các tiêu chí, quyền thực thi và giới hạn đi kèm. Nhưng nó không làm thay đổi sự khôn ngoan cốt lõi của thỏa thuận đó. Muốn thay đổi điều ấy thì cần một cách tốt hơn để tổ chức và tưởng thưởng năng lực sản xuất của xã hội
- Bản quyền chưa bao giờ dựa trên lập trường đạo đức, mà luôn được quyết định bởi sức mạnh vận động hành lang của nhiều nhóm khác nhau
  Nhưng vì thế mà đòi xóa bỏ bản quyền chỉ để các công ty AI tạo sinh kiếm được nhiều tiền hơn thì nghe hoàn toàn kỳ quặc
Tôi thấy câu hỏi đó là sai
Ai cũng biết mọi mô hình đều được huấn luyện bằng tài liệu có bản quyền và có thể tạo ra đầu ra giống đến mức rợn người
Nhưng chuyện đó đã diễn ra ở quy mô lớn rồi, và các tập đoàn lớn đã lao vào toàn diện. Không thể nhét kem đánh răng đã bóp ra lại vào tuýp được
Nó giống thời các ông lớn công nghệ xây dựng doanh nghiệp trên nền thu thập dữ liệu người dùng một cách hung hăng. Việc đó có đúng không, có đạo đức không, thậm chí có hợp pháp không, ở giai đoạn này gần như chỉ còn là tranh luận học thuật. Họ cứ thế làm, và trên thực tế đã triển khai mà không có informed consent đúng nghĩa từ xã hội
Câu hỏi đúng ở đây là “giờ sẽ làm gì tiếp theo”. Giống như với công nghệ theo dõi, câu trả lời có lẽ sẽ gần với “chẳng có gì xảy ra”
- Tôi không đồng ý với ý “không thể nhét kem đánh răng đã bóp ra lại vào tuýp”. Trước đây đã từng có chuyện tương tự
  Các công nghệ như ghi âm nhạc giá rẻ và sản xuất hàng loạt cũng vậy. Bạn có thể thu âm nghệ sĩ một lần rồi sản xuất đĩa hàng loạt, nhưng điều đó không có nghĩa là bạn có thể thu âm Taylor Swift một lần rồi sao chép vô hạn mà không trả tiền
  Nên đọc về cuộc đình công của nhạc công năm 1942: https://jacobin.com/2022/03/1940s-musicians-strike-american-...
- Đây là kiểu nói cho thấy không hiểu lịch sử
  Điều này đã xảy ra từ Napster, rồi đến Apple Music, và giờ là các dịch vụ streaming
  Thay vì việc chia sẻ tệp tràn lan còn tồn tại rộng rãi trong công chúng, chúng ta có thiết bị mình không sở hữu và các gói thuê bao streaming
  Apple không просто sao chép toàn bộ nhạc vào iPod rồi đem bán, mà đã mất 10 năm đàm phán hợp đồng và rất nhiều tiền để có được quyền nội dung
  Tôi không định nói cái gì đúng hay sai, chỉ là đây là lời nói của người gần như không hiểu những cuộc chiến kiểu này
- Có vẻ bạn đang nói rất trôi chảy câu “nó đã xảy ra rồi nên cứ bỏ cuộc đi”. Chắc sẽ cực kỳ hữu ích cho việc giải quyết vấn đề và hành động
- Về cơ bản là đang nói đó là chuyện đã rồi. Giống như nhiều đổi mới trong lĩnh vực công nghệ, luật ngu ngốc nên cứ vi phạm luật rồi giành lấy vị thế thống trị thị trường
  Nó làm tôi nhớ đến thời Uber và AirBnB bất hợp pháp ở phần lớn các thành phố lớn nhưng cuối cùng vẫn chiếm được thị trường
  Cá nhân tôi lại thấy như vậy là tốt. Tôi chưa bao giờ tin vào những thứ như quyền sở hữu trí tuệ. Bằng sáng chế, bản quyền, và toàn bộ bó “quyền” tưởng tượng đó nên bị xóa bỏ
  Hơn một nửa thế giới, tức Global South, thậm chí còn không công nhận những quyền này, và giờ việc thực thi chúng cũng ngày càng khó hơn nếu không có sự cưỡng chế pháp lý hà khắc và tập trung độc quyền
- Có thể buộc họ hủy mô hình hoặc huấn luyện lại mà không dùng tài liệu có bản quyền chưa được cấp phép hoặc đến nay vẫn chưa xin được phép
  Đây là những công ty trị giá hàng chục tỷ đến hàng nghìn tỷ USD. Dù cổ đông và CEO có ghét đến đâu thì họ vẫn hoàn toàn có khả năng hành xử như thành viên có trách nhiệm của xã hội trong chuyện này
Ở EU thì điều này lẽ ra không nên là vấn đề. Điều 3 và 4 của chỉ thị “Copyright in the Digital Single Market” đã điều chỉnh việc này
Theo phần tóm tắt của Wolters Kluwer, mọi chủ thể khác, bao gồm cả các nhà phát triển machine learning thương mại, chỉ có thể sử dụng các tác phẩm được truy cập hợp pháp khi chủ sở hữu quyền không bảo lưu rõ ràng việc dùng cho mục đích khai thác văn bản và dữ liệu
Theo tôi biết thì người ta đang bàn về thứ gì đó như robot.txt để đánh dấu “không được huấn luyện”. Có lẽ sẽ phải triển khai một số biện pháp bảo vệ nhất định, và người dùng cuối sẽ phải cẩn trọng khi sử dụng đầu ra được tạo ra
Nguồn Kluwer: https://copyrightblog.kluweriplaw.com/2023/02/20/protecting-...
Văn bản gốc luật EU: https://eur-lex.europa.eu/eli/dir/2019/790/oj
- Có vẻ kỳ lạ khi EU còn không thể thống nhất rằng cờ Do Not Track của trình duyệt web có tính ràng buộc pháp lý, nhưng lại cho rằng các doanh nghiệp nội dung lớn nên có thể tạo một cờ có tính ràng buộc pháp lý trên website để tránh bị scraping dữ liệu
- Đó có vẻ là một cách diễn giải lạ lùng, có lẽ hơi mang tính hy vọng. Điều 4 chẳng phải trao ngoại lệ cho tất cả mọi người, bao gồm cả các nhà phát triển machine learning thương mại, đối với mục đích khai thác văn bản và dữ liệu sao?
  https://eur-lex.europa.eu/eli/dir/2019/790/oj
Trách nhiệm bảo đảm không vi phạm bản quyền thuộc về người công bố tác phẩm
Bạn tự vẽ, giao cho một họa sĩ tập sự không có đào tạo pháp lý, tự chụp ảnh, hay dùng AI để tạo hình ảnh thì cũng không khác gì
Tại sao lại giả định rằng ChatGPT hay công cụ khác sẽ không tạo ra nội dung có bản quyền sẵn có?
Có thể hiểu được giả định ngây thơ rằng vì nó được “tạo ra” nên hẳn phải là nguyên gốc. Nhưng ngay khi thay “ChatGPT” bằng “họa sĩ junior” thì giả định đó sụp đổ
Giả sử bạn bảo nó vẽ một droid trong phim khoa học viễn tưởng, và không nói gì thêm. Không nhắc đến bản quyền, cũng không nói nó phải độc đáo. Vậy bạn mong nó sẽ vẽ gì?
- OpenAI đang bán quyền truy cập vào các mô hình GPT, và các mô hình đó đang xuất ra tài liệu có bản quyền mà tôi tiêu thụ. Như vậy chẳng phải cũng là vi phạm y hệt sao?
- Nếu vậy thì AI tạo sinh trên thực tế sẽ trở nên không dùng được. Vì không thể biết đầu ra có phải đạo văn hay không, nên lúc nào cũng phải nghi ngờ và tuyệt đối không dùng nó
- Lập luận đó không hợp lý
  Ngay cả người họa sĩ junior giả định đó cũng sẽ phải chịu ít nhất từng ấy, thậm chí là trách nhiệm lớn hơn
Thật đáng ngạc nhiên khi có quá nhiều câu trả lời dường như hoàn toàn không hiểu điểm cốt lõi của bài viết này và vụ kiện của NYT. ChatGPT đã có thể tái hiện và công khai nguyên văn đầy đủ những phần đáng kể của các bài báo NYT với độ dài từ hàng trăm đến hàng nghìn từ
Đây không phải là tác phẩm phái sinh. Nó đã vượt xa giai đoạn đó rồi. NYT có một vụ kiện rất mạnh, và những người tranh luận về ưu nhược điểm của bản quyền đang lạc khỏi trọng tâm
Riêng phiên tòa này sẽ không tự mình lật ngược luật bản quyền. Thứ OpenAI có thể viện ra chỉ là kiểu “đây là điều mới, làm sao biết nó sẽ thành ra thế này được”. Nếu vậy thì các mô hình đã được huấn luyện hiện nay đang ở trong tình thế rất khó xử
Ngoài ra, có vẻ NYT sẽ không dàn xếp. Hệ quả quá lớn, và nếu dàn xếp với OpenAI thì những vụ tương tự sẽ xuất hiện với mọi mô hình khác. Mọi cơ quan báo chí khác xuất bản nội dung số cũng sẽ có những vụ kiện tương tự với cơ sở vững chắc
Đây là một điểm ngoặt của AI tạo sinh, và có vẻ nhiều khả năng nó sẽ trở nên đắt đỏ hơn rất nhiều hoặc bị hạn chế hơn rất nhiều so với những gì chúng ta nghĩ lúc đầu
Một hệ quả phụ là tôi nghĩ các mô hình hải tặc sẽ tăng lên. Những mô hình phớt lờ hoàn toàn tính hợp pháp, được huấn luyện theo cách phân tán, và có trọng số được phân phối bởi cộng đồng thay vì công ty, ví dụ như mô hình torrent, có thể sẽ xuất hiện
Cũng khá có khả năng những mô hình này sẽ vượt các mô hình “ngoan ngoãn” chính thức về hiệu năng. Có vẻ vài năm tới sẽ diễn biến rất thú vị
- OpenAI có lẽ gần như có thể sao chép cách làm của Google/YouTube trong vấn đề này và cung cấp một hệ thống kiểu Content ID
  Cụ thể, lập luận sẽ là ChatGPT về cơ bản không tự tái hiện tác phẩm có bản quyền, mà tái hiện do yêu cầu hoặc hành vi của người dùng bên thứ ba, giống như cách YouTube cung cấp video do mọi người tải lên
  Ý định của OpenAI không phải là xâm phạm bản quyền, và thực tế nhiều hoặc hầu hết các nhà nghiên cứu đã tin rằng mô hình không bị overfit tới mức có thể tái hiện phần đáng kể của một tác phẩm bất kỳ
- Tôi hiểu chính xác NYT đang nắm gì. Đó là một vụ rất mạnh. Nhưng tôi nghĩ vụ này nên làm rung chuyển luật bản quyền. Bản quyền đã hỏng nặng, và đã như vậy từ lâu
  Về bản chất, bản quyền mà không có tập đoàn lớn chống lưng thì gần như vô nghĩa, còn nếu có tập đoàn chống lưng thì nó có thể bị khóa vĩnh viễn bất kể những giới hạn vốn phải có của bản quyền
  Việc OpenAI có thể tái hiện nguyên văn tin tức cũ không khiến NYT mất gì cả
  Nếu NYT thắng, thứ chúng ta mất sẽ rất nhiều. Đã đến lúc nhìn lại bản quyền. Thực sự có thể làm điều đó, và vì nó khá lỗi thời nên cần được cập nhật
- Điều đó cũng từng xảy ra với DALLE, Midjourney và Stable Diffusion
  Stable Diffusion nếu tận dụng tối đa những thứ như Control Net và LoRA thì sẽ áp đảo các mô hình độc quyền khác
Có thể hơi lý tưởng hóa, nhưng tôi luôn tin rằng mục đích cốt lõi của nghệ thuật và xuất bản không chỉ là kiếm thật nhiều tiền, mà còn phải là tác động tới văn hóa và xã hội
Vì vậy, tôi cho rằng tác phẩm gốc cần được bảo vệ, nhưng cũng nên đi vào phạm vi công cộng nhanh hơn nhiều để nuôi dưỡng sự sáng tạo và cảm hứng. Nên nghĩ thời gian chuyển tiếp theo đơn vị vài năm chứ không phải vài chục năm
- Lập luận rằng mục đích cốt lõi của nghệ thuật là tác động xã hội nghe như một điệp khúc lặp lại rất phổ biến trên truyền thông dạo này, và tôi hoàn toàn không đồng ý
  Mục đích chính của nghệ thuật là khơi dậy cảm xúc ở cá nhân. Ý tưởng rằng nghệ thuật phải dạy dỗ bài học có lẽ là lý do hiện nay có quá nhiều tác phẩm hư cấu “mang màu sắc hoạt động xã hội” một cách lộ liễu
- Vậy các nghệ sĩ sẽ ăn gì cho bữa tối?
- Tại sao chỉ nghệ thuật phải chịu quy tắc này còn những lĩnh vực khác thì không?
Những điều này có vẻ không quá khó để sửa. Phần lớn ví dụ là cách gọi tắt để chỉ những đối tượng nổi tiếng, chứ không phải mô tả chung chung
“Thợ sửa ống nước trong trò chơi điện tử” về thực chất gần như đồng nghĩa với “Mario”, và ai biết dù chỉ một chút về nhân vật đó đều hiểu điều này
Tương tự, sau khi cho công cụ mô tả một hình ảnh như Mario [1], thì việc loại bỏ các kết quả như vậy đối với những người nhập “thợ sửa ống nước trong trò chơi điện tử” sẽ khó đến mức nào?
1. Lệnh describe của Midjourney có thể mô tả hình ảnh. Có lẽ các công cụ AI khác cũng có tính năng tương tự: https://docs.midjourney.com/docs/describe
Cách sửa như vậy trông khá phản địa đàng. Hãy tưởng tượng Photoshop kiểm tra ảnh được tải lên để xem có phải tài liệu có bản quyền hay không, rồi từ chối xử lý nếu cho rằng có chứa tư liệu hoặc nhân vật có bản quyền. Ngay cả khi đó là fanart do chính bạn tự vẽ cũng vậy
Điều này khiến tôi nhớ đến thời kỳ đầu của Internet, khi người ta cố xóa fanfiction miễn phí với lý do vi phạm luật bản quyền. Theo quan điểm của tôi, việc áp dụng luật bản quyền vào mục đích sử dụng cá nhân khi tác giả còn không định bán tác phẩm là khá kinh khủng
Hãy tưởng tượng 50 năm sau. “Robot ơi, cắt giúp tôi bức tranh tôi vẽ này để làm mô hình ở trường nhé?” “Tất nhiên rồi.” “Cái này nữa nhé.” “Lỗi: bức tranh này có thể chứa tư liệu có bản quyền nên không thể xử lý.”
Những ví dụ như vậy thực sự chỉ là các trường hợp nhỏ nhặt hoặc cực đoan. Có hai điều cần nhìn vào ở đây
Các hệ thống AI tạo sinh hoàn toàn có đủ khả năng tạo ra tài liệu vi phạm bản quyền
Và khi làm vậy, chúng không thông báo cho người dùng
Vì thế, bất kỳ đầu ra nào cũng có thể xâm phạm một nguồn tư liệu ít người biết trên web nhưng vẫn còn được bảo hộ, và bất kỳ ai sử dụng đầu ra đó đều có thể đối mặt với rủi ro bị kiện mà không có bất kỳ cảnh báo nào
Điều này rất khó để khắc phục
Sẽ rất khó để loại bỏ mọi “cách gọi tắt cho đối tượng nổi tiếng” hay prompt có thể được dùng để tạo nội dung có bản quyền hoặc nhãn hiệu
Nếu không cố tình tạo nội dung vi phạm thì có thể lọc bỏ hoặc loại đi các kết quả như vậy, nhưng vấn đề là những người cố lừa AI để tạo ra loại nội dung đó. Trừ khi loại bỏ toàn bộ dữ liệu huấn luyện có bản quyền hoặc nhãn hiệu, gần như không thể ngăn họ
Một vấn đề khác của AI tạo sinh là như bài viết đã nói, “các hệ thống như DALL-E và ChatGPT về bản chất là hộp đen”
Điều gì sẽ xảy ra nếu AI được dùng cho việc ra quyết định trong những tình huống mà người dùng hoặc bên bị ảnh hưởng có quyền biết chính xác vì sao AI đưa ra quyết định đó? Ở góc độ kinh doanh và pháp lý, tôi cho rằng các giải pháp AI hiện nay là rủi ro và chỉ nên được dùng rất hạn chế. Bởi ngay cả những người tạo ra chúng cũng không thể chỉ ra chính xác mẩu thông tin nào đã khiến AI đưa ra lựa chọn đó
Cách đó khi mở rộng quy mô sẽ gần như bất khả thi
Làm sao biết được mình đang nhập một “đối tượng nổi tiếng” khi không hề biết trước?
Nếu tôi nhập “columbian coffee logo” rồi nhận ra các logo thương hiệu đã tồn tại xuất hiện, thì tôi có phải đảo ngược toàn bộ Internet để kiểm tra xem những logo đó đã tồn tại hay chưa không?
AI cần phải cho thấy nguồn cảm hứng. Con người khi sáng tạo dựa trên thứ gì đó thì biết rõ mình đã dùng gì và có vượt qua ranh giới đạo văn hay không. Nhưng cách AI vận hành quá mờ đục để làm được điều đó
Tôi nghĩ việc cần làm chỉ là phơi bày nguồn gốc. Tuy vậy, điều đó cũng có nghĩa các công ty AI phải công khai dataset của họ, và có thể làm lộ cả những thông tin lẽ ra không nên lấy hoặc không nên công bố
Theo cách tôi hiểu thì tiền lệ pháp lý cho AI tạo sinh cũng giống như việc Google được phép thu thập dữ liệu từ các website để tạo chỉ mục tìm kiếm vì lợi ích công chúng
Google cũng có thể hiển thị phiên bản bộ nhớ đệm của website, và đó là nội dung gốc của chính trang đó. Sẽ không ai nói Google vi phạm bản quyền chỉ vì hiển thị nguyên văn nội dung từ website khác
Vì vậy tôi cho rằng lập luận này khá yếu. Nếu phải loại bỏ mọi tham chiếu văn hóa và mọi IP phổ biến, thậm chí cả những thứ ít nổi tiếng hơn, thì AI sẽ trở nên vô dụng
Cá nhân tôi cho rằng AI tạo sinh nên có khả năng cung cấp liên kết đến các tài liệu nguồn tương tự trong dữ liệu huấn luyện. Đây là cách tối thiểu để bù đắp cho những người đã đóng góp vào việc huấn luyện AI
Nếu AI tạo sinh đi theo hướng giết chết cả các website lẫn nghệ sĩ tạo ra tài liệu gốc, thì tôi nghĩ về lâu dài điều đó không bền vững. Nguồn tham chiếu cũng tăng tính minh bạch và giúp người dùng hiểu liệu đó có phải là ảo giác hay không
Mọi người nên có thể opt-out để nội dung của mình không bị dùng cho huấn luyện, và cũng nên có thể xác nhận liệu nó đã bị loại bỏ ở các phiên bản sau hay chưa
Thành thật mà nói, các công ty AI chỉ đang giữ bí mật để né kiện tụng. Tôi nghĩ quy định trong lĩnh vực này có thể hữu ích hơn là những kịch bản tận thế
- “Sẽ không ai nói Google vi phạm bản quyền chỉ vì hiển thị nguyên văn nội dung từ website khác”, nhưng trước đây các nhà báo và Getty Images đã từng nói như vậy
  [1]: https://yro.slashdot.org/story/03/07/14/025216/web-caching-g...
  [2]: https://www.theguardian.com/technology/2016/apr/27/getty-ima...
- “Nếu AI tạo sinh đi theo hướng giết chết cả các website lẫn nghệ sĩ tạo ra tài liệu gốc, thì về lâu dài điều đó không bền vững” chính là con voi trong phòng
  Mọi làn sóng công nghệ đều có cách thuyết phục những người sáng tạo bỏ thời gian và tiền bạc để làm ra tài liệu gốc, rồi sau đó luật chơi lại thay đổi
  Google hứa hẹn nội dung sẽ có độ phủ và thị trường mới, và điều đó thực sự đã hiệu quả. Rồi sau đó họ đưa vào snippet, quảng cáo, và đủ mọi cơ chế để giữ khách trên xa lộ của mình thay vì đưa họ đến website gốc
  Reddit, Stack Overflow và các nền tảng tương tự thì dùng gamification như điểm số và huy hiệu, cùng với cộng đồng, để khuyến khích người dùng đóng góp nội dung gốc
  Giờ thì AI đang làm lung lay các cách tiếp cận đó. Ở mỗi giai đoạn, động lực để tạo ra tài liệu gốc dường như ngày càng giảm, vì phần thưởng nhận lại ngày càng ít
  Nếu AI chỉ nhai lại nội dung gốc mà không mang lại bất kỳ lợi ích nào — không độ phủ, không gamification, không cộng đồng, không khả năng được ghi nhận — thì giờ còn động lực nào cho chuyên gia nữa?
- Câu “nên cung cấp liên kết đến các tài liệu nguồn tương tự trong dữ liệu huấn luyện” nhìn chung là bất khả thi, vì chúng không phải cơ sở dữ liệu
  Nó cũng giống như việc bạn không thể cung cấp liên kết đến các tài liệu gốc đã ảnh hưởng đến việc bạn viết bình luận này. Có bao nhiêu lần huấn luyện đã đi vào trọng số của các nơ-ron tạo ra câu trả lời đó? Bạn học cách dùng chữ nghiêng và tác động của nó đến cách diễn giải từ ngữ ở đâu? Bạn học giọng điệu phù hợp với diễn đàn này ở đâu?
  Nếu “mọi người nên có thể opt-out để nội dung của mình không bị dùng cho huấn luyện”, thì khi tôi viết sách, bạn có nên được quyền opt-out để không thể đọc cuốn sách đó không? Tôi có nên được quyền đặt điều kiện về việc ai có thể đọc tác phẩm của mình không? Tôn giáo? Màu da? Người không giỏi ghi nhớ?
  Tôi hy vọng ý tưởng hạn chế ai có thể tiếp thu tri thức nghe thật phi lý. Vậy tại sao cùng một sự hạn chế đó lại có thể chấp nhận được khi áp lên “cái gì” thay vì “ai”?
  Việc các công ty AI giữ bí mật để né kiện tụng đã dựng lên rào cản nghiên cứu. Thay vì tôi và Joe có thể cộng tác nghiên cứu và viết bài báo với cùng một bộ dữ liệu, thì dữ liệu huấn luyện lại bị che giấu. Vì sợ phe Luddites đến đập máy. Kiểu như học tập chỉ được chấp nhận khi đừng làm quá tốt
- Vẫn chưa có tiền lệ pháp lý nào được xác lập. “Tiền lệ” được mô tả ở đây là lập luận mà các công ty AI đã dùng: rằng huấn luyện mô hình bằng thông tin có sẵn trên internet nên được coi là sử dụng hợp lý
  Nhưng việc huấn luyện AI có thực sự đáp ứng bài kiểm tra 4 yếu tố của sử dụng hợp lý hay không thì vẫn còn phải chờ xem
- Khả năng cung cấp nguồn làm tham chiếu chính là điểm khác biệt cốt lõi ở đây
  Tôi đồng ý rằng AI tạo sinh cũng nên có thể triển khai điều đó, nhưng để giữ lại thông tin đó thì chi phí huấn luyện có thể sẽ đắt hơn rất nhiều và các công ty AI gần như không hứng thú với việc đó. Nhiều khả năng họ sẽ cố đánh giá các vấn đề bản quyền tiềm tàng bằng heuristic ở giai đoạn hậu xử lý
  Câu hỏi thú vị hơn là, vượt ra ngoài các trường hợp tái hiện gần như nguyên văn, liệu chủ sở hữu bản quyền có thể viện dẫn sử dụng trái phép chỉ vì các tác phẩm của họ, khi xét một cách tổng thể, đã ảnh hưởng đến AI theo một cách khái quát hơn hay không
Cần có luật rõ ràng hơn, áp dụng riêng cho AI tạo sinh. Người ta đang đưa ra quá nhiều phép so sánh và suy diễn với con người thật
Kiểu như “nếu ai đó nhìn tài liệu có nhãn hiệu rồi học vẽ, sau đó vô tình làm ra thứ gì đó tương tự thì sao”, nhưng các mô hình này không phải con người và tồn tại trong một phạm trù riêng
Tôi nghĩ các mô hình này ở một mức độ nào đó có xâm phạm nhãn hiệu, nhưng đồng thời tôi cũng nghĩ điều đó nên được cho phép. Trách nhiệm cuối cùng nên thuộc về người sử dụng hình ảnh như một phương tiện độc lập để công chúng tiêu dùng
- Tôi cũng cùng quan điểm. Việc Dall-E nhả ra C3PO tự nó hoàn toàn nên được xem là ổn. Nếu tôi không kiếm tiền từ đầu ra đó thì Disney nên lùi lại
Trong những cuộc thảo luận kiểu này, các mô hình hoạt động như một màn khói hơn là phần cốt lõi, và có vẻ như cuộc thảo luận bị mắc kẹt ở đó
Các mô hình tạo ra một khả năng chối bỏ nghe có vẻ hợp lý trong “chuỗi trách nhiệm”. Nếu bỏ “LLM” đi và thay bằng “chiếc hộp ma thuật của gánh xiếc trong công viên giải trí”, thì lập luận rằng LLM có gì đó đặc biệt nên xứng đáng được ngoại lệ sẽ biến mất rất nhanh
- Hoàn toàn đồng ý
  Án lệ Betamax nói rằng một công nghệ có những mục đích sử dụng đáng kể không vi phạm thì bản thân nó không phải là hành vi xâm phạm
  Đã có tiền lệ rằng sản phẩm do AI tạo ra không được bảo hộ bản quyền, và theo cùng logic đó, hành vi tạo ra của AI không thể hiện chủ ý. Vì vậy, việc có xâm phạm hay không nên phụ thuộc vào con người sử dụng đầu ra. Bởi bản thân hộp đen không có tính chủ thể hành vi
- Đồng ý, và tôi muốn trước tiên thấy các ví dụ cụ thể về việc LLM được dùng trong ngành theo cách “mang tính phá vỡ”, tạo ra năng suất và lợi nhuận đến mức khiến người ta mất việc, v.v.
  Trước khi kết luận rằng LLM, hay rộng hơn là các kỹ thuật sinh nội dung, somehow là làn sóng lớn tiếp theo, hoặc trước khi khẳng định rằng chúng ta đang ở ngưỡng của trí tuệ “tổng quát”, thì trước hết phải cho thấy cánh cửa đó
  Cánh cửa đó có thể là hình ảnh triển khai công nghiệp để giải quyết các vấn đề thực tế, vượt ra ngoài giá trị giải trí của việc nhập gì đó vào chiếc hộp rồi xem thứ gì đi ra ở phía bên kia. Nhưng đến giờ, theo những gì tôi thấy, dường như chưa có nơi nào thực sự làm được điều đó

Áp lực bản quyền lớn hơn đang đến với AI tạo sinh

Vụ kiện New York Times và thí nghiệm lặp lại hình ảnh

Việc tạo nội dung tương tự mà các biện pháp an toàn không chặn được

Vấn đề hộp đen không thể biết nguồn gốc

Sự lan rộng của các vụ kiện và rủi ro của Microsoft

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News