2 điểm bởi GN⁺ 2025-05-13 | 1 bình luận | Chia sẻ qua WhatsApp
  • Văn phòng Bản quyền Mỹ gần đây đã chính thức thừa nhận các trường hợp các công ty AI vi phạm bản quyền
  • Chỉ ra rằng thuật toán AI sử dụng khối lượng lớn tài liệu có bản quyền và cần có sự đồng ý cũng như bồi thường cho người sáng tạo
  • Báo cáo kết luận rằng trong một số tình huống, lập luận sử dụng hợp lý (fair use) không được chấp nhận
  • Các công ty lớn như OpenAI, Google, Meta, Microsoft đang vướng kiện tụng vì vấn đề này
  • Chính sách thân thiện với AI chồng chéo với việc sa thải nhân sự mang tính chính trị, khiến tình hình càng trở nên phức tạp

Tổng quan về báo cáo của Văn phòng Bản quyền Mỹ và vấn đề cách chức giám đốc

  • Việc giám đốc Văn phòng Bản quyền Mỹ bị cách chức diễn ra ngay sau khi một báo cáo kết luận rằng các công ty phát triển mô hình AI đã vượt quá phạm vi sử dụng hợp lý hiện có khi dùng tài liệu có bản quyền
  • Báo cáo lần này là ý kiến được đưa vào bản thảo báo cáo thứ ba liên quan đến bản quyền và AI
  • Báo cáo thứ nhất nói về vấn đề sao chép số, báo cáo thứ hai xem xét khả năng bảo hộ bản quyền đối với đầu ra của AI tạo sinh

Nội dung chính của bản thảo báo cáo

  • Ngày 9/5, bản thảo báo cáo (PDF) về việc sử dụng tác phẩm có bản quyền trong quá trình phát triển hệ thống AI tạo sinh đã được công bố
  • Việc các hệ thống AI sử dụng lượng dữ liệu khổng lồ, tức tài liệu có bản quyền, đã được thể hiện rõ ràng
  • Câu hỏi được đặt ra là liệu AI có cần nhận được sự đồng ý hoặc bồi thường cho chủ sở hữu bản quyền hay không
  • Đây cũng là điểm tranh chấp cốt lõi trong nhiều vụ kiện thực tế
  • Các công ty phát triển AI đã thừa nhận rằng họ đã dùng trái phép nội dung từ internet và các nguồn khác để huấn luyện sản phẩm

Án lệ và tiêu chí đánh giá liên quan đến sử dụng hợp lý (fair use)

  • Các công ty AI lập luận rằng họ không gặp vấn đề pháp lý dựa trên điều khoản sử dụng hợp lý trong luật bản quyền
  • Tuy nhiên, các thẩm phán nhấn mạnh rằng tiêu chí đánh giá sử dụng hợp lý là “liệu có ảnh hưởng đến thị trường tiềm năng hoặc giá trị của tác phẩm gốc hay không”
  • Nếu tác động không lớn thì có thể được coi là sử dụng hợp lý
  • Báo cáo này nêu rõ rằng trong một số tình huống cụ thể, lập luận bào chữa dựa trên sử dụng hợp lý của các công ty AI không thể được chấp nhận

Tác động của báo cáo và phản ứng từ giới học thuật

  • Báo cáo cuối cùng dự kiến sẽ sớm được công bố mà không có thay đổi lớn
  • Học giả luật Blake. E Reid đánh giá báo cáo này “rất bất lợi cho các công ty AI” và “có thể trực tiếp dẫn đến thất bại tại tòa”
  • Hiện tại Google, Meta, OpenAI, Microsoft cùng nhiều bên khác đang là đương sự trong các vụ kiện liên quan đến bản quyền

Bối cảnh của việc cách chức và ngữ cảnh chính trị

  • Thời điểm cách chức giám đốc trùng với thời điểm công bố báo cáo, làm dấy lên nghi vấn về tuyên bố chính thức rằng đây là “ấn phẩm được phát hành theo yêu cầu của Quốc hội và các bên liên quan”
  • Giáo sư Reid chỉ ra rằng việc Văn phòng Bản quyền gấp rút công bố báo cáo có thể là dấu hiệu của một đợt điều chỉnh nhân sự nội bộ (purge)
  • Thực tế, có tin cho biết chính quyền Trump đã cách chức giám đốc Shira Perlmutter

Hệ quả chính trị và mối liên hệ với Elon Musk

  • Hạ nghị sĩ Joe Morelle chỉ ra rằng việc cách chức diễn ra ngay sau khi giám đốc Văn phòng Bản quyền không đồng tình với yêu cầu sử dụng tài liệu có bản quyền để huấn luyện mô hình AI của Elon Musk
  • Musk và Jack Dorsey từng kêu gọi “xóa bỏ toàn bộ luật sở hữu trí tuệ (IP)”, đồng thời cũng có động thái thúc đẩy huấn luyện AI thông qua các bài đăng trên X (trước đây là Twitter)

Các khả năng khác về lý do cách chức

  • Xét đến việc Văn phòng Bản quyền là cơ quan trực thuộc Thư viện Quốc hội Mỹ (Library of Congress), có ý kiến cho rằng vụ việc có thể liên quan đến trường hợp giám đốc thư viện gần đây bị cách chức vì thúc đẩy chính sách đa dạng (DEI) và vấn đề lựa chọn sách thiếu nhi
  • Vì vậy, lần cách chức này có thể là hiện tượng gắn kết phức tạp giữa nhiều yếu tố nội bộ và chính trị như chính sách AI, các nhà tài trợ lớn, hoặc chính sách DEI

1 bình luận

 
GN⁺ 2025-05-13
Ý kiến trên Hacker News
  • Có ý kiến nhắc rằng nếu Mỹ cấm LLM sử dụng tài liệu có bản quyền hoặc buộc phải bồi thường cho mọi chủ sở hữu bản quyền, thì các nước khác như Trung Quốc sẽ không làm vậy. Khi đó, các công ty LLM của Mỹ sẽ tụt lại trong cạnh tranh hoặc chịu bất lợi vì gánh nặng chi phí. Kết cục là về mặt tính hữu dụng của AI, các quốc gia khác như Trung Quốc sẽ vượt lên trước. Dĩ nhiên, tôi nghĩ nên làm điều đúng đắn, nhưng trong các quyết định của chính phủ về quản lý AI luôn tiềm ẩn nỗi lo ai sẽ nắm quyền chủ đạo trong thế giới tương lai
    • Theo logic đó thì cả công dân bình thường cũng có thể đi đến kết luận rằng vì Trung Quốc chắc chắn sẽ không làm theo, nên việc tẩy rửa tài sản trí tuệ của doanh nghiệp cũng không sao. Nếu bên kia thấy ổn thì tôi cũng tham gia
    • Nhìn chung, tôi đồng ý rằng nếu hoàn toàn cho phép tiếp cận tài liệu có bản quyền thì AI có thể mạnh hơn. Tuy vậy, tôi nghi ngờ chính xác “mạnh hơn” nghĩa là gì. Nếu xét tới an ninh quốc gia, tôi ủng hộ cho LLM tiếp cận toàn diện thông tin học thuật, khoa học và kỹ thuật. Với mã nguồn độc quyền thì tôi hơi băn khoăn, nhưng tôi cho rằng đã có đủ dữ liệu mã rồi. Nhưng ngay cả khi LLM được tiếp cận toàn diện tài liệu có bản quyền, tôi cũng không rõ điều đó mang lại lợi ích thực chất nào so với trường hợp chỉ được tiếp cận bài báo, dữ liệu kỹ thuật và tài liệu có bản quyền thông qua giấy phép. Kết quả là LLM chỉ trở thành một cỗ máy đạo văn mạnh hơn rất nhiều, chứ thực ra không thông minh hơn. Lập luận này cũng tương tự với mô hình hình ảnh và video. Khi được tiếp cận tài liệu có bản quyền, mô hình có thể tạo ra nhiều hình ảnh hơn hoặc tái tạo Mario và Luigi trong vô hạn kịch bản, nhưng điều đó không đem lại lợi ích thực chất nào, nên ngược lại những mô hình như vậy nên bị cấm. Không có lợi thế quan trọng nào về an ninh hay kinh tế
    • Vấn đề thật sự là các công ty AI không cố gắng tự thay đổi luật như các tập đoàn lớn hiện hữu vẫn làm
    • Mặt khác, nếu có một tổng thống áp thuế 145% lên Trung Quốc, thì cũng có thể áp thuế 1000% lên chatbot Internet của Trung Quốc, hoặc cắt cáp Internet với lý do tình trạng khẩn cấp quốc gia. Chưa rõ Trung Quốc sẽ làm gì trong tương lai, nhưng ít nhất có vẻ họ sẽ cấm trẻ vị thành niên dùng AI. Vấn đề ứng dụng quân sự là chuyện khác với vấn đề bản quyền
    • Nếu AI thực sự quan trọng đến vậy, thì chính phủ nên sở hữu nó và để mọi công dân sử dụng miễn phí
    • Lập luận này không chỉ áp dụng cho AI mà có thể áp dụng cho mọi hành vi vi phạm sở hữu trí tuệ
    • Cá nhân tôi khó tin rằng LLM thực sự sẽ góp phần vào việc thống trị thế giới, nhưng cảm thức cạnh tranh cốt lõi nằm bên dưới toàn bộ cuộc tranh luận này
    • Trước đây việc cài Windows có bản quyền cũng chẳng gặp vấn đề gì. BSA từng xuất hiện, nhưng giờ Microsoft nhắm mắt làm ngơ vì điều đó có lợi cho họ
  • Sa thải một người vì lý do này là rất kỳ lạ. Nó trông giống như một nỗ lực kiểm duyệt cách diễn giải pháp luật. Theo tôi, xét theo truyền thống pháp lý thì việc huấn luyện mô hình bằng tài liệu có bản quyền rõ ràng là bất hợp pháp. Tất nhiên con người không bị kiện chỉ vì đọc sách, lấy cảm hứng rồi viết sách mới. Chỉ cần nhìn vô số tiểu thuyết fantasy là biết không phải tác phẩm nào cũng hoàn toàn độc lập. Tôi nghĩ cần thừa nhận rằng pháp luật chưa tính đến trường hợp này, dù AI hữu ích và đổi mới đến đâu, và cần phải sửa luật
    • Có nói rằng con người đọc sách rồi lấy cảm hứng để viết không phải đối tượng kiện tụng, nhưng trên thực tế các trường hợp “lấy cảm hứng quá mức” vẫn thường bị kiện. Các tranh chấp đạo nhạc là ví dụ nổi tiếng
    • Về mặt pháp lý, chuyện này đã được bao phủ khá đầy đủ, nhưng đây chỉ lặp lại thực tế rằng kẻ có quyền lực đứng trên pháp luật. Lẽ ra có thể ngăn chặn đủ bằng cách dùng tài liệu đã phát hành từ lâu, tài liệu Creative Commons, hoặc buộc đầu ra phải cách tác phẩm gốc một khoảng chỉnh sửa nhất định, hay liên hệ tác giả để xin phép. Nhưng các công ty AI hoàn toàn không làm những điều đó
    • AI khác con người. Việc con người có quyền không có nghĩa có thể suy ra ngay máy móc cũng có quyền. Theo logic đó thì vứt bỏ ô tô sẽ thành tội giết người
    • Con người cũng không thể làm điều mà các công ty AI muốn làm. Chuyện này giống như một sinh viên vào thư viện rồi nói “tôi muốn sao chép tất cả sách để học”. Con người cũng hữu ích và đổi mới
    • Cũng cần nhận ra rằng hữu ích không có nghĩa đương nhiên là một ý tưởng tốt
    • Nếu bản quyền biến mất, doanh nghiệp sẽ rất tức giận và hệ thống bằng sáng chế cũng sẽ sụp đổ. Các công ty Mỹ sẽ mất khả năng thống trị thế giới. Rồi chẳng mấy chốc việc sao chép lậu truyền thông sẽ bị định nghĩa lại thành lý do duy nhất để duy trì bản quyền, và các cơ quan hiện tại có thể biến thành cơ quan kiểm soát rồi thoái hóa thành cục kiểm duyệt
    • Bạn được tự do lấy cảm hứng để viết một tiểu thuyết khác, nhưng ví dụ như xuất bản chính thức "Hairy Plotter and the Philosophizer's Rock" thì sẽ không được phép
    • Vấn đề của cách phân tích này là ngay từ đầu nó không bàn đến lý do tồn tại của bản quyền. Niềm tin rằng “LLM nên được phép học từ tài liệu mà không cần xin phép” và niềm tin rằng “bản quyền có ý nghĩa” là không thể cùng tồn tại. Theo Hiến pháp Mỹ, bản quyền tồn tại để thúc đẩy tiến bộ khoa học và nghệ thuật; ở EU, mục tiêu là bảo vệ người sáng tạo và khuyến khích sáng tạo. Nếu khi tôi xuất bản sách, các công ty công nghệ có thể sao chép để huấn luyện rồi cung cấp lại cho người tiêu dùng, thì sẽ chẳng còn ai mua sách của tôi nữa. Khi đó đầu tư sẽ dừng lại và sách cũng sẽ không còn được tạo ra
    • Việc đưa sở hữu trí tuệ vào mô hình để cung cấp cho mục đích thương mại mà không có giấy phép không phải là ngoại lệ
    • Nếu sửa luật thì phải áp dụng cho mọi người, không thể là ưu đãi chỉ dành cho các công ty AI
    • Nếu con người tạo tác phẩm nhờ lấy cảm hứng từ tác phẩm có bản quyền mà không bị xem là vi phạm, thì cần giải thích rõ vì sao robot làm điều đó lại là vấn đề. Nếu robot về mặt diễn giải tạo ra một động lực mới về bản chất, thì phải xây dựng được lập luận theo cách có thể thực thi
    • Tôi không nghĩ AI là công nghệ hữu ích đến thế. Nó bắt đầu từ những năm 1950, đến giờ mới chỉ vừa đủ dùng và vẫn chưa hoạt động tử tế
    • Xem phim lậu cũng hữu ích, nhưng điều đó không hợp pháp. Con người và AI hoàn toàn khác nhau, còn lập luận về việc con người được truyền cảm hứng chỉ là khẳng định không có cơ sở
    • Muốn hát bản cover thì cần có phép, và nếu không có phép thì có thể là bất hợp pháp. Ngược lại, nếu được truyền cảm hứng để viết một bài hát thì là hợp pháp. Nếu tác phẩm do AI tạo ra đủ mới và đủ tính biến đổi thì không thành vấn đề, nhưng nếu nó sao chép nguyên xi tác phẩm của người khác rồi xuất ra thì đó là vấn đề. Pháp luật không nên dựa vào các khái niệm mơ hồ như linh hồn hay cảm hứng, mà phải dựa trên sự khác biệt của kết quả đầu ra thực tế
    • Doanh nghiệp và AI không phải con người cũng không phải sóc. So sánh với con người thì có ý nghĩa gì?
    • Tôi hiểu tâm trạng của những người sáng tạo phản đối phần mềm khôi phục IP mà không xin phép. Chỉ là tôi nghi ngờ việc đơn thuần đọc tài liệu tự nó có phải xâm phạm bản quyền hay không. Hành vi đọc hay tóm tắt trước giờ không bị luật hiện hành kiểm soát. Những tuyên bố kiểu “người ta không được đọc cuốn sách tôi phát hành”, “người ta không được viết fanfic theo phong cách của tôi”, “người ta không được luyện chép tranh danh họa trong viện bảo tàng” đều xa rời thực tế. Ở đây chúng ta cần một cuộc thảo luận xã hội hợp lý hơn và định hướng rõ ràng hơn
  • Một phụ nữ ở Minnesota bị phạt 220.000 USD vì tải lậu 24 bài hát
    • Có ý kiến chỉ ra rằng vụ đó khác với việc công ty AI huấn luyện mô hình. Họ cho rằng việc học từ dữ liệu của công ty AI không giống với chuyện chia sẻ/phân phối nguyên bài hát cho người khác
  • Cho tới nay tôi chưa từng thấy ai vừa giải thích chi tiết cấu trúc kỹ thuật của việc huấn luyện mô hình transformer, vừa đồng thời giải thích các cáo buộc vi phạm bản quyền. Tức là hiếm có trường hợp thật sự hiểu cả cơ chế huấn luyện mô hình lẫn logic của cáo buộc vi phạm bản quyền. Điều đang nói ở đây là quá trình huấn luyện, không phải kết quả được tạo ra (suy luận)
    • Vấn đề xuất hiện khi transformer tái hiện lại tài liệu mà chính nó không được phép sử dụng, và riêng điều đó cũng có thể là căn cứ kiện tụng. Còn việc chỉ riêng đụng tới một khối lượng lớn tài liệu có bản quyền có tự nó cấu thành vi phạm bản quyền hay không thì chưa rõ. Những người sáng tạo và nghệ sĩ dĩ nhiên cũng có lợi ích gắn với các sản phẩm phái sinh từ tác phẩm của họ. Nếu tác phẩm của tôi là thừa thì cứ loại nó ra
    • Bản thân việc vận hành mô hình không phải là vi phạm bản quyền, và huấn luyện cho mục đích phân tích hay nghiên cứu là chấp nhận được. Nhưng sử dụng thương mại, thay thế thị trường v.v. thì bị xem là vượt quá phạm vi fair use
    • Cũng muốn biết phương thức huấn luyện này khác gì với transformer trong codec video, và nén mất dữ liệu khác với vi phạm bản quyền ở điểm nào
    • Trong khi ngay cả hành vi của con người (viết ra cùng một câu) cũng không thể giải thích một cách có cấu trúc, thì chưa có trường hợp nào thảo luận rõ ràng vì sao huấn luyện AI lại là vi phạm. Tức là chưa có cuộc thảo luận nào đồng thời xử lý cả chuyện đọc và chuyện đạo văn
    • Trọng tâm của tranh cãi này là các công ty AI không trả phí bản quyền để lấy sách phục vụ mục đích đầu vào, mà tải xuống trái phép rồi sử dụng
    • Thực tế nó hoạt động thế nào không quan trọng; điều quan trọng là rốt cuộc nó làm ra cái gì
    • Số người vừa là lập trình viên vừa là luật sư bản quyền tuy ít nhưng không phải là không có. Tuy nhiên rốt cuộc điều quan trọng vẫn là tòa sẽ phán thế nào. Trong vụ này, nội dung đó có thể thực ra không quan trọng
    • Nếu máy móc sao chép tác phẩm của người khác thì đó là vi phạm bản quyền. Con người và máy móc không giống nhau, và vì điều đó chưa được chứng minh nên pháp luật không cho phép
    • Tôi có bằng chứng về hành vi xâm phạm, rồi chia sẻ tài liệu tham khảo
    • Những người hiểu cấu trúc phương thức huấn luyện lại thường cho rằng đây không phải là vi phạm bản quyền
  • Bản dự thảo báo cáo công khai trông chỉ như việc liệt kê các bất mãn của người nắm bản quyền. Cơ sở lập luận không sâu
    • Không cần cơ sở sâu. Nếu AI đọc 100 bài báo rồi xuất bản một bài báo mới thì đó là đạo văn. Một người có trí nhớ hoàn hảo, tái sắp xếp bài viết có sẵn rồi xuất bản bài mới, cũng là vi phạm bản quyền. Chỉ có các tập đoàn lớn là ngoại lệ
    • Nó không chỉ là danh sách bất mãn đơn thuần. Có ý kiến cho rằng các chủ sở hữu bản quyền đang tìm cách lách qua tòa bằng cách làm suy yếu nguyên tắc fair use trong bối cảnh thế cờ pháp lý đang bất lợi cho họ
    • Tôi cũng không mấy đồng cảm
  • Tôi không thể đồng ý với kết luận rằng nếu AI dùng quy mô lớn các tác phẩm có bản quyền cho mục đích thương mại để tạo nội dung cạnh tranh với thị trường hiện có thì điều đó vượt quá fair use. Tôi không hiểu vì sao việc vay mượn một chút từ nhiều nguồn khác nhau rồi tạo ra thứ gì đó một cách sáng tạo lại không phải fair use. Lập luận này rốt cuộc dẫn về câu hỏi về lợi ích công cộng và mục đích căn bản của bản quyền
  • Có ý kiến chỉ ra rằng trong chính quyền hiện tại đang có quá nhiều hành động phục vụ các nhóm lợi ích đặc biệt
  • Hướng dẫn tham khảo tài liệu PDF "Copyright and Artificial Intelligence Part 3: Generative AI Training"
  • Có cảm giác luật sở hữu trí tuệ đang dần biến thành công cụ cho các vụ kiện của tập đoàn lớn nhằm kìm hãm sự lan truyền ý tưởng. Nếu việc biết toàn bộ nội dung một cuốn sách là bất hợp pháp, thì rất mơ hồ không biết có thể hạn chế đến đâu đối với việc mã hóa mức độ nhận biết nội dung. Khi thẩm phán phán quyết ở đây, vấn đề không còn là sao chép thương mại mà là kiểm soát tri thức tập thể của nhân loại
  • Có người đồng cảm rằng cùng một vấn đề lại lặp lại trong cuộc tranh luận lần này như ở những tranh cãi trước đây