Microsoft chịu trách nhiệm thay khách hàng trong các vụ kiện bản quyền liên quan đến Copilot
(blogs.microsoft.com)- Nếu khách hàng thương mại bị kiện vi phạm bản quyền do sử dụng Copilot hoặc đầu ra của công cụ này, Microsoft sẽ bảo vệ họ và chịu các khoản tiền theo phán quyết bất lợi hoặc thỏa thuận dàn xếp
- Cam kết này mở rộng hỗ trợ bồi thường trách nhiệm sở hữu trí tuệ hiện có sang các dịch vụ Copilot thương mại, bao gồm Microsoft 365 Copilot, GitHub Copilot và Bing Chat Enterprise
- Khách hàng phải sử dụng bộ lọc nội dung và các rào chắn an toàn tích hợp trong sản phẩm, và không được cố tạo ra nội dung vi phạm bằng đầu vào mà họ không có quyền sử dụng
- Theo bản cập nhật ngày 5/1/2024, tên cam kết được đổi thành Customer Copyright Commitment và mở rộng đến cả khách hàng thương mại của Azure OpenAI Service
- Microsoft không tuyên bố quyền sở hữu trí tuệ đối với đầu ra của Copilot, đồng thời cho rằng cần cùng xử lý các vấn đề về bản quyền, thù lao cho nhà sáng tạo và cạnh tranh trong AI tạo sinh
Cam kết trách nhiệm bản quyền của Copilot
- Microsoft đưa ra Copilot Copyright Commitment để đáp lại lo ngại của khách hàng rằng việc sử dụng đầu ra của AI tạo sinh có thể dẫn đến khiếu nại vi phạm bản quyền
- Nếu khách hàng thương mại bị bên thứ ba kiện vi phạm bản quyền vì dịch vụ Microsoft Copilot hoặc đầu ra của dịch vụ, Microsoft sẽ bảo vệ khách hàng và chi trả khoản tiền theo phán quyết bất lợi hoặc thỏa thuận dàn xếp
- Để được áp dụng, khách hàng phải sử dụng rào chắn an toàn và bộ lọc nội dung tích hợp trong sản phẩm của Microsoft
- Microsoft cho rằng vì họ thu phí Copilot từ khách hàng thương mại, các vấn đề pháp lý phát sinh trong quá trình sử dụng cũng nên do Microsoft, chứ không phải khách hàng, gánh chịu
Phạm vi áp dụng và điều kiện đối với khách hàng
- Copilot Copyright Commitment mở rộng bảo đảm bồi thường trách nhiệm IP hiện có của Microsoft sang các khiếu nại bản quyền liên quan đến việc sử dụng Copilot dựa trên AI và đầu ra của nó
- Đối tượng áp dụng là các dịch vụ Microsoft Copilot thương mại có trả phí và Bing Chat Enterprise
- Microsoft 365 Copilot: cung cấp AI tạo sinh trong Word, Excel, PowerPoint, v.v., cho phép người dùng suy luận dựa trên dữ liệu của chính họ hoặc chuyển tài liệu thành bài thuyết trình
- GitHub Copilot: dịch vụ giúp lập trình viên giảm thời gian viết mã lặp lại và dành nhiều thời gian hơn cho các kết quả mới mẻ, có tính biến đổi
- Khách hàng phải sử dụng bộ lọc nội dung và các hệ thống an toàn khác được tích hợp trong sản phẩm
- Không được cố gắng tạo ra nội dung vi phạm, hoặc cung cấp cho dịch vụ Copilot đầu vào mà họ không có quyền sử dụng phù hợp
- Lợi ích này không thay đổi lập trường hiện có của Microsoft rằng họ không tuyên bố quyền sở hữu trí tuệ đối với đầu ra của các dịch vụ Copilot
Lo ngại về bản quyền và cân bằng chính sách
- AI tạo sinh giúp nâng cao hiệu quả và khả năng sáng tạo của khách hàng, nhưng cũng đặt ra câu hỏi liệu việc sử dụng đầu ra có thể dẫn đến khiếu nại vi phạm IP hay không
- Các nhà văn và nghệ sĩ đã công khai nêu vấn đề về việc tác phẩm của họ được sử dụng như thế nào trong các mô hình và dịch vụ AI, và Microsoft cho rằng những lo ngại này của khách hàng là có thể hiểu được
- Dù luật bản quyền hiện hành có những lĩnh vực đã rõ ràng, AI tạo sinh vẫn tạo ra các vấn đề chính sách công mới
- Microsoft đưa ra đồng thời ba mục tiêu
- AI phải đóng góp vào việc phổ biến tri thức và giải quyết các thách thức xã hội
- Nhà sáng tạo phải kiểm soát được các quyền của mình theo luật bản quyền và có nguồn thu lành mạnh từ tác phẩm
- Nội dung cần thiết cho việc huấn luyện mô hình AI và cung cấp căn cứ không nên bị khóa trong tay một số ít công ty, cản trở cạnh tranh và đổi mới
Các cơ chế bảo vệ tích hợp trong Copilot
- Microsoft tích hợp bộ lọc và các công nghệ khác để giảm khả năng Copilot trả về nội dung vi phạm
- Các cơ chế bảo vệ này được kết hợp với những công việc hiện có về an toàn số, bảo mật và bảo vệ quyền riêng tư
- Các rào chắn an toàn được sử dụng gồm bộ phân loại, meta-prompt, lọc nội dung, giám sát vận hành và phát hiện lạm dụng
- Phát hiện lạm dụng bao gồm cả những cách sử dụng có khả năng vi phạm nội dung của bên thứ ba
- Copilot Copyright Commitment đặt ra yêu cầu khách hàng sử dụng các công nghệ này, qua đó tạo động lực để tôn trọng tốt hơn các lo ngại về bản quyền
Mở rộng sang Azure OpenAI Service
- Theo bản cập nhật ngày 5/1/2024, Microsoft đã mở rộng Copilot Copyright Commitment thành Customer Copyright Commitment vào ngày 15/11/2023
- Phạm vi mở rộng bao gồm khách hàng thương mại sử dụng Azure OpenAI Service
- Nếu bị kiện vi phạm bản quyền do sử dụng đầu ra của Azure OpenAI Service, Microsoft cũng sẽ bảo vệ khách hàng và chi trả khoản tiền theo phán quyết bất lợi
- Việc mở rộng này nhằm xử lý thêm những lo ngại của khách hàng về trách nhiệm vi phạm IP tiềm ẩn có thể phát sinh khi sử dụng đầu ra của Microsoft Copilot và Azure OpenAI Service
- Để nhận được lợi ích từ Customer Copyright Commitment, khách hàng phải triển khai các rào chắn an toàn và biện pháp giảm thiểu bắt buộc do Microsoft cung cấp
- Microsoft cung cấp tài liệu và công cụ cho Azure OpenAI Service để hỗ trợ sử dụng AI có trách nhiệm và giảm rủi ro vi phạm nội dung có bản quyền
Sự phổ biến của AI và bảo vệ tác phẩm sáng tạo
- Microsoft xem động thái này là bước đầu tiên, và cho rằng các câu hỏi pháp lý do AI tạo ra cần được ngành giải quyết cùng nhiều bên liên quan
- Đối với khách hàng, đây là lời cam kết rằng Microsoft sẽ chịu trách nhiệm bản quyền cho sản phẩm
- Microsoft nhìn nhận tích cực lợi ích của AI, đồng thời cũng nhận thức các thách thức và rủi ro, bao gồm bảo vệ tác phẩm sáng tạo
- Công ty cho rằng cần hợp tác với ngành công nghệ, các nhà văn và nghệ sĩ cùng đại diện của họ, quan chức chính phủ, giới học thuật và xã hội dân sự để quản lý rủi ro
- Trong tương lai, Microsoft muốn tiếp nối bằng các sáng kiến mới nhằm giúp AI thúc đẩy phổ biến tri thức đồng thời bảo vệ quyền và nhu cầu của nhà sáng tạo
1 bình luận
Ý kiến trên Hacker News
Trước hết Microsoft nên công bố mô hình Copilot đã được huấn luyện bằng các codebase nội bộ của Azure, Windows, Office
Khi đó mới có thể tin rằng Microsoft thực sự xem Copilot là công nghệ không xâm phạm bản quyền
Các kỹ sư nội bộ vốn đã quen với Copilot về cấu trúc dữ liệu, phong cách code, v.v., nên năng suất sẽ tăng và độ chính xác cũng cải thiện đáng kể
Ngoài ra, code của bên thứ ba trên toàn thế giới sẽ dần tiến gần hơn tới phong cách Microsoft, khiến việc tuyển dụng và đào tạo cũng có thể dễ dàng hơn
Nhược điểm là người ngoài có thể thu được một vài manh mối nhỏ về mã nguồn của Microsoft, nhưng điều đó có lẽ không đáng kể nếu xét việc hiện nay đã có thể decompile binary để lấy được nhiều thông tin hơn rất nhiều
Chỉ là họ nói sẽ chịu trách nhiệm khi tất cả các điều kiện sau đều đúng: thực sự có đầu ra như vậy, người dùng không tắt bộ lọc ngăn việc đó, không cố ý tạo ra đầu ra như vậy, và việc sử dụng đó bị phán quyết là bất hợp pháp
Code cần được giữ kín trước các tác nhân độc hại khác với code tuy đã công khai nhưng kèm hạn chế sử dụng mà người nhận cần phải biết
Điều này giống kiểu lập luận: “Nếu tin rằng thỏa thuận cấp phép có hiệu lực pháp lý, hãy công khai mật khẩu người dùng của bạn rồi gắn một giấy phép nói rằng không ai được dùng nó”
Ngay cả khi hoàn toàn không có rủi ro xâm phạm, Microsoft vẫn có thể không muốn công bố như vậy
GitHub Copilot vốn dựa trên GPT-3 được fine-tune bằng các kho mã nguồn công khai, và phần đó là trọng tâm của tranh cãi
Bài blog này đề cập đến hệ sinh thái Microsoft Copilot rộng hơn
Phần lớn công cụ sử dụng dịch vụ Azure OpenAI API ở backend, và không được chuyên biệt hóa cho việc sinh code
AI tạo sinh nhìn chung có tính biến đổi nên nhiều khả năng sẽ được xem là sử dụng hợp lý
Nếu thật sự dẫn dắt thì có thể tạo ra kết quả tương tự mã nguồn hoặc hình ảnh hiện có, nhưng tòa án có thể nhìn nhận tổng thể rằng nó tạo ra nội dung mới chưa từng có trước đây, đặc biệt là với hình ảnh thì càng có thể như vậy
Google Books đã sao chép nguyên văn sách và đưa vào cơ sở dữ liệu trực tuyến mà vẫn được xem là sử dụng hợp lý, nên AI tạo sinh mang tính biến đổi hơn nhiều có khả năng cao sẽ nằm trong phạm vi được cân nhắc sử dụng hợp lý rộng hơn
Dù Google Books có tính phi thương mại, tòa án thường cho rằng mức độ biến đổi càng lớn thì có thể áp dụng các tiêu chí đánh giá sử dụng hợp lý ít nghiêm ngặt hơn
https://ogc.harvard.edu/pages/copyright-and-fair-use
Google Books là sử dụng hợp lý vì có lợi ích công cộng, không gây hại cho nhà xuất bản hay tác giả, và thậm chí còn giúp mọi người tìm thấy tác phẩm
Ngược lại, AI tạo sinh có thể trích xuất phần cốt lõi từ tác phẩm của người khác để tạo ra đầu ra có phong cách tương tự, hoàn toàn loại bỏ tác giả gốc và tước đoạt thành quả lao động của họ
Đặc biệt, đây là một quá trình thuần túy cơ học, không có sáng tạo của con người ngoài những gì được trích xuất từ các tác giả khác. Prompt đơn giản khó có thể được xem là sáng tạo
Rốt cuộc, lập luận này gần với kiểu “đang dùng tác phẩm có bản quyền, nhưng vì trộn ở quy mô lớn nên không sao”
Điều này bất lợi cho lập luận rằng AI tạo sinh là sử dụng hợp lý
Đặc biệt, vì tòa đã gắn tính biến đổi với tác động thị trường, nên AI tạo sinh tạo ra đầu ra cạnh tranh trực tiếp với đầu vào sẽ khó được tòa xem là có tính biến đổi hơn nhiều
Trường hợp tạo ảnh càng như vậy, vì nó cạnh tranh rõ ràng với ảnh stock
Không thể có một bảo đảm bao quát kiểu “AI tạo sinh nói chung là sử dụng hợp lý”, và việc kết quả có tính biến đổi hay không cũng chỉ là một trong nhiều yếu tố
Có thể thấy điều này qua các trường hợp sampling âm thanh hoặc remix
Sẽ có ngoại lệ như trường hợp trích dẫn sách trong bài nghiên cứu, nhưng chỉ có thể dùng những trường hợp đặc thù như vậy để bắt bẻ trong tranh luận trên Internet mà thôi
Việc bản thân Copilot có thể là một tác phẩm biến đổi được phép tồn tại không dẫn tới kết luận rằng khi nhà phát triển đưa đầu ra của nó vào tác phẩm của mình thì sẽ không chịu trách nhiệm vi phạm bản quyền
Cũng giống như không thể coi mọi kết quả do người khác tạo ra đều không vướng vấn đề bản quyền. Không ai nói rằng chỉ vì một người đã xem tác phẩm khác thì bản thân người đó là sản phẩm vi phạm, nhưng đầu ra lại là chuyện riêng
https://www.notion.so/DSM-Directive-Implementation-Tracker-3...
https://eur-lex.europa.eu/eli/dir/2019/790/oj
Ngoại lệ bản quyền TDM4 cho phép tạo tập dữ liệu gồm các tác phẩm có bản quyền, miễn là có cơ chế để chủ sở hữu quyền từ chối
Tập dữ liệu trở nên minh bạch, chủ sở hữu quyền có thể thực thi quyền của mình, còn một số công ty AI nhất định có thể huấn luyện trên tài liệu có bản quyền, nên đây có vẻ là phương án thỏa hiệp tốt nhất
Tất nhiên, nó không trao quyền thương mại đối với mô hình đã được huấn luyện, mà chỉ trao quyền cho nghiên cứu khoa học/học thuật. Ví dụ, điều đó có nghĩa là việc Meta huấn luyện và công bố mô hình LLaMA được huấn luyện trên sách là ổn, nếu họ không thu lợi thương mại và có cơ chế để tác giả từ chối
Tôi đang thảo luận với Jordan của https://spawning.ai xem có thể xây dựng một hệ thống từ chối phù hợp với sách hay không, và cũng có thể hình dung một cách tương tự cho âm nhạc
Đây là luật châu Âu, nhưng khác với những quy định EU quá mức khác, nó có vẻ là một thỏa hiệp rất hợp lý
Cập nhật: Jordan đã gửi email đính chính rằng cách hiểu đúng là quyền từ chối chỉ áp dụng cho nghiên cứu thương mại. Nghĩa là việc tạo tập dữ liệu cho những nơi như Eleuther có thể không cần quy trình từ chối, còn khi OpenAI dùng cho GPT-5 và thu phí thì mới cần
Như vậy, luật này thực sự áp dụng cho việc sử dụng thương mại trong machine learning, còn sử dụng phi thương mại như LLaMA thì thậm chí không cần quyền từ chối
Nó vừa cung cấp lá chắn pháp lý cho nhà nghiên cứu, vừa yêu cầu minh bạch tập dữ liệu đối với sử dụng thương mại, nên rất tuyệt
Tôi tò mò không biết liệu có chi tiết thực tế nào về thông báo này không
Tôi biết đây là một bài blog, nhưng các liên kết trên trang đều chỉ dẫn tới các bài blog khác, nên vẫn còn rất nhiều câu hỏi
Bài blog này có phải là hợp đồng có hiệu lực pháp lý không? Microsoft có miễn trừ trách nhiệm cụ thể cho tất cả người dùng đối với các khiếu nại vi phạm bản quyền phát sinh từ việc sử dụng Copilot không?
Bài blog nói “chương trình này có các điều kiện quan trọng” và liệt kê vài điều, nhưng không rõ đó có phải là toàn bộ điều kiện hay còn có các điều kiện bổ sung không được nêu trong bài
Ví dụ, tôi cũng không biết nó chỉ áp dụng cho một số quốc gia nhất định hay áp dụng cho mọi hệ thống pháp luật trên toàn thế giới
Có gì đảm bảo Microsoft sẽ không dừng chương trình này? Nếu tòa án liên tục ra phán quyết bất lợi, và họ nhận ra rằng mình không đủ khả năng bồi thường mỗi khi Copilot rửa giấy phép những mảng lớn mã có bản quyền, liệu người dùng có cách nào buộc Microsoft giữ lời hứa không?
Brad Smith, vốn là luật sư, chắc cũng hiểu điều này
Nếu không thì tại sao lại đặt Microsoft, một công ty trị giá 2,5 nghìn tỷ USD, vào rủi ro bảo đảm trách nhiệm vô hạn?
Có một khái niệm gọi là promissory estoppel
https://www.nolo.com/dictionary/promissory-estoppel-term.htm...
Tài liệu của Microsoft có nhiều loại nên hơi rối, nhưng các tài liệu liên quan đến Copilot khá rõ ràng và điều khoản miễn trừ trách nhiệm không thay đổi kể từ mùa xuân
Một nước đi rất khôn ngoan của Microsoft
Về bản chất, họ đang tự vẽ một tấm bia khổng lồ lên lưng mình cho các vụ kiện trong tương lai, và đánh giá rằng họ có nguồn lực để tranh tụng. Đánh giá đó cũng không sai
Nhìn vào hướng đi của AI, chẳng bao lâu nữa sẽ có án lệ quan trọng
Với Microsoft, việc phát triển thị trường này nhanh nhất có thể và đứng ở trung tâm của nó là cực kỳ quan trọng
Động thái này làm giảm một rào cản cốt lõi khiến các tổ chức nhỏ ngần ngại áp dụng mã sinh tự động: nỗi lo “nếu sản phẩm này tạo ra mã có bản quyền thì tôi có bị kiện không?”
Microsoft như đang ném găng thách đấu và nói rằng “cỗ máy pháp lý khổng lồ của Microsoft sẽ chiến đấu”
Về cơ bản đây là màn phô diễn sức mạnh kiểu “cứ kiện thử xem, làm đi. Không thì về nhà”
Một cách nộp một khoản tiền nào đó cho giới cổ cồn trắng như một thứ thuế có thể chịu được, nhằm ngăn áp lực yêu cầu chính phủ siết họ mạnh tay tăng lên quá nhanh
Họ sẽ kiểm soát dư luận và phát thông cáo báo chí trong vài năm để kéo dài thời gian, rồi trong lúc đó củng cố vị thế
Có một dấu sao rất lớn: “khách hàng không được cố gắng tạo ra tài liệu vi phạm”
Rốt cuộc phụ thuộc vào cách Microsoft định nghĩa thế nào là đã cố gắng tạo ra tài liệu vi phạm
Hy vọng ý ban đầu là chỉ loại trừ những cách dùng biết rõ là vi phạm, như “tái tạo toàn bộ mã nguồn Half-Life 2”, nhưng thực tế thì không biết được
Tôi không tin họ sẽ cạnh tranh công bằng, cũng không tin họ với tư cách nhà tuyển dụng
Tôi cũng không tin họ sẽ không làm những việc tham nhũng quanh chính trị quốc gia, và tôi cũng không muốn họ làm đối tác trong một dự án có ý nghĩa
Nhưng có một việc Microsoft thực sự làm rất tốt: giao dịch doanh nghiệp với doanh nghiệp đáng tin cậy và bền vững dài hạn
Với tư cách khách hàng doanh nghiệp, tôi tin họ. Nếu họ lợi dụng lỗ hổng kiểu này, danh tiếng của họ sẽ sụp đổ
Tôi không dùng Google Cloud Platform vì họ thường xuyên chơi xấu khách hàng, nhưng tôi tin AWS và Azure vì họ không làm vậy
Chi phí trả cho các vụ vi phạm có khả năng thấp hơn rất nhiều so với chi phí đánh mất niềm tin đó
Tuy nhiên, Microsoft cũng sẽ có động cơ lớn hơn để vận động hành lang nhằm định hình luật theo hướng hầu như không phát sinh trách nhiệm khi dùng các công cụ như thế này
Tuy vậy, câu hỏi liệu Microsoft có đang lấy cắp mã của mọi người để bán lại hay không vẫn còn đó
Nếu dùng LLM để trả lời câu hỏi về tài liệu công ty, nó có thể vô tình tạo ra tài liệu có bản quyền đã được huấn luyện trước
Có thể không đơn giản như vậy
Ngay cả khi Microsoft gánh trách nhiệm, bên vi phạm vẫn có thể bị kiện riêng. Sau đó Microsoft có thể phải chịu chi phí kiện tụng
Nhưng họ không thể ngăn người dùng sản phẩm khỏi các vụ kiện theo cách áp dụng cho cả một nhóm
Câu then chốt là: “nếu bên thứ ba kiện khách hàng thương mại vì vi phạm bản quyền do sử dụng Microsoft Copilot hoặc đầu ra được tạo ra, Microsoft sẽ bào chữa và chi trả mọi phán quyết bất lợi hoặc khoản dàn xếp, miễn là khách hàng đã sử dụng các biện pháp bảo vệ và bộ lọc nội dung tích hợp trong sản phẩm”
Ở đây “bào chữa” là điểm quan trọng, và có lẽ nghĩa là người dùng sẽ dùng luật sư của Microsoft chứ không phải luật sư riêng của mình
Những người này ở trong công ty nên có thể rẻ hơn luật sư bên ngoài tính phí theo giờ
Ngoài ra còn có điều kiện về cách sử dụng sản phẩm, và điều then chốt là người dùng phải lập tài liệu chứng minh mình đã dùng đúng cách đó
Đây là một diễn biến thú vị. Khách hàng doanh nghiệp từng thận trọng vì sợ vô tình vi phạm bản quyền khi dùng công cụ này, và điều đó có khả năng đã làm chậm quá trình áp dụng
Đặc biệt là các vụ có thể có khoản bồi thường thiệt hại lớn
Trọng tâm là giảm lực cản trong việc áp dụng do rủi ro pháp lý tạo ra
Chỉ áp dụng khi đã bật các cơ chế bảo vệ
Một trong các cơ chế bảo vệ đó là không để Copilot xuất ra mã đang tồn tại trong bất kỳ kho GitHub nào
Tôi đã thử kiểm tra Copilot khi bật cơ chế bảo vệ, và thực tế là nó bị vô hiệu hóa đến mức như bị chặt đầu
Nhân tiện, đây không phải là thay đổi mới. Trong Copilot Product Specific Terms đã có điều khoản “nếu bị kiện thì Microsoft chịu trách nhiệm”: https://github.com/customer-terms/github-copilot-product-spe...
Ở cộng đồng khác, câu trả lời này bị chỉ trích khá nhiều, nhưng nếu một mô hình thống kê về bản chất là một mô hình toán học gần với bộ dự đoán token tối ưu tiếp theo và tạo ra sản phẩm phái sinh thuần túy, thì đó có thật sự là “ăn cắp” không?
Việc hiểu token tối ưu tiếp theo, hay thậm chí biết các token xuất hiện thường xuyên nhất trên GitHub, có phải là “ăn cắp” không?
Có thể lập luận rằng mọi ý tưởng có giá trị đều đã xuất hiện, mọi văn bản hữu dụng đều đã được viết, nên phải coi mọi AI là bất hợp pháp; nhưng nếu vậy thì chúng ta còn lại gì?
Chẳng hạn, một hàm chuyển chuỗi từ chữ hoa sang chữ thường rất có khả năng giống với hàm do người khác ở đâu đó trên Trái Đất viết, và mã xử lý lỗi hay kỹ thuật hiện đại để căn giữa một div cũng vậy
Đây là chủ đề luôn bị tranh cãi tại tòa
Nếu ai đó huấn luyện rồi công khai một mô hình phản hồi đầu vào “When Mr. Bilbo Baggins” bằng cách xuất ra toàn bộ bộ ba Chúa tể những chiếc nhẫn, thì có lẽ đã xâm phạm bản quyền
Ngược lại, nếu nó tạo ra một đoạn văn chung chung về “núi” và “rồng”, không có trích dẫn trực tiếp hay cách diễn đạt đáng kể nào, thì tự thân việc đó nhiều khả năng không phải vi phạm. Những từ đó có xuất hiện trong tác phẩm của Tolkien, nhưng bản thân từ ngữ không phải đối tượng được bảo hộ bản quyền
Tuy nhiên, nếu chứng minh được rằng để huấn luyện mô hình, các tác phẩm của Tolkien đã bị sao chép theo cách giấy phép bản quyền không cho phép, thì có thể đã xâm phạm bản quyền ở bước trung gian, dù đầu ra của mô hình không còn trông như bản sao của bản gốc nữa
Tôi cho rằng ở đây không có câu trả lời trắng đen. Đến thời điểm nào thì một tác phẩm có bản quyền, sau khi bị chia nhỏ và thống kê hóa, không còn là tác phẩm có bản quyền nữa? Có thể huấn luyện mô hình mà trước hết không sao chép thứ gì đó theo cách vi phạm luật bản quyền không?
Đây là một khái niệm mềm dẻo của con người, do con người trong tòa án và cơ quan lập pháp quyết định, và tôi không nghĩ các chi tiết toán học sẽ tạo ra khác biệt lớn cho kết quả cuối cùng
Tuy nhiên, vấn đề ở đây không phải là trộm cắp mà là xâm phạm bản quyền, và đó là hai khái niệm riêng biệt
Sự khác biệt tinh tế nhưng căn bản này có lẽ cũng là một phần lý do phản ứng khá lạnh nhạt
Bản quyền nhằm bảo vệ cách thể hiện nguyên gốc của ý tưởng được biểu đạt dưới dạng tác phẩm sáng tạo, chứ không bảo vệ bản thân ý tưởng
Có thể đưa ra lập luận tương tự với các thuật toán mã hóa hoặc nén
Tôi tò mò không biết một cam kết công khai như thế này có tính ràng buộc đến đâu
Nó giống việc Musk gần đây công khai nói sẽ chi trả chi phí cho những người gặp vấn đề trong công việc hoặc pháp lý vì phát ngôn của họ trên nền tảng, nhưng giờ lại từ chối thực hiện lời hứa đó
Nếu codebase xâm phạm GPL, biện pháp khắc phục là công khai mã nguồn có vấn đề hoặc ngừng phân phối
Khi Microsoft nói về mã của bên thứ ba, có lẽ họ sẽ không quá bận tâm đến cả hai phương án này
Tôi không biết án lệ về bồi thường thiệt hại trong các dự án mã nguồn mở như thế nào, nhưng có vẻ không đến mức là mối lo lớn với Microsoft
Nói cách khác, rủi ro phía dưới của Microsoft là đưa luật sư vào cuộc, còn lợi ích phía trên là cải thiện công cụ tạo mã
Không phải luật sư