- Nhà phát triển kiêm luật sư Matthew Butterick đã kiện Microsoft, GitHub và OpenAI
- Ông cho rằng họ đã vi phạm giấy phép mã nguồn mở và xâm phạm quyền của lập trình viên
- Các giấy phép như GPL, Apache, MIT yêu cầu phải ghi rõ tên tác giả, nhưng Copilot đã phớt lờ điều này
Ngay cả khi các đoạn mã dài hơn 150 ký tự bị sao chép nguyên văn
- Một số lập trình viên chỉ trích đây là hành vi "rửa mã nguồn mở (laundering)"
- Công ty luật đại diện cho vụ kiện cho biết: "Có vẻ như Microsoft đang kiếm lợi từ công việc của người khác bằng cách phớt lờ các điều khoản của giấy phép mã nguồn mở và các yêu cầu pháp lý khác"
- Ngoài vi phạm giấy phép, Butterick còn lập luận rằng tính năng này cũng vi phạm một số quy định khác
- Terms of Service và Privacy Policies của GitHub
- DMCA 1202, điều cấm xóa thông tin quản lý bản quyền
- California Consumer Privacy Act
3 bình luận
Cuối cùng có lẽ sẽ được giải quyết theo cách tách
open source licensera để dùng làm dữ liệu huấn luyện và cho phép chọn trong tùy chọn của Copilot nhỉ? - đồng thời phần ghi chú giấy phép cũng được tạo chính xác theo đó. Hay là họ đã làm vậy rồi? Vì tôi chưa dùng Copilot bao giờ nên...Đây đúng là một vấn đề lớn, nhưng có vẻ cách giải quyết cũng khá rõ ràng.
Ngay cả khi con người viết code thì chuyện này cũng hay gây vấn đề mà, đúng không? Thỉnh thoảng ở công ty còn phải tìm người chưa từng đọc mã của một implementation
open sourcecho spec XXX (ví dụ Linux). (để triển khai theo kiểu cleanroom) Đôi khi đang làm việc mà lỡ gửi link code Linux cho ai đó thì cũng bị nhắc ngay - "Tôi không được đọc đoạn code đó!". Có lúc thậm chí tôi còn không nhớ mình đã từng đọc đoạn code đó hay chưa, nên cũng khá khó xử.So với những vấn đề con người gặp phải như vậy, chuyện này có vẻ sẽ được giải quyết còn rõ ràng hơn.
Khi Copilot được công bố.. Lúc đầu tôi kiểu wow~ nhưng vài ngày sau đã có những vấn đề liên quan đến giấy phép như thế này. Tôi từng thấy ý kiến nói rằng nếu dùng sai, vô tình để một mớ mã mang giấy phép GPL chui vào quá trình phát triển mã cho sản phẩm của công ty thì có thể thành vấn đề lớn... giờ nó đã thành hiện thực rồi.
Nếu bị sao chép nguyên xi thì đúng là hơi... không ổn.. Vì thế nên mảng Explainable AI mới được thảo luận sôi nổi.. AI có thể giải thích vì sao lại đưa ra kết quả như vậy.
Nếu Copilot làm được điều này thì có vẻ họ sẽ tránh được phần lớn tranh cãi bằng cách thêm mã nguồn mở đã tham gia vào kết quả dưới dạng chú thích..