5 điểm bởi GN⁺ 2024-07-10 | 1 bình luận | Chia sẻ qua WhatsApp
  • Tháng 11/2022, các nhà phát triển đã đệ đơn kiện tập thể nhằm vào GitHub, Microsoft và OpenAI
  • Họ cho rằng Copilot đã sử dụng trái phép phần mềm mã nguồn mở được lưu trữ trên GitHub để cung cấp các đoạn mã
  • Microsoft sở hữu GitHub, và Copilot được vận hành bằng công nghệ máy học tạo sinh của OpenAI
  • Diễn biến vụ kiện
    • Ban đầu vụ kiện bắt đầu với 22 cáo buộc, nhưng phần lớn đã bị bác bỏ
    • Trong phán quyết gần đây, 3 cáo buộc bao gồm cáo buộc liên quan đến DMCA mục 1202(b) đã bị bác bỏ
    • Hiện còn lại 2 cáo buộc về vi phạm giấy phép mã nguồn mở và vi phạm hợp đồng
  • Phán quyết của tòa án
    • Tòa cho rằng mã do Copilot cung cấp không đủ giống với tác phẩm gốc
    • Tòa phán quyết rằng Copilot không xóa thông tin quản lý bản quyền khi cung cấp các đoạn mã
    • Cáo buộc theo DMCA mục 1202(b) bị bác bỏ do thiếu chứng cứ
  • Bất bình từ hai phía
    • Phía nguyên đơn cho rằng phía bị đơn đang trì hoãn việc nộp tài liệu
    • Phía bị đơn phản bác rằng phía nguyên đơn đang yêu cầu quá nhiều thông tin
    • OpenAI cho rằng quy trình yêu cầu email đã không được thực hiện đúng cách
  • Lập trường của GitHub
    • "Chúng tôi tin tưởng rằng AI sẽ cách mạng hóa cách phát triển phần mềm, và tin rằng Copilot đang tuân thủ các luật liên quan"
    • "Chúng tôi sẽ tiếp tục đầu tư cho trải nghiệm nhà phát triển dựa trên AI và đổi mới một cách có trách nhiệm"

Tóm tắt của GN⁺

  • Bài viết này đề cập đến diễn biến của vụ kiện bản quyền liên quan đến GitHub Copilot
  • Phần lớn các cáo buộc cho rằng Copilot đã sử dụng trái phép mã nguồn mở đã bị bác bỏ
  • Nội dung này giúp hiểu rõ tác động của công nghệ AI đối với phát triển phần mềm và các vấn đề pháp lý liên quan
  • Các dự án có tính năng tương tự gồm Tabnine, Kite, v.v.

1 bình luận

 
GN⁺ 2024-07-10
Ý kiến trên Hacker News
  • Có ý kiến cho rằng trợ lý lập trình của GitHub thực hiện biến đổi mã để tránh vi phạm bản quyền
  • Có ý kiến cho rằng nếu con người biến đổi mã có bản quyền rồi tuyên bố đó là mã mới thì sẽ phát sinh vấn đề pháp lý
  • Đặt câu hỏi vì sao khi máy móc làm cùng một việc thì lại khác
  • Có ý kiến cho rằng Copilot có thể tạo ra cùng một đoạn mã, nhưng vụ kiện đã bị bác do thiếu bằng chứng
  • Một số nhà phát triển không muốn mã của mình bị dùng để huấn luyện LLM
    • Có thể sẽ cần giấy phép mới
    • Có thể sẽ ngừng đóng góp cho mã nguồn mở
    • Có lo ngại Microsoft có thể gây ra làn sóng rời bỏ quy mô lớn khỏi phát triển mã nguồn mở
    • Cũng có thể đăng mã vô dụng để làm ô nhiễm dữ liệu huấn luyện
  • Có sự bất mãn về việc nhân viên Microsoft dùng Slack nhưng lại ép dùng Teams
  • Có lo ngại rằng nếu MS và OpenAI thắng kiện, việc ai đó dùng mã nguồn bị rò rỉ để huấn luyện LLM có thể bị hợp pháp hóa
  • Có sự không hài lòng với cách diễn đạt "một vài nhà phát triển chống lại sức mạnh hùng hậu của Redmond"
    • Có ý kiến cho rằng kẻ nhỏ bé không phải lúc nào cũng đúng
  • Có ý kiến cho rằng vấn đề nằm ở chỗ thiếu bằng chứng cho tuyên bố Copilot có thể tạo ra cùng một đoạn mã
    • Có ý kiến cho rằng có thể đã dùng video quay màn hình làm bằng chứng
  • Có ý kiến nghi ngờ việc Microsoft dùng mọi mã nguồn nhưng lại loại trừ mã của chính mình
  • Chỉ ra vấn đề rằng mô hình về bản chất được huấn luyện để tạo ra sự trùng lặp
    • Có ý kiến cho rằng việc gọi đó là AI không giải quyết được vấn đề bản quyền
    • Có ý kiến cho rằng phải huấn luyện bằng thông tin sở hữu hợp pháp
  • Có thảo luận về việc liệu có nên chuyển sang phiên bản sửa đổi của giấy phép FOSS cấm huấn luyện AI hay không
    • Có thể dùng non-ai-licenses để không bị đưa vào dữ liệu huấn luyện của Copilot
    • Có kế hoạch dùng các giấy phép này cho dự án tiếp theo