Hướng dẫn sử dụng công cụ hỗ trợ AI khi đóng góp cho nhân Linux

(github.com/torvalds)

10 điểm bởi GN⁺ 11 ngày trước | 1 bình luận | Chia sẻ qua WhatsApp

Đây là tài liệu chính thức của nhân Linux do Linus Torvalds công bố, nêu rõ khi đóng góp bằng công cụ lập trình AI thì phải tuân thủ nguyên vẹn quy trình phát triển và phong cách mã hiện có của nhân
AI không thể thêm thẻ Signed-off-by — về mặt pháp lý chỉ con người mới có thể xác nhận, và nhà phát triển là con người phải chịu toàn bộ trách nhiệm về việc rà soát mã do AI tạo ra, tuân thủ giấy phép và trách nhiệm pháp lý
Với mã có AI hỗ trợ đóng góp, cần ghi rõ tên mô hình:phiên bản và công cụ phân tích theo định dạng như Assisted-by: Claude:claude-3-opus coccinelle sparse
- Các công cụ phát triển cơ bản như git, gcc, make được loại khỏi đối tượng phải ghi rõ
Mọi đóng góp đều phải tương thích với GPL-2.0-only và bắt buộc có định danh giấy phép SPDX

1 bình luận

GN⁺ 11 ngày trước

Ý kiến trên Hacker News

Quy tắc cơ bản là có thể dùng AI, nhưng trách nhiệm đối với commit hoàn toàn thuộc về con người
Việc mã phải đáp ứng yêu cầu giấy phép nghe rất hiển nhiên. Đây là điều mà phần lớn lập trình viên có thể đồng ý
- Đây thực sự là một chính sách bình thường và hợp lý đến mức nhàm chán
  Chỉ là hơi ngạc nhiên khi lại phải ghi rõ điều này
  Dạo này có nhiều trường hợp đăng mã do AI tạo lên mã nguồn mở mà còn không hiểu nó, rồi khi có vấn đề thì né trách nhiệm bằng cách nói “AI làm thế”
  Trong tình huống như vậy, việc maintainer hoài nghi mã AI là điều hoàn toàn dễ hiểu
- Trong cộng đồng Linux có nhiều người cực kỳ phản đối các commit có AI hỗ trợ
  Có người xem Torvalds là kẻ phản bội vì chính sách lần này, cũng có người nói rằng nếu mã do AI tạo được hợp nhất thì họ sẽ không bao giờ đóng góp nữa
- Nếu đầu ra của AI không phải GNU GPL, thì chỉ vì lập trình viên Linux bổ sung thêm vào mà nó trở thành mã GPL hay không vẫn là điều đáng nghi ngờ
- AI chỉ là một công cụ (tool), nên tôi không hiểu vì sao lại cần phải ghi nó như một tác giả
Mới ngay sau khi thấy Greg KH áp dụng reviewer Sashiko AI cho mọi bản vá gần đây, chính sách lần này tạo cảm giác khá tương phản
AI reviewer thực sự đang có ích, nhưng cuộc thảo luận vẫn dừng ở mức “trách nhiệm với mã AI”
Những phần thật sự nguy hiểm là điều kiện tranh chấp và vấn đề khóa mà AI có thể tự tin trả lời sai
Tôi tự hỏi liệu chính sách này là giải pháp dài hạn, hay chỉ là biện pháp tạm thời trước khi các hệ thống như Sashiko tăng cường lọc từ phía bảo trì
Chính sách do Torvalds công bố đã quy định rõ rằng con người phải xem xét, ký xác nhận và chịu trách nhiệm đối với mã AI
Có vẻ đã qua rà soát pháp lý, và có thể sẽ trở thành chuẩn mực cho phát triển có AI hỗ trợ trong tương lai
- Nhưng tài liệu thực tế là do Sasha Levin viết dựa trên thảo luận giữa các maintainer Linux
- ‘Signed-off-by’ vốn đã là một thủ tục mang tính hình thức, và nhiều người đóng góp mới còn gắn vào mà không biết ý nghĩa là gì
  Thực tế đã từng có lúc bản vá của tôi được đưa vào một đợt refactor của người khác và tên tôi tự động được thêm vào
  Trên thực tế gần như ai cũng có thể thêm “Co-developed-by” hay “Signed-off-by”, và hầu như không có tính ràng buộc pháp lý
LLM không thể nêu rõ nguồn gốc, nên rất khó hiểu làm sao có thể đảm bảo tuân thủ giấy phép
- Ở Đức, đầu ra của LLM không phải đối tượng được bảo hộ bản quyền
  Tác giả có thể là người dùng AI hoặc là nhà phát triển mô hình, nên mức độ bất định pháp lý rất lớn
  Trong bối cảnh như vậy, về lâu dài thậm chí giấy phép của kernel có thể bị vô hiệu hóa
  Nội dung liên quan được đề cập trong bài viết của KPMG Law về AI và bản quyền
Việc tái sử dụng thẻ “Assisted-by:” để chỉ mô hình AI nghe khá kỳ lạ
Đây vốn là thẻ dùng để ghi nhận sự hỗ trợ của con người, giờ lại có hai ý nghĩa nên gây nhầm lẫn
Thông thường người ta sẽ dùng một thẻ riêng như “AI-assistant:”
Hướng đi đúng của mã nguồn mở là làm rõ mối liên kết giữa con người và tác tử, và để con người chịu trách nhiệm xác minh cuối cùng
Cảm ơn Linus
Rất mừng vì nguyên tắc hiển nhiên rằng dù là mã do AI tạo thì trách nhiệm vẫn thuộc về con người
Nó giống như phiên bản đảo ngược của câu “thợ tồi thì đổ tại công cụ”
Cuối cùng, trách nhiệm lựa chọn và sử dụng công cụ vẫn thuộc về con người
Chính sách này không thể bảo vệ Linux khỏi trách nhiệm pháp lý về vi phạm bản quyền
Nó giống như một cửa hàng bán lẻ nói rằng “chúng tôi tin nhà cung cấp đã loại bỏ THC”
Việc tự tuyên bố miễn trách không có nghĩa là trách nhiệm pháp lý biến mất
- Nhưng Linux kernel không phải là một thực thể pháp lý mà là một tập hợp các bên đóng góp
  Ngay cả nếu có mã vi phạm bị đưa vào thì đối tượng bị kiện sẽ là người dùng Linux hoặc các công ty
  Trên thực tế khả năng những vụ kiện như vậy xảy ra là khá thấp
- Có nhiều công ty dùng mã AI, nhưng điều đó không có nghĩa tất cả đều phải chịu trách nhiệm pháp lý
- Dự án mã nguồn mở khác với cửa hàng ở chỗ không cung cấp bảo đảm cho người tiêu dùng
  Bản thân phép so sánh đó không phù hợp
- Thực ra mã AI cũng không nguy hiểm hơn hẳn
  Nếu muốn, con người vẫn có thể copy-paste mã riêng tư rồi ký xác nhận
  Cuối cùng vấn đề vẫn là con người nói dối
Có điều khoản nói rằng “mọi mã phải tương thích với GPL-2.0-only”,
nhưng trong bối cảnh AI được huấn luyện trên mã thuộc nhiều giấy phép khác nhau, rất khó hiểu làm sao có thể bảo đảm điều đó
- Câu trả lời rất đơn giản. Người dùng AI phải chịu trách nhiệm
  Nếu AI làm sai thì con người cũng phải chịu trách nhiệm. Nếu thấy bất an thì không nên dùng AI
- Thực ra lập trình viên con người cũng đâu chỉ từng xem mã GPL
- Việc diễn giải bản quyền là chuyện của tòa án. Đó không phải điều Torvalds phải dự đoán
  Tuy vậy, nếu AI tham chiếu sang codebase khác trong lúc runtime thì có thể còn rủi ro hơn
- Có người cho rằng “mã do AI tạo ra là public domain nên không vi phạm GPL”
  Nhưng cách tiếp cận này lại có thể làm loãng ý nghĩa của giấy phép
  Chỉ với một chú thích kiểu “AI viết 100% nhưng tôi đã rà soát” thì hiệu lực pháp lý rất yếu
  Cũng có đề xuất mở issue về việc tái cấp phép sang public domain cho các dự án “100% vibecoded” để cảnh báo vấn đề này

Hướng dẫn sử dụng công cụ hỗ trợ AI khi đóng góp cho nhân Linux

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News