- Playground Zig trực tuyến do Zigbook công bố được cho là có tính năng và cấu trúc mã giống hệt dự án hiện có của Zigtools
- Phía Zigtools xác nhận các binary WASM của Zigbook (
zig.wasm, zls.wasm) giống hệt đến từng byte, và một phần mã JavaScript cũng có dấu vết bị sao chép trực tiếp
- Theo điều kiện của giấy phép MIT, phải kèm theo thông tin nguồn và thông báo bản quyền, nhưng Zigbook đã bỏ qua phần ghi chú giấy phép và đăng như thể là mã tự phát triển
- Zigtools đã gửi PR chỉnh sửa giấy phép nhưng Zigbook lập tức đóng PR và xóa phần giải thích, không cho thấy ý định khắc phục
- Từ vụ việc này, Zigtools cho biết sẽ mở rộng chức năng playground và tăng cường hợp tác cộng đồng, đồng thời khuyến cáo nên tránh sử dụng Zigbook
Zigtools và bối cảnh dự án
- Zigtools là một tổ chức được thành lập để hỗ trợ cộng đồng ngôn ngữ Zig, phát triển ZLS, lsp-kit, Zigtools Playground, extension vscode-zig cùng nhiều dự án khác
- Playground có kiến trúc client WASM chạy trên trình duyệt, cho phép chạy ngoại tuyến và bảo vệ quyền riêng tư của mã mà không tốn chi phí máy chủ
Nghi vấn đạo nhái của Zigbook
- Zigbook được công bố là một tài nguyên học Zig với mô hình học tập nhấn mạnh “zero AI” và “project-based”
- Tuy nhiên, nội dung sách, ví dụ và cấu trúc website bị chỉ ra là có chất lượng ở mức sản phẩm do LLM tạo ra, đồng thời bị nghi đã dùng tài khoản và tương tác giả
- Sau đó Zigbook bổ sung chức năng Zig playground dưới tên “high-voltage beta”, và phần này có hình thức lẫn chức năng rất giống với Zigtools Playground
WASM trùng khớp và sao chép mã
- Zigtools cho biết sau khi phân tích các tệp WASM của Zigbook, họ xác nhận hai tệp (
zig.wasm, zls.wasm) giống hệt tệp của họ đến từng byte
- SHA256 của
zls.wasm: 3a63e5092e8f90172716977af5c88b4f49e546f730f25e9bafb47f4ac9a2ee1d
- SHA256 của
zig.wasm: d3fe6b8a6b1db84a914eaa1f4a80ca5dcfd3b0948a35f2b1e78432a392eace96
- Bản gốc và bản bị đạo nhái đều đã được lưu lại qua liên kết Internet Archive
- Mã JavaScript cũng có cấu trúc truyền dữ liệu và phần ghi log giống nhau, một số chỗ có dấu vết bị LLM biến đổi nhưng nhiều cú pháp cụ thể trùng khớp hoàn toàn
- Ví dụ, chuỗi
exit with exit code ${exitCode} đã bị sao chép nguyên xi
Vi phạm giấy phép và phản ứng
- Zigtools Playground và Zig được phát hành theo giấy phép MIT, nhưng Zigbook không kèm thông báo bản quyền và nội dung giấy phép
- Để khắc phục việc này, Zigtools đã gửi PR bổ sung giấy phép, nhưng Zigbook đóng PR ngay lập tức và xóa phần mô tả
- Nội dung PR nêu rõ rằng Zigbook đã sử dụng mã và WASM của Zigtools Playground, đồng thời kèm bản sửa đổi để thêm thông báo giấy phép
Kế hoạch tiếp theo của Zigtools
- Từ sự việc lần này, Zigtools cho biết sẽ cải tiến playground và mở rộng hợp tác với cộng đồng
- Sẽ bổ sung hỗ trợ nhiều tệp để có thể chạy các dự án Zig phức tạp hơn
- Hướng tới tích hợp với các tài liệu học như Ziglings
- Cũng đang lên kế hoạch hỗ trợ stack trace dựa trên thông tin debug DWARF
Kết luận và khuyến nghị cho cộng đồng
- Zigtools khuyến nghị cộng đồng tránh sử dụng Zigbook
- Người muốn học Zig được khuyên nên dùng các tài liệu đã được kiểm chứng như trang Zig Learn chính thức, Ziglings, và Learning Zig của Karl Seguin
- Ngoài ra, dự án hiện cũng đang gây quỹ cho hoạt động bảo trì ZLS, nhận hỗ trợ qua OpenCollective và GitHub Sponsors
1 bình luận
Ý kiến trên Hacker News
Có vẻ như kho lưu trữ đã biến mất. Không rõ là người dùng tự xóa hay là do GitHub ra tay
Ngoài ra còn có ảnh chụp màn hình cho thấy người dùng đã chỉnh sửa hoặc sửa đổi mang tính xúc phạm bình luận của người khác
Ảnh chụp trên Imgur, liên kết Web Archive
Công cụ này tuyên bố là “Zero AI”, nhưng trên thực tế có vẻ là dựa trên AI
Tôi không ghét AI, thậm chí còn hay dùng nó cho mục đích nghiên cứu, nhưng chính những kiểu người như vậy khiến tôi thấy phản cảm
Tôi đã nói chuyện với người bảo trì Zigbook, và họ có vẻ là một người rất trẻ hoặc rất thiếu chín chắn. Nhìn chung hành xử khá kỳ quặc
liên kết liên quan
Nhìn vào bình luận này, tôi nghĩ hoàn toàn có đủ cơ sở để báo cáo zigbook lên GitHub. Tình huống này quá vô lý
Hướng dẫn báo cáo của GitHub
Chỉnh sửa: Có vẻ như kho lưu trữ đã biến mất. Không rõ là người dùng xóa hay GitHub gỡ xuống
Đạo văn (plagiarism) là sai về mặt đạo đức, còn xâm phạm bản quyền (copyright infringement) là sai về mặt pháp lý
Điểm mấu chốt là việc họ làm có phải là xâm phạm bản quyền hay chỉ là vi phạm giấy phép hay không. Nhiều giấy phép nguồn mở có yêu cầu ghi nguồn, nên cần xét đến điểm đó
PR nhằm sửa việc này đã bị đóng và nội dung bị che đi
Xu hướng là để tránh rắc rối pháp lý thì chỉ công khai bản nhị phân, còn mã nguồn thật chỉ chia sẻ cho một số ít người đáng tin cậy
Cảm ơn @Zigtools. Cảm ơn bạn đã chia sẻ thông tin với cộng đồng, và hy vọng bạn đừng mất động lực vì chuyện này. Đây có thể là một việc nặng nề về mặt cảm xúc, nhưng tôi vẫn mong bạn tiếp tục tiến lên
Câu “No AI” nghe thật lố bịch
llm.txt cũng có câu đó, mà nếu là con người thì có lẽ chẳng có lý do gì để tạo ra một file như vậy. Nói là ghét AI nhưng lại làm một cuốn sách bằng AI thì thật mâu thuẫn
liên kết liên quan
Nó giống như một lời phủ nhận gượng gạo khiến người ta càng nhìn ra vấn đề
Tôi đã bắt đầu công khai chỉ ra những nội dung giả làm người viết nhưng thực ra do AI tạo như thế này. Kiểu hành vi mang tính lừa dối đó cần phải chấm dứt
Có rất nhiều nơi chào đón nội dung chất lượng thấp được tạo ra không cần nỗ lực
Các quy tắc thì khá dễ tuân theo, nhưng nếu vi phạm mà bị tổn hại nghiêm trọng đến danh tiếng xã hội thì tôi nghĩ đó là điều đương nhiên
Ngay từ lần đầu đọc bài gốc của Zigbook trước đây tôi đã thấy có gì đó đáng ngờ
Đúng là do LLM viết, nhưng không phải mức sao chép-dán đơn giản mà có vẻ đã bỏ vào khá nhiều công sức.
Nhưng tôi không hiểu làm thế này thì rốt cuộc được lợi gì
Việc LLM sao chép mã có thể là một sai sót, nhưng chuyện sha256sum của file wasm trùng hệt nhau thì khá nghiêm trọng
Cuộc thảo luận ban đầu tiếp nối từ liên kết này