1 điểm bởi GN⁺ 2025-12-01 | 1 bình luận | Chia sẻ qua WhatsApp
  • Playground Zig trực tuyến do Zigbook công bố được cho là có tính năng và cấu trúc mã giống hệt dự án hiện có của Zigtools
  • Phía Zigtools xác nhận các binary WASM của Zigbook (zig.wasm, zls.wasm) giống hệt đến từng byte, và một phần mã JavaScript cũng có dấu vết bị sao chép trực tiếp
  • Theo điều kiện của giấy phép MIT, phải kèm theo thông tin nguồn và thông báo bản quyền, nhưng Zigbook đã bỏ qua phần ghi chú giấy phép và đăng như thể là mã tự phát triển
  • Zigtools đã gửi PR chỉnh sửa giấy phép nhưng Zigbook lập tức đóng PR và xóa phần giải thích, không cho thấy ý định khắc phục
  • Từ vụ việc này, Zigtools cho biết sẽ mở rộng chức năng playground và tăng cường hợp tác cộng đồng, đồng thời khuyến cáo nên tránh sử dụng Zigbook

Zigtools và bối cảnh dự án

  • Zigtools là một tổ chức được thành lập để hỗ trợ cộng đồng ngôn ngữ Zig, phát triển ZLS, lsp-kit, Zigtools Playground, extension vscode-zig cùng nhiều dự án khác
    • Playground có kiến trúc client WASM chạy trên trình duyệt, cho phép chạy ngoại tuyến và bảo vệ quyền riêng tư của mã mà không tốn chi phí máy chủ

Nghi vấn đạo nhái của Zigbook

  • Zigbook được công bố là một tài nguyên học Zig với mô hình học tập nhấn mạnh “zero AI” và “project-based
  • Tuy nhiên, nội dung sách, ví dụ và cấu trúc website bị chỉ ra là có chất lượng ở mức sản phẩm do LLM tạo ra, đồng thời bị nghi đã dùng tài khoản và tương tác giả
  • Sau đó Zigbook bổ sung chức năng Zig playground dưới tên “high-voltage beta”, và phần này có hình thức lẫn chức năng rất giống với Zigtools Playground

WASM trùng khớp và sao chép mã

  • Zigtools cho biết sau khi phân tích các tệp WASM của Zigbook, họ xác nhận hai tệp (zig.wasm, zls.wasm) giống hệt tệp của họ đến từng byte
    • SHA256 của zls.wasm: 3a63e5092e8f90172716977af5c88b4f49e546f730f25e9bafb47f4ac9a2ee1d
    • SHA256 của zig.wasm: d3fe6b8a6b1db84a914eaa1f4a80ca5dcfd3b0948a35f2b1e78432a392eace96
    • Bản gốc và bản bị đạo nhái đều đã được lưu lại qua liên kết Internet Archive
  • Mã JavaScript cũng có cấu trúc truyền dữ liệu và phần ghi log giống nhau, một số chỗ có dấu vết bị LLM biến đổi nhưng nhiều cú pháp cụ thể trùng khớp hoàn toàn
    • Ví dụ, chuỗi exit with exit code ${exitCode} đã bị sao chép nguyên xi

Vi phạm giấy phép và phản ứng

  • Zigtools Playground và Zig được phát hành theo giấy phép MIT, nhưng Zigbook không kèm thông báo bản quyền và nội dung giấy phép
  • Để khắc phục việc này, Zigtools đã gửi PR bổ sung giấy phép, nhưng Zigbook đóng PR ngay lập tức và xóa phần mô tả
  • Nội dung PR nêu rõ rằng Zigbook đã sử dụng mã và WASM của Zigtools Playground, đồng thời kèm bản sửa đổi để thêm thông báo giấy phép

Kế hoạch tiếp theo của Zigtools

  • Từ sự việc lần này, Zigtools cho biết sẽ cải tiến playground và mở rộng hợp tác với cộng đồng
    • Sẽ bổ sung hỗ trợ nhiều tệp để có thể chạy các dự án Zig phức tạp hơn
    • Hướng tới tích hợp với các tài liệu học như Ziglings
    • Cũng đang lên kế hoạch hỗ trợ stack trace dựa trên thông tin debug DWARF

Kết luận và khuyến nghị cho cộng đồng

  • Zigtools khuyến nghị cộng đồng tránh sử dụng Zigbook
  • Người muốn học Zig được khuyên nên dùng các tài liệu đã được kiểm chứng như trang Zig Learn chính thức, Ziglings, và Learning Zig của Karl Seguin
  • Ngoài ra, dự án hiện cũng đang gây quỹ cho hoạt động bảo trì ZLS, nhận hỗ trợ qua OpenCollectiveGitHub Sponsors

1 bình luận

 
GN⁺ 2025-12-01
Ý kiến trên Hacker News
  • Có vẻ như kho lưu trữ đã biến mất. Không rõ là người dùng tự xóa hay là do GitHub ra tay
    Ngoài ra còn có ảnh chụp màn hình cho thấy người dùng đã chỉnh sửa hoặc sửa đổi mang tính xúc phạm bình luận của người khác
    Ảnh chụp trên Imgur, liên kết Web Archive
    Công cụ này tuyên bố là “Zero AI”, nhưng trên thực tế có vẻ là dựa trên AI

    • Thật khó tin là GitHub lại cho phép quản trị viên repo chỉnh sửa bình luận của người khác
    • Cách phản ứng và chỉnh sửa như vậy trông thiếu chuyên nghiệp và non nớt
      Tôi không ghét AI, thậm chí còn hay dùng nó cho mục đích nghiên cứu, nhưng chính những kiểu người như vậy khiến tôi thấy phản cảm
    • Điều này làm tôi một lần nữa thấy rằng hiện tượng Suspiciously Specific Denial thực sự xảy ra thường xuyên đến vậy
    • Tôi có cảm giác GitHub xử lý báo cáo lạm dụng khá nhanh và nghiêm túc. Nếu mọi người đã báo cáo thì khả năng cao GitHub đã có hành động
    • Xem tiếp thì có vẻ người dùng đó đã bị cấm (ban)
  • Tôi đã nói chuyện với người bảo trì Zigbook, và họ có vẻ là một người rất trẻ hoặc rất thiếu chín chắn. Nhìn chung hành xử khá kỳ quặc

    • Thực tế là @zigbook đã đổi tiêu đề PR từ “Fix license violations” thành “Im mad because you wrote code similar to mine >:(”
      liên kết liên quan
  • Nhìn vào bình luận này, tôi nghĩ hoàn toàn có đủ cơ sở để báo cáo zigbook lên GitHub. Tình huống này quá vô lý

    • Đừng lo, tôi đã sao lưu trên Web Archive
    • Nếu hỏi “liệu có đủ cơ sở để báo cáo không?” thì tôi nghĩ là 100% có
      Hướng dẫn báo cáo của GitHub
    • Toàn bộ cuộc trò chuyện mang cảm giác quá trẻ con. Nội dung trao đổi ở #43 cũng rất khó hiểu. Có khi đây là tài khoản troll cũng nên
    • Bình luận gốc đúng là mang tính tiên tri
    • Dù là kẻ lừa đảo hay không, việc sửa bình luận của người khác để biến nó thành những lời lạc đề là điều tuyệt đối không thể chấp nhận
      Chỉnh sửa: Có vẻ như kho lưu trữ đã biến mất. Không rõ là người dùng xóa hay GitHub gỡ xuống
  • Đạo văn (plagiarism) là sai về mặt đạo đức, còn xâm phạm bản quyền (copyright infringement) là sai về mặt pháp lý
    Điểm mấu chốt là việc họ làm có phải là xâm phạm bản quyền hay chỉ là vi phạm giấy phép hay không. Nhiều giấy phép nguồn mở có yêu cầu ghi nguồn, nên cần xét đến điểm đó

    • Bài đăng đã nhắc tới điều này rồi. Đây là giấy phép MIT nhưng Zigbook không tuân thủ yêu cầu ghi nguồn
      PR nhằm sửa việc này đã bị đóng và nội dung bị che đi
    • Gần đây do AI nên thảo luận về “restricted source” ngày càng nhiều.
      Xu hướng là để tránh rắc rối pháp lý thì chỉ công khai bản nhị phân, còn mã nguồn thật chỉ chia sẻ cho một số ít người đáng tin cậy
  • Cảm ơn @Zigtools. Cảm ơn bạn đã chia sẻ thông tin với cộng đồng, và hy vọng bạn đừng mất động lực vì chuyện này. Đây có thể là một việc nặng nề về mặt cảm xúc, nhưng tôi vẫn mong bạn tiếp tục tiến lên

  • Câu “No AI” nghe thật lố bịch
    llm.txt cũng có câu đó, mà nếu là con người thì có lẽ chẳng có lý do gì để tạo ra một file như vậy. Nói là ghét AI nhưng lại làm một cuốn sách bằng AI thì thật mâu thuẫn

    • Cụm “No AI” khiến tôi nhớ đến thành ngữ Trung Quốc “ở đây không chôn 300 lạng bạc”.
      liên kết liên quan
      Nó giống như một lời phủ nhận gượng gạo khiến người ta càng nhìn ra vấn đề
    • Giờ ai cũng nói “không phải do AI tạo ra”, nhưng thực tế nhiều trường hợp rõ ràng là do AI làm
      Tôi đã bắt đầu công khai chỉ ra những nội dung giả làm người viết nhưng thực ra do AI tạo như thế này. Kiểu hành vi mang tính lừa dối đó cần phải chấm dứt
    • Nếu bạn không thích phát ngôn “No AI” thì cứ sang cộng đồng khác là được.
      Có rất nhiều nơi chào đón nội dung chất lượng thấp được tạo ra không cần nỗ lực
  • Các quy tắc thì khá dễ tuân theo, nhưng nếu vi phạm mà bị tổn hại nghiêm trọng đến danh tiếng xã hội thì tôi nghĩ đó là điều đương nhiên

  • Ngay từ lần đầu đọc bài gốc của Zigbook trước đây tôi đã thấy có gì đó đáng ngờ
    Đúng là do LLM viết, nhưng không phải mức sao chép-dán đơn giản mà có vẻ đã bỏ vào khá nhiều công sức.
    Nhưng tôi không hiểu làm thế này thì rốt cuộc được lợi gì

  • Việc LLM sao chép mã có thể là một sai sót, nhưng chuyện sha256sum của file wasm trùng hệt nhau thì khá nghiêm trọng

  • Cuộc thảo luận ban đầu tiếp nối từ liên kết này