claw-code - Dự án viết lại clean-room bằng Python dựa trên mã nguồn bị lộ của Claude Code
(github.com/instructkr)Vào 4 giờ sáng ngày 31 tháng 3 năm 2026, mã nguồn của Claude Code bị lộ ra bên ngoài, khiến cộng đồng lập trình viên xôn xao. Lập trình viên Hàn Quốc Sigrid Jin(@instructkr), thay vì lưu giữ mã nguồn gốc để tránh rủi ro pháp lý, đã viết lại các chức năng cốt lõi bằng Python từ đầu và công khai dự án trước khi trời sáng. Đó chính là dự án claw-code.
Kho lưu trữ này không phải chỉ là một bản mirror của mã bị lộ, mà là kết quả của việc tái hiện clean-room bằng Python cấu trúc agent harness của Claude Code — wiring công cụ, điều phối tác vụ và quản lý ngữ cảnh runtime. Toàn bộ quá trình tái dựng được thực hiện bằng điều phối AI với oh-my-codex(OmX), tận dụng chế độ $team (code review song song) và chế độ $ralph (vòng lặp chạy liên tục).
Tính năng chính:
- src/ — workspace port Python (commands, tools, models, query_engine, v.v.)
- tests/ — kiểm chứng triển khai Python
- Bản port Rust cũng đang được phát triển trên nhánh dev/rust (mục tiêu: an toàn bộ nhớ + hiệu năng cao)
- Nêu rõ đây là dự án độc lập, không liên quan tới Anthropic
Bối cảnh:
Tác giả từng được giới thiệu trong bài báo tháng 3 năm 2026 của WSJ “The Trillion Dollar Race to Automate Our Entire Lives” là một heavy user đã sử dụng 25 tỷ token Claude Code mỗi năm. Dự án này là phần tiếp nối của nghiên cứu kỹ thuật harness đó.
Ngay sau khi được công khai, dự án đã trở thành repo đầu tiên trong lịch sử GitHub vượt mốc 30K sao với tốc độ nhanh nhất (hiện tại ⭐ 33.1k, 🍴 44.9k), và instructkr Discord cũng đang được vận hành như một cộng đồng LLM tiếng Hàn.
52 bình luận
Lúc nhắm vào Upstage cũng vậy, mục tiêu của ScionicAI là gây chú ý sao?
Vậy là trong khi các repo rò rỉ Claude Code được đưa lên GitHub khác lần lượt dính DMCA, repo này đã né được bằng cách giả làm một dự án clean room.
Tôi không hiểu vì sao nó lại có 50k sao trên GitHub nên đã thử tìm hiểu.
Ban đầu còn có dấu vết từng được phát hành với tên https://github.com/instructkr/claude-code, và ngay cả nội dung bên trong cũng đã thay đổi khá nhiều.
Nếu những người bấm sao đã làm vậy trước khi repo bị đổi, đơn giản vì họ nghĩ đó là bản rò rỉ, thì tôi hiểu được. Tôi đã nghi ngờ có hành vi buff sao, nhưng sau khi xem repo ban đầu mang màu sắc thế nào thì có lẽ không phải vậy.
Tôi đã có cảm giác này từ lúc Sigrid Jin đăng bài ở đây, nhưng đúng là người này rất giỏi chớp lấy cơ hội.
Các lập trình viên không thể chỉ giỏi viết code là đủ; phải học cả cách làm marketing như thế này mới có thể đi đường dài, và tôi thật lòng thấy ngưỡng mộ.
Ban đầu đây là kho lưu trữ chỉ đơn thuần tải lên bản mã nguồn bị rò rỉ. Phần lớn số Star có được là vì nó là một kho chứa mã nguồn rò rỉ. Tối qua đã có hàng chục lần
force-pushđược thực hiện, và hiện tại nội dung đã bị thay đổi hoàn toàn thành như bây giờTôi cũng đã thấy rồi. Ở thời điểm 2 tiếng sau khi bị rò rỉ (đến khoảng 8 giờ tối hôm qua), đó đơn giản chỉ là một kho lưu trữ tải lên bản mã nguồn bị rò rỉ thôi.
Tôi bắt đầu xem từ 507c246, nhưng trước đó cũng đã có rồi sao?
f5a40b8
Trời ơi, cái này chắc chắn có vấn đề rồi nhỉ?
Trước đó cũng đã có rồi.
Cá nhân tôi thấy đây có thể là một repo mang tính lạm dụng. Tôi cũng từng bị như vậy.
Xét tình huống các repo khác đang vướng vấn đề DMCA, việc repo này trước đây thực sự đã từng bị rò rỉ mã nguồn gốc, cùng với số lượng fork và sao hiện có, thì nếu phải kiện tụng với Anthropic có lẽ sẽ ở vào thế bất lợi.
Có vẻ cũng không hẳn là chỉ thấy ghen tị.
Thật ra lúc đầu tôi cũng đã rất tức giận khi lần đầu xem repo này. May mà những người khác cũng phẫn nộ giống hệt tôi.
Tôi từng chỉ ra rằng người tên Sigrid Jin này đã nhiều lần cố lan truyền bài viết của chính mình trên GeekNews như thể không phải do mình đăng.
Thế nhưng dù mặt dày làm viral như vậy, có vẻ người này vẫn hoạt động rất tốt, nên tôi còn tự hỏi có phải mình đã sống quá ngay thẳng không.
Nhưng hành động lần này thì hoàn toàn khác hẳn so với chuyện viral thông thường.
Có người ở trên đã đăng bản ghi
f5a40b8, và hóa ra ban đầu người này còn đăng hẳn bản bị rò rỉ để lấy star nữa.Đã tráo repo vốn kiếm star nhờ bản rò rỉ, lại còn quảng cáo là The fastest repo in history to surpass 50K stars, nữa chứ.....
Người này nghề chính không phải là lập trình viên đúng không? Có vẻ hoàn toàn không có chút tinh thần nghề nghiệp nào của một developer cả.
+1 Tôi hoàn toàn đồng ý.
Tôi cũng đã nghĩ vậy. Hơi có cảm giác né tránh + marketing..
Chà, không biết nên xem đây là marketing hay là chiêu câu tương tác nữa... Nói thật là trông không ổn lắm.
Việc triển khai clean room dựa trên mã nguồn bị rò rỉ theo tôi tự nó đã là một mâu thuẫn.
Bạn còn không biết clean room là gì à?
https://github.com/sigridjineth/sigridjineth/…
Trong lúc đó, chính người trong cuộc đang xóa thông tin đơn vị trực thuộc của mình khỏi hồ sơ GH.
Rõ ràng đây là người mà trong một bài báo cuối năm ngoái đã công khai tên thật và nơi làm việc, còn gọi là "người dùng hạng nặng toàn cầu số 1" mà.
[Phóng sự] "Hàn Quốc xuất hiện người dùng Claude số 1"… tham dự sự kiện meetup của Anthropic https://n.news.naver.com/article/092/0002402940
Biết xấu hổ là còn may đấy..
Thật kinh tởm.
Cái này chẳng phải giống như tội phạm sao?
Dù giữa các lập trình viên, chỉ cần nhìn qua là biết ngay đây là kiểu marketing lừa đảo.
Nhưng về mặt kinh doanh, nó sẽ được bán rất tốt như một dự án ngôi sao, một lập trình viên ngôi sao. Tức là kiếm ra tiền.
Nhiều khi nhìn các chương trình Trung Quốc cài mã độc ác ý rồi bọc ngoài là mã nguồn mở mà thấy rất ghê tởm. Dù vậy, cũng có nhiều dự án chất lượng cao.
Nhưng mà... sao các dự án của lập trình viên Hàn Quốc lại cứ đơn giản là toát ra mùi lừa đảo kém chất lượng như vậy..
Có vẻ như đang hiểu sai về clean room... Việc viết lại dựa trên mã nguồn không có nghĩa đó là clean room... Clean room phải là một bên tạo spec từ mã hiện có rồi một thực thể khác dựa vào đó để làm thì mới gọi là clean room chứ..
Phòng bẩn
Làm kiểu này rồi được nhiều sao thì chắc cũng không thành kiểu lập trình viên có tên tuổi đáng để người ta tôn trọng đâu nhỉ...
Dạo này có quá nhiều người tự xưng là dev ngôi sao chỉ chăm chăm câu tương tác hơn là chia sẻ điều hay. Chỉ cần lên Threads là thấy đầy rẫy.. Giờ thì kiểu "cyber wrecker" này không còn là đặc quyền của một số YouTuber nữa. Càng như vậy, tôi nghĩ hiện tượng ngược lại cũng sẽ xuất hiện thôi. Chẳng hạn như dịch chuyển sang phía nội dung premium.
Tôi đồng cảm...
Ghê tởm...
Tôi không thể đồng ý.
Phòng sạch chỉ được gọi là phòng sạch khi việc tiếp cận chính tác phẩm bị chặn hoàn toàn và chỉ phát triển dựa trên đặc tả.
Cái đó thì просто là sao chép lậu
Tôi đã cài
oh my zshnhư một thứ bắt buộc suốt nhiều năm nay,và cả
oh my opencodenữa, tôi cũng đã dùng rất tốt cho đến khi Anthropic chặn lại; thỉnh thoảng khi nó trở thành vấn đề trong cộng đồng, tôi cũng từng nghĩ kiểu "mình hồi đó cũng từng như vậy".Giờ thì cứ nhìn thấy
oh my XXXlà tôi lại nghĩ trước tiên: "Lại là -nhóm đó- nữa à?"Câu kéo chú ý cũng phải có chừng mực thì mới tạo thiện cảm được. Lần này thì hơi vượt quá giới hạn rồi.
Đúng vậy, vì cùng một nhóm nên có vẻ còn nghiêm trọng hơn.
Clean room (dựa trên mã nguồn bị rò rỉ) à, hahaha
Thú vị đấy...
Có thể dùng từ “clean room” trong trường hợp này không?
Đây không phải là clean room.
Thật sự khiến tôi có rất nhiều suy nghĩ...
Nhìn cảnh một dự án không có lấy giấy phép mà vẫn lao thẳng lên 170 nghìn sao rồi tăng tốc mất kiểm soát, đúng là cảm giác thời Wild West kiểu "nắm đấm (code) đi trước pháp luật" đang diễn ra ở Hàn Quốc.
Nghĩ đến cảnh họ hoang mang kiểu "Ơ, sao code của bọn mình lại đang chạy bằng Rust cùng với commit message viết bằng tiếng Hàn? Mà còn có tận 170 nghìn sao nữa chứ?" là thấy buồn cười thật sự.
Thực ra gần như chỉ đóng vai trò gương mặt đại diện thôi, còn việc dẫn dắt repo và mổ xẻ để chỉnh sửa lại thì đang do hai maintainer của OMC/OMO đảm nhiệm.
Thật sự không dễ chút nào.. Hãy nói đây là trò đùa Cá tháng Tư đi~ Dù vậy thì vụ này đúng là đã vượt quá giới hạn rồi
Theo kinh nghiệm của tôi, ở các công ty kiểu phong cách này thực ra nhiều hơn tưởng tượng. Có vẻ ở bất kỳ thế hệ nào, cách làm này lúc ban đầu cũng hoạt động khá tốt, nhưng hiếm khi kéo dài được lâu. Dù vậy, họ vẫn sống ổn khi làm khá tốt ở mức trên trung bình.
Đúng là một bình luận khiến người ta có nhiều suy nghĩ. Bôi nhọ à,,
Đây chỉ là quan sát cá nhân. Vu khống là việc nói về vị trí tương lai hoặc mức thu nhập của những người như vậy.
À vâng vâng, ý tôi là tôi đồng ý ạ haha
Có thể gọi là clean room nếu nó được tạo ra dựa trên đoạn mã không sạch không?
Phòng sạch (dựa trên mã bị rò rỉ)...?????
Cảm giác dùng chung từ “clean room” và “porting” thì hơi gượng thật. Dù sao thì có vẻ bạn vẫn sẽ kiếm được khá nhiều tiền.
Trong lúc đó sao đã lên 130 nghìn..
Từ góc độ người phát triển agent, việc biết được kiến trúc công nghệ cốt lõi của một công ty đang tạo ra đáp án đúng là cực kỳ đã.
Rất đúng chất MZ theo nhiều nghĩa.
Người trẻ mà có hành vi không tốt thì gọi là rất "MZ" sao? Theo góc nhìn của thế hệ MZ thì
những người cứ thấy kiểu này là bảo là "MZ" đúng là điển hình của ...
Tôi cũng hay nói là rất kiểu MZ khi thấy thứ gì đó kỳ lạ, chẳng phải mọi người đều vậy sao?
Tôi cũng là mz mà,.?
Đây có phải là cái gọi là bệnh hipster không?