AI-SLOP Detector — Công cụ phân tích và phát hiện “mã phóng đại sai sự thật” do AI tạo ra
(github.com/flamehaven01)Công cụ này bắt đầu từ một trải nghiệm thất bại cá nhân.
Vài ngày trước, tôi đã đầy tự tin
công bố một repository với cái tên rất kêu:
“HRPO-X v1.0.1 – triển khai framework tối ưu hóa suy luận lai”.
Đó là một dự án mà tôi tin rằng mình đã hiện thực hóa kiến trúc dựa trên các bài báo mới nhất.
Nhưng phản hồi đầu tiên xuất hiện ngay sau khi công khai đã làm tan nát mọi kỳ vọng của tôi.
“Tò mò nên vào xem thử, và đúng như dự đoán.
Một repo AI Slop được tạo ra từ cả đống ảo giác (Hallucination).”
Ban đầu tôi tưởng đó chỉ là bình luận ác ý.
Nhưng khi mở lại mã và mổ xẻ từng phần một,
lời chỉ trích đó chính xác đến đau đớn.
Vấn đề không phải là “ý định” mà là “mật độ”
Dự án đó không phải một demo đơn giản,
mà là kết quả nghiên cứu về quá trình chuyển một bài báo thành kiến trúc production.
- Có thiết kế kiến trúc
- Cây thư mục được sắp xếp gọn gàng
- Có file cấu hình (Config)
- Định nghĩa class và interface đầy đủ
- Thuật toán audit nội bộ cũng vượt qua bình thường
Nhìn bề ngoài thì hoàn hảo.
Ngay cả các linter hiện có hay các kiểm tra tính toàn vẹn cấu trúc cũng đều vượt qua.
Nhưng khi đào sâu nguyên nhân,
tôi đã phát hiện ra một vấn đề chí mạng.
“Tính toàn vẹn cấu trúc (Structural Integrity) thì hoàn hảo, nhưng
mật độ nội dung (Content Density) lại đang tiến gần về 0.”
Nói cách khác,
- Vỏ ngoài (Shell) trông rất thuyết phục nhưng
- logic triển khai thực tế thì trống rỗng hoặc chỉ có
pass - và chỉ được lấp đầy bằng những chú thích tô vẽ quá mức
Tôi không còn cách nào khác ngoài việc thừa nhận rằng đó là
kiểu rác mã điển hình do AI tạo ra,
tức là “AI Slop”.
Vì thế tôi đã tạo ra công cụ này: AI-SLOP Detector
Vì vậy, công cụ tôi tạo ra là AI-SLOP Detector.
Mục tiêu rất đơn giản.
- Không phải xem mã chạy tốt đến mức nào
- mà là xem khoảng cách giữa mã và phần mô tả lớn đến đâu
- bằng cách quan sát tĩnh
Để làm điều đó, công cụ sử dụng các chỉ số sau.
Nó phát hiện những gì
Các mẫu AI Slop được định nghĩa trong README được chia thành ba nhóm lớn.
1. Empty Function Slop (hàm rỗng)
- Phần mô tả thì phức tạp
- nhưng phần triển khai thực tế của hàm chỉ ở mức
pass
2. Buzzword Inflation (lạm phát thuật ngữ)
- Bất kể độ phức tạp của mã
các thuật ngữ nhưneural,transformer,quantum,enterprise
lại bị dùng quá mức
3. Overhyped Comments (chú thích thổi phồng quá mức)
- Với logic đơn giản
nhưng chú thích lại lặp đi lặp lại các biểu đạt như “đột phá”, “state-of-the-art”
Cách phân tích (tóm tắt)
AI-SLOP Detector dựa trên Python AST,
tính toán song song nhiều chỉ số để đưa ra Deficit Score (0–100).
Các chỉ số cốt lõi
LDR (Logic Density Ratio)
- Tỷ lệ logic thực tế chiếm trong toàn bộ mã
- Tiêu chuẩn: dưới 45% thì xếp hạng CRITICAL(F)
Inflation Score
- Mật độ buzzword trong tài liệu/chú thích so với độ phức tạp của mã
- Tiêu chuẩn: từ 2.0 lần trở lên thì là CRITICAL
DDC (Dependency Density Check)
- import không được sử dụng
- tỷ lệ phụ thuộc vô nghĩa
Pattern Registry
- empty function
excepttrần- lạm dụng TODO / FIXME
- phát hiện nhiều mẫu đặc trưng của mã do AI tạo ra
Tổng hợp các giá trị này, công cụ phân loại thành các trạng thái sau.
CLEANSUSPICIOUSINFLATEDCRITICAL
Trạng thái dự án
- Python 3.8+
- Cung cấp CLI và Python API
- Vượt qua 34 bài kiểm thử
- Phiên bản mới nhất: v2.5.0 (2026-01-09)
Đây là công cụ dành cho ai
- Những người sử dụng công cụ no-code / low-code
- Các lập trình viên ở vị trí phải rà soát mã do AI tạo ra
- Những người thường xuyên gặp các repository “trông có vẻ ổn nhưng vẫn thấy cấn cấn”
Mục đích là cung cấp cho họ
những tín hiệu có thể giải thích được “vì sao đoạn mã này trông kỳ lạ”.
Cuối cùng
HRPO-X v1.0.1 được nhắc đến ở trên đã trải qua một đợt refactor toàn diện,
và hiện đã được chỉnh lý lại thực tế hơn dưới dạng phiên bản phục vụ mục đích giáo dục.
Hy vọng bài viết và công cụ này
sẽ phần nào giúp ích cho những ai
đang gặp những trăn trở tương tự.
Chúc tất cả các lập trình viên luôn vững vàng!
Chưa có bình luận nào.