AI-SLOP Detector — Công cụ phân tích và phát hiện “mã phóng đại sai sự thật” do AI tạo ra

(github.com/flamehaven01)

2 điểm bởi flamehaven01 2026-01-09 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Công cụ này bắt đầu từ một trải nghiệm thất bại cá nhân.

Vài ngày trước, tôi đã đầy tự tin
công bố một repository với cái tên rất kêu:
“HRPO-X v1.0.1 – triển khai framework tối ưu hóa suy luận lai”.
Đó là một dự án mà tôi tin rằng mình đã hiện thực hóa kiến trúc dựa trên các bài báo mới nhất.

Nhưng phản hồi đầu tiên xuất hiện ngay sau khi công khai đã làm tan nát mọi kỳ vọng của tôi.

“Tò mò nên vào xem thử, và đúng như dự đoán.
Một repo AI Slop được tạo ra từ cả đống ảo giác (Hallucination).”

Ban đầu tôi tưởng đó chỉ là bình luận ác ý.
Nhưng khi mở lại mã và mổ xẻ từng phần một,
lời chỉ trích đó chính xác đến đau đớn.

Vấn đề không phải là “ý định” mà là “mật độ”

Dự án đó không phải một demo đơn giản,
mà là kết quả nghiên cứu về quá trình chuyển một bài báo thành kiến trúc production.

Có thiết kế kiến trúc
Cây thư mục được sắp xếp gọn gàng
Có file cấu hình (Config)
Định nghĩa class và interface đầy đủ
Thuật toán audit nội bộ cũng vượt qua bình thường

Nhìn bề ngoài thì hoàn hảo.
Ngay cả các linter hiện có hay các kiểm tra tính toàn vẹn cấu trúc cũng đều vượt qua.

Nhưng khi đào sâu nguyên nhân,
tôi đã phát hiện ra một vấn đề chí mạng.

“Tính toàn vẹn cấu trúc (Structural Integrity) thì hoàn hảo, nhưng
mật độ nội dung (Content Density) lại đang tiến gần về 0.”

Nói cách khác,

Vỏ ngoài (Shell) trông rất thuyết phục nhưng
logic triển khai thực tế thì trống rỗng hoặc chỉ có pass
và chỉ được lấp đầy bằng những chú thích tô vẽ quá mức

Tôi không còn cách nào khác ngoài việc thừa nhận rằng đó là
kiểu rác mã điển hình do AI tạo ra,
tức là “AI Slop”.

Vì thế tôi đã tạo ra công cụ này: AI-SLOP Detector

Vì vậy, công cụ tôi tạo ra là AI-SLOP Detector.

Mục tiêu rất đơn giản.

Không phải xem mã chạy tốt đến mức nào
mà là xem khoảng cách giữa mã và phần mô tả lớn đến đâu
bằng cách quan sát tĩnh

Để làm điều đó, công cụ sử dụng các chỉ số sau.

Nó phát hiện những gì

Các mẫu AI Slop được định nghĩa trong README được chia thành ba nhóm lớn.

1. Empty Function Slop (hàm rỗng)

Phần mô tả thì phức tạp
nhưng phần triển khai thực tế của hàm chỉ ở mức pass

2. Buzzword Inflation (lạm phát thuật ngữ)

Bất kể độ phức tạp của mã
các thuật ngữ như neural, transformer, quantum, enterprise
lại bị dùng quá mức

3. Overhyped Comments (chú thích thổi phồng quá mức)

Với logic đơn giản
nhưng chú thích lại lặp đi lặp lại các biểu đạt như “đột phá”, “state-of-the-art”

Cách phân tích (tóm tắt)

AI-SLOP Detector dựa trên Python AST,
tính toán song song nhiều chỉ số để đưa ra Deficit Score (0–100).

Các chỉ số cốt lõi

LDR (Logic Density Ratio)

Tỷ lệ logic thực tế chiếm trong toàn bộ mã
Tiêu chuẩn: dưới 45% thì xếp hạng CRITICAL(F)

Inflation Score

Mật độ buzzword trong tài liệu/chú thích so với độ phức tạp của mã
Tiêu chuẩn: từ 2.0 lần trở lên thì là CRITICAL

DDC (Dependency Density Check)

import không được sử dụng
tỷ lệ phụ thuộc vô nghĩa

Pattern Registry

empty function
except trần
lạm dụng TODO / FIXME
phát hiện nhiều mẫu đặc trưng của mã do AI tạo ra

Tổng hợp các giá trị này, công cụ phân loại thành các trạng thái sau.

CLEAN
SUSPICIOUS
INFLATED
CRITICAL

Trạng thái dự án

Python 3.8+
Cung cấp CLI và Python API
Vượt qua 34 bài kiểm thử
Phiên bản mới nhất: v2.5.0 (2026-01-09)

Đây là công cụ dành cho ai

Những người sử dụng công cụ no-code / low-code
Các lập trình viên ở vị trí phải rà soát mã do AI tạo ra
Những người thường xuyên gặp các repository “trông có vẻ ổn nhưng vẫn thấy cấn cấn”

Mục đích là cung cấp cho họ
những tín hiệu có thể giải thích được “vì sao đoạn mã này trông kỳ lạ”.

Cuối cùng

HRPO-X v1.0.1 được nhắc đến ở trên đã trải qua một đợt refactor toàn diện,
và hiện đã được chỉnh lý lại thực tế hơn dưới dạng phiên bản phục vụ mục đích giáo dục.

Hy vọng bài viết và công cụ này
sẽ phần nào giúp ích cho những ai
đang gặp những trăn trở tương tự.

Chúc tất cả các lập trình viên luôn vững vàng!