Đừng giao email cho AI — hộp thư đến cần một ‘tường lửa’, không phải ‘trợ lý’ (mã nguồn mở)

(github.com/k08200)

1 điểm bởi k08200 4 giờ trước | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Dạo này các công cụ "email AI" đều đi theo cùng một hướng. Chúng đặt sẵn bản nháp cho từng email, gắn huy hiệu "AI bảo hãy trả lời", rồi thêm nút gửi tự động. Kết quả là gì? Hộp thư đến không yên tĩnh hơn mà còn ồn ào hơn. Chẳng khác nào chồng thêm một màn hình nữa lên trên màn hình hiện có.

Tôi làm theo hướng hoàn toàn ngược lại. Không phải giao hộp thư đến cho AI, mà là dựng một tường lửa để chặn AI. Klorn chỉ xuất ra đúng một phân loại cho mỗi email đến, và không hiển thị phần còn lại.

4 cấp độ — SILENT (chỉ ghi lại, không hiển thị) / QUEUE (hiển thị trong hàng đợi, không thông báo) / PUSH (thật sự đánh thức bạn) / AUTO (hiện tại chỉ phân loại, cố ý chưa nối sang phần thực thi).

Điểm cốt lõi — LLM không đưa ra quyết định. Với mỗi email, nó chỉ chấm 4 con số (độ chắc chắn, độ tin cậy của người gửi, khả năng hoàn tác, độ khẩn cấp), rồi các quy tắc tất định mà con người có thể đọc được sẽ ánh xạ chúng sang từng cấp độ. Vì thế có thể kiểm toán và kiểm thử chính sách ngay cả khi không có mô hình, và nếu LLM chết thì cơ chế fallback bằng từ khóa vẫn tạo ra cùng các con số để email khẩn cấp tiếp tục được đi qua.

Và những gì không thể hoàn tác thì tuyệt đối không giao cho AI. Ba việc gửi đi, xóa vĩnh viễn, chuyển tiếp ra ngoài đều nằm sau một deterministic floor — tại thời điểm phê duyệt, các byte sẽ được gửi được cố định thành receipt, và khi thực thi nếu khác dù chỉ một byte thì throw. Đường đi tự động là fail-closed. Dù AI có khăng khăng rằng "đã gửi rồi" thì nếu byte không khớp, nó cũng sẽ không đi ra ngoài.

Phần "AI là phép màu" tôi cũng đã tự đo trực tiếp. Trong tác vụ phân loại, một mô hình rẻ hơn nhiều lại chính xác hơn GPT-4o. Với kiểu việc này, thứ cần không phải là một mô hình thiên tài mà là sự nhất quán trong việc đọc đi đọc lại cùng 4 tín hiệu mỗi lần (số liệu và căn cứ có trong bài viết bên dưới).

Mã nguồn mở AGPLv3, tương thích với mọi endpoint tương thích OpenAI (dùng Ollama thì email không rời khỏi máy của tôi). Nói thật thì đây vẫn là PoC giai đoạn đầu — khoảng 80% khớp trên 50 email thật của tôi (1 lần chạy, theo baseline tôi tự đặt), người dùng thực tế hiện vẫn chỉ có mình tôi, và phần thực thi AUTO được cố ý tắt. Phóng đại lên thì bình luận đầu tiên sẽ xé xác tôi mất.

Bài viết về thiết kế (một chuỗi có thảo luận kiến trúc dành cho kỹ sư):

Vì sao mô hình rẻ đánh bại GPT-4o: https://dev.to/k08200/…
Vì sao để LLM chỉ chấm điểm chứ không quyết định: https://dev.to/k08200/…
Deterministic floor cho các hành động không thể hoàn tác: https://dev.to/k08200/…
Repo: https://github.com/k08200/klorn (docker-compose + thiết lập LLM cục bộ). Demo đang ở chế độ thử nghiệm OAuth (100 người), nên tự host là nhanh nhất.

Đừng giao email cho AI — hộp thư đến cần một ‘tường lửa’, không phải ‘trợ lý’ (mã nguồn mở)

Bài viết liên quan

Chưa có bình luận nào.