agentmemory - Hệ thống bộ nhớ lâu dài cho tác tử lập trình AI

xguru · 2026-05-22T09:46:01+09:00

Giải quyết vấn đề tác tử lập trình AI quên mọi thứ khi phiên làm việc kết thúc Tự động ghi lại và nén việc sử dụng công cụ ở chế độ nền, rồi tiêm ngữ cảnh khi bắt đầu phiên tiếp theo Không cần giải thích lại stack và kiến trúc ở mỗi phiên, khắc phục giới hạn 200 dòng và vấn đề stale của bộ nhớ tích hợp (CLAUDE.md) Tương thích với mọi tác tử hỗ trợ MCP·REST như Claude Code, Cursor, Codex CLI, Gemini CLI..., dùng chung một máy chủ Trên benchmark LongMemEval-S đạt R@5 95.2% (mem0 68.5%, Letta 83.2%) Khoảng ~170K token/năm, chi phí ~$10 (dùng embedding cục bộ thì $0) Theo mốc 240 observations, 22K+ token → ~1.900 token (giảm 92%) Hợp nhất tìm kiếm ba luồng BM25 + Vector + Graph bằng RRF Với tiếng Hàn/CJK, phân tách theo từ khi cài @node-rs/jieba, tiny-segmenter Hợp nhất bộ nhớ 4 tầng lấy cảm hứng từ sleep consolidation của não người: Working (ghi nhớ ngắn hạn việc dùng công cụ) → Episodic (tóm tắt phiên) → Semantic (trích xuất sự kiện/mẫu hình) → Procedural (quy trình làm việc và quyết định) Cung cấp 51 công cụ MCP Core: memory_recall, memory_save, memory_smart_search, memory_patterns Đa tác tử: memory_lease, memory_signal_send/read, memory_mesh_sync Quản trị: memory_audit, memory_governance_delete, memory_snapshot_create (được version hóa bằng Git) Tự động phát hiện nhà cung cấp embedding: Local all-MiniLM-L6-v2 (miễn phí·offline, recall +8 điểm phần trăm so với chỉ BM25), Gemini, OpenAI, Voyage, Cohere, OpenRouter Viewer thời gian thực (port 3113) + Session Replay Luồng observation trực tiếp, trực quan hóa knowledge graph, phát lại tốc độ 0.5×–4× Có thể nhập Claude Code JSONL transcripts bằng import-jsonl Dựa trên iii engine, không cần Postgres·Redis·Express·pm2·Prometheus Mở rộng pubsub·cron·queue·sandbox·SQL adapter bằng iii worker add Giấy phép Apache-2.0

(github.com/rohitg00)

26 điểm bởi xguru 2026-05-22 | 3 bình luận | Chia sẻ qua WhatsApp

Giải quyết vấn đề tác tử lập trình AI quên mọi thứ khi phiên làm việc kết thúc
Tự động ghi lại và nén việc sử dụng công cụ ở chế độ nền, rồi tiêm ngữ cảnh khi bắt đầu phiên tiếp theo
Không cần giải thích lại stack và kiến trúc ở mỗi phiên, khắc phục giới hạn 200 dòng và vấn đề stale của bộ nhớ tích hợp (CLAUDE.md)
Tương thích với mọi tác tử hỗ trợ MCP·REST như Claude Code, Cursor, Codex CLI, Gemini CLI..., dùng chung một máy chủ
Trên benchmark LongMemEval-S đạt R@5 95.2% (mem0 68.5%, Letta 83.2%)
- Khoảng ~170K token/năm, chi phí ~$10 (dùng embedding cục bộ thì $0)
- Theo mốc 240 observations, 22K+ token → ~1.900 token (giảm 92%)
Hợp nhất tìm kiếm ba luồng BM25 + Vector + Graph bằng RRF
- Với tiếng Hàn/CJK, phân tách theo từ khi cài @node-rs/jieba, tiny-segmenter
Hợp nhất bộ nhớ 4 tầng lấy cảm hứng từ sleep consolidation của não người:
Working (ghi nhớ ngắn hạn việc dùng công cụ) → Episodic (tóm tắt phiên) → Semantic (trích xuất sự kiện/mẫu hình) → Procedural (quy trình làm việc và quyết định)
Cung cấp 51 công cụ MCP
- Core: memory_recall, memory_save, memory_smart_search, memory_patterns
- Đa tác tử: memory_lease, memory_signal_send/read, memory_mesh_sync
- Quản trị: memory_audit, memory_governance_delete, memory_snapshot_create (được version hóa bằng Git)
Tự động phát hiện nhà cung cấp embedding: Local all-MiniLM-L6-v2 (miễn phí·offline, recall +8 điểm phần trăm so với chỉ BM25), Gemini, OpenAI, Voyage, Cohere, OpenRouter
Viewer thời gian thực (port 3113) + Session Replay
- Luồng observation trực tiếp, trực quan hóa knowledge graph, phát lại tốc độ 0.5×–4×
- Có thể nhập Claude Code JSONL transcripts bằng import-jsonl
Dựa trên iii engine, không cần Postgres·Redis·Express·pm2·Prometheus
- Mở rộng pubsub·cron·queue·sandbox·SQL adapter bằng iii worker add
Giấy phép Apache-2.0

3 bình luận

forestkeep21 2026-05-22

Tôi đã thử rồi nhưng có vẻ vẫn còn hơi quá sớm để dùng.
Ở phiên bản hiện tại, post session hook chưa kết nối được nên không thể cấu hình graph,
và mcp server nhìn chung khá chậm (khoảng 3 giây) nên tốc độ xử lý của AI bị chậm đi đáng kể.

Tôi khuyên nên dùng khi nó được nâng cấp thêm vài phiên bản nữa.

unqocn 2026-05-22

Ồ cảm ơn. Dạo này thấy khá nhiều nơi dùng dự án này nên mình cũng tò mò...

hanje3765 29 ngày trước

Việc trích xuất thông tin từ phiên làm việc rồi tích lũy theo kiểu lãi kép có vẻ giống một kỹ năng compound. Ý tưởng về cách lưu trữ và tận dụng MCP cũng khá giống với gbrain. Việc được bổ sung khả năng trực quan hóa thì có vẻ tốt hơn. Cuối cùng thì chắc vẫn cần kiểm tra xem nó có thực sự hoạt động tốt hay không.

agentmemory - Hệ thống bộ nhớ lâu dài cho tác tử lập trình AI

Bài viết liên quan

3 bình luận