5 điểm bởi xguru 1 giờ trước | 2 bình luận | Chia sẻ qua WhatsApp
  • Giải quyết vấn đề tác tử lập trình AI quên mọi thứ khi phiên làm việc kết thúc
  • Tự động ghi lại và nén việc sử dụng công cụ ở chế độ nền, rồi tiêm ngữ cảnh khi bắt đầu phiên tiếp theo
  • Không cần giải thích lại stack và kiến trúc ở mỗi phiên, khắc phục giới hạn 200 dòng và vấn đề stale của bộ nhớ tích hợp (CLAUDE.md)
  • Tương thích với mọi tác tử hỗ trợ MCP·REST như Claude Code, Cursor, Codex CLI, Gemini CLI..., dùng chung một máy chủ
  • Trên benchmark LongMemEval-S đạt R@5 95.2% (mem0 68.5%, Letta 83.2%)
    • Khoảng ~170K token/năm, chi phí ~$10 (dùng embedding cục bộ thì $0)
    • Theo mốc 240 observations, 22K+ token → ~1.900 token (giảm 92%)
  • Hợp nhất tìm kiếm ba luồng BM25 + Vector + Graph bằng RRF
    • Với tiếng Hàn/CJK, phân tách theo từ khi cài @node-rs/jieba, tiny-segmenter
  • Hợp nhất bộ nhớ 4 tầng lấy cảm hứng từ sleep consolidation của não người:
    Working (ghi nhớ ngắn hạn việc dùng công cụ) → Episodic (tóm tắt phiên) → Semantic (trích xuất sự kiện/mẫu hình) → Procedural (quy trình làm việc và quyết định)
  • Cung cấp 51 công cụ MCP
    • Core: memory_recall, memory_save, memory_smart_search, memory_patterns
    • Đa tác tử: memory_lease, memory_signal_send/read, memory_mesh_sync
    • Quản trị: memory_audit, memory_governance_delete, memory_snapshot_create (được version hóa bằng Git)
  • Tự động phát hiện nhà cung cấp embedding: Local all-MiniLM-L6-v2 (miễn phí·offline, recall +8 điểm phần trăm so với chỉ BM25), Gemini, OpenAI, Voyage, Cohere, OpenRouter
  • Viewer thời gian thực (port 3113) + Session Replay
    • Luồng observation trực tiếp, trực quan hóa knowledge graph, phát lại tốc độ 0.5×–4×
    • Có thể nhập Claude Code JSONL transcripts bằng import-jsonl
  • Dựa trên iii engine, không cần Postgres·Redis·Express·pm2·Prometheus
    • Mở rộng pubsub·cron·queue·sandbox·SQL adapter bằng iii worker add
  • Giấy phép Apache-2.0

2 bình luận

 
forestkeep21 58 phút trước

Tôi đã thử rồi nhưng có vẻ vẫn còn hơi quá sớm để dùng.
Ở phiên bản hiện tại, post session hook chưa kết nối được nên không thể cấu hình graph,
mcp server nhìn chung khá chậm (khoảng 3 giây) nên tốc độ xử lý của AI bị chậm đi đáng kể.

Tôi khuyên nên dùng khi nó được nâng cấp thêm vài phiên bản nữa.

 

Ồ cảm ơn. Dạo này thấy khá nhiều nơi dùng dự án này nên mình cũng tò mò...