5 điểm bởi 0xvinsohn 2026-03-17 | 1 bình luận | Chia sẻ qua WhatsApp

Các AI agent như Claude Code hay OpenClaw sẽ quên sạch mọi ký ức ngay khi phiên làm việc kết thúc. Hai tuần trước vừa thống nhất chiến lược migration DB, đến phiên tiếp theo lại thấy nó ngồi nghiên cứu lại từ đầu thì đúng là khá bực.

Tất nhiên đã có nhiều cách giải quyết cho việc đó, nhưng giới hạn của chúng rất rõ ràng:

  • Cố xoay xở chỉ với một MEMORY.md: chỉ một tuần là đầy, lại phải đau đầu xem nên xóa gì. Mà đã xóa thì coi như mất luôn
  • Tìm kiếm RAG: cái cần tìm thì tìm được, nhưng ngay từ đầu lại không thể phán đoán được "mình đã biết cái này chưa?"
  • Nhét hết vào ngữ cảnh 1M: làm thì vẫn làm được, nhưng attention bị loãng và chi phí token tăng vọt

Hipocampus giải quyết vấn đề này bằng cách gắn cây nén 5 cấp vào bộ nhớ 3 tầng (hot/warm/cold). Toàn bộ lịch sử hội thoại/công việc tích lũy đến nay được nén thành một chỉ mục ROOT.md khoảng ~100 dòng, nên mỗi lần gọi chỉ cần thêm khoảng ~3K token là agent có thể lập tức nắm được "mình biết gì và không biết gì".

  • Cài đặt xong chỉ với một dòng npx hipocampus init
  • Không phụ thuộc bên ngoài + không cần hạ tầng như server
  • Có thể dùng ngay với Claude Code, OpenClaw hiện có
  • Tìm kiếm lai BM25 + vector dựa trên qmd (tùy chọn)
  • Việc ghi bộ nhớ được xử lý bởi sub-agent để giữ ngữ cảnh của phiên chính luôn gọn sạch
  • Giấy phép MIT

Tôi làm ra nó vì tiếc thời gian và token khi agent cứ hỏi lại cùng một thứ và phải nghiên cứu lại từ đầu mỗi lần, nhưng nó hoạt động tốt hơn mong đợi nên tôi đã phát hành dưới dạng mã nguồn mở.

1 bình luận

 
gykim 2026-03-17

Hay đấy. Tôi đang lưu lại toàn bộ lịch sử công việc theo từng ngày rồi dùng grep để tra cứu, nên chắc phải thử cái này mới được.