16 điểm bởi darjeeling 2026-02-01 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Tóm tắt:

  • Clawdbot là một trợ lý AI cục bộ mã nguồn mở, lưu trữ và quản lý ký ức dài hạn dưới dạng tệp Markdown trong môi trường cục bộ của người dùng mà không phụ thuộc vào đám mây.
  • Thông qua hệ thống bộ nhớ 2 tầng (nhật ký hằng ngày và tri thức dài hạn) cùng tìm kiếm lai (vector + từ khóa), hệ thống có thể truy xuất thông tin hiệu quả ngay cả trong ngữ cảnh quy mô lớn.
  • Để vượt qua giới hạn của cửa sổ ngữ cảnh, hệ thống sử dụng các kỹ thuật 'compaction' và 'pruning' nhằm đồng thời tối ưu chi phí và duy trì hiệu năng.

Tóm tắt chi tiết:

  1. Tổng quan và triết lý thiết kế
    Clawdbot quản lý toàn bộ ký ức dưới dạng tệp Markdown trong workspace cục bộ để trao lại quyền sở hữu dữ liệu cho người dùng. Lấy tính minh bạch làm giá trị cốt lõi, hệ thống được thiết kế để người dùng có thể trực tiếp đọc, chỉnh sửa và quản lý phiên bản các tệp bộ nhớ.

  2. Cấu trúc bộ nhớ 2 tầng
    Bộ nhớ được chia thành hai lớp chính:

  • Layer 1 (Daily Logs): Ghi lại bản tóm tắt hội thoại trong ngày, các quyết định và sở thích của người dùng vào tệp memory/YYYY-MM-DD.md.
  • Layer 2 (Long-term Knowledge): Lưu các sự thật cốt lõi cần được duy trì qua nhiều phiên, các quyết định dự án và hồ sơ người dùng cố định vào tệp MEMORY.md.
  1. Công cụ tìm kiếm lai (Hybrid Search)
    Agent sử dụng công cụ memory_search để tra cứu bộ nhớ chỉ khi cần:
  • Tìm kiếm ngữ nghĩa (Vector Search): Tìm nội dung tương đồng về mặt ngữ nghĩa thông qua embedding (sử dụng SQLite-vec).
  • Tìm kiếm từ khóa (BM25): Đồng thời dùng engine FTS5 để tìm đúng danh từ riêng, ngày tháng, ID, v.v.
  • Tính điểm cuối cùng: Áp dụng phương thức trọng số (0.7 * điểm vector) + (0.3 * điểm văn bản) để nâng cao độ chính xác.
  1. Kỹ thuật quản lý ngữ cảnh
  • Compaction: Khi chạm tới giới hạn ngữ cảnh, hệ thống thay thế các cuộc hội thoại trước đó bằng bản tóm tắt. Đặc biệt, thông qua bước 'Memory Flush', thông tin quan trọng được lưu vĩnh viễn trước vào các tệp Markdown trước khi tóm tắt để ngăn mất mát dữ liệu.
  • Pruning: Cắt bớt các kết quả chạy công cụ quá dài nhưng không cần thiết như đầu ra log quy mô lớn để tiết kiệm token. Có bao gồm logic xóa thông minh có xét tới prompt caching TTL của Anthropic.
  1. Tech stack và luồng dữ liệu
  • Lưu trữ: Tệp Markdown cục bộ (Source of Truth) và SQLite (dùng để lập chỉ mục).
  • Workflow: Phát hiện thay đổi tệp (Chokidar) -> chia chunk (đơn vị 400 token, chồng lấp 80 token) -> embedding -> lưu vào SQLite.

Chưa có bình luận nào.

Chưa có bình luận nào.