DeepSeek Reasonix - tác nhân lập trình native cho DeepSeek với tỷ lệ cache cao và chi phí thấp

(esengine.github.io)

3 điểm bởi GN⁺ 2026-05-25 | 2 bình luận | Chia sẻ qua WhatsApp

Tác nhân lập trình terminal mã nguồn mở được thiết kế chuyên cho DeepSeek API, giao tiếp trực tiếp với api.deepseek.com
Vòng lặp chỉ append được tối ưu cho byte-stable prefix cache của DeepSeek, giúp duy trì tỷ lệ cache hit trên 90% trong các phiên dài và giảm chi phí token đầu vào xuống khoảng 1/5 (xấp xỉ 1/3 chi phí so với các công cụ cùng loại)
Chạy chỉ với một dòng npx reasonix code mà không cần cài đặt toàn cục (Node ≥ 22, hỗ trợ macOS/Linux/Windows)
3 thiết kế cốt lõi
- Cache-First Loop: cấu trúc chỉ append, không phụ thuộc marker, duy trì prefix cache với thứ tự gọi mang tính quyết định
- R1 Thought Harvest: thu thập chuỗi suy luận của các tool call bị bỏ sót
- Tool-Call Repair: khôi phục theo kiểu tự sửa lỗi có nhận biết schema
Nguyên tắc ưu tiên terminal (Terminal-first) nên không hỗ trợ plugin IDE, tận dụng nguyên trạng các công cụ terminal như git diff, ls
- Xây dựng trên TypeScript + Ink TUI, đồng thời cung cấp riêng ứng dụng desktop Tauri (đóng gói kèm runtime Node)
Vận hành mô hình V4 hai tầng: mặc định dùng V4-Flash cho các vòng lặp chi phí thấp, nâng cấp một lượt sang V4-Pro bằng /pro, hoặc chạy toàn bộ phiên bằng Pro với /preset max
Hỗ trợ hạng nhất cho MCP (Model Context Protocol): kết nối máy chủ bên ngoài chỉ với một dòng --mcp "name=cmd args", hỗ trợ các phương thức truyền stdio, SSE và Streamable HTTP
Sandbox + cổng /plan: mọi công cụ tích hợp sẵn đều được sandbox trong thư mục thực thi, chế độ /plan là cổng audit chỉ đọc để chặn ghi trước khi phê duyệt
- Chỉnh sửa SEARCH/REPLACE sẽ được giữ trong hàng đợi pending và chưa ghi ra đĩa cho đến trước /apply
Composable Skills: đặt file Markdown trong .reasonix/skills/<name>.md, chạy cô lập bằng frontmatter runAs: subagent và allowed-tools
Replay & Events: mọi sự kiện đều được ghi xuống đĩa, cho phép phát lại phiên trước, xem thống kê và audit bằng các lệnh reasonix replay / events / stats
Khả năng mở rộng dựa trên văn bản thuần: quản lý mọi cấu hình dưới dạng plain text có thể theo dõi bằng git qua các thư mục /mcp, /skills, /memory, /config, /slash
Hỗ trợ endpoint DeepSeek tự host: từ phiên bản 0.30 cho phép tiền tố khóa không chuẩn, chỉ cần đặt baseUrl thành địa chỉ nội bộ là vòng lặp, cache và giao thức tool vẫn hoạt động như cũ
Giá DeepSeek API: V4-Flash $0.07/Mtok (uncached) · $0.014/Mtok (cached)
Giấy phép MIT

2 bình luận

myoun 2026-05-25

DeepSeek đã áp dụng vĩnh viễn việc giảm giá V4 Pro, nghĩ kỹ thì dùng DeepSeek làm coding agent có vẻ cũng không tệ.

GN⁺ 2026-05-25

Ý kiến trên Hacker News

Tôi không chắc có thực sự cần một coding agent chuyên cho DeepSeek để tận dụng cache của DeepSeek hay không
Hôm qua do vấn đề quota của Codex vẫn chưa được giải quyết, tôi đã làm một bridge rất nhỏ để dùng DeepSeek V4 Pro trong Codex, và có vẻ gần như mọi thứ tôi làm đều được cache: https://i.imgur.com/7eKn6wN.png
Tính đến 2026-05-23, có 39,123,200 token trúng cache đầu vào và 1,692,286 token không trúng cache; bridge này không làm gì đặc biệt ngoài việc chuyển định dạng API của DeepSeek sang dạng mà Codex mong đợi, nên hoàn toàn không có xử lý đặc biệt nào liên quan đến caching
Ngoài việc caching có thể tốt hơn, tôi không rõ nó có lợi ích gì so với việc chạy OpenCode trực tiếp bằng API DeepSeek. Cách đó chắc cũng cache tương tự, giao tiếp trực tiếp với api.deepseek.com nếu điều đó quan trọng, và có được môi trường thực thi trưởng thành hơn nhiều
- Có lẽ nên link trang này thì hơn: https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs...
  Ở đó giải thích vì sao họ xem đây là giải pháp tốt hơn và vì sao lại có triết lý thiết kế mạnh như vậy
  “Tự động cache tiền tố chỉ kích hoạt khi tiền tố byte chính xác của yêu cầu trước đó khớp. Hầu hết các vòng lặp agent đều thay đổi thứ tự, viết lại, hoặc chèn timestamp mới ở mỗi lượt — tỷ lệ cache hit thực tế dưới 20%”
  Vì vậy họ tối ưu phần này cùng các kỹ thuật khác để tăng tỷ lệ cache hit và giảm chi phí
- Opencode có vấn đề độ ổn định cache khá nghiêm trọng, và hiện tại có vẻ không mấy muốn sửa
- Tôi cũng nghĩ y hệt vậy, và khi xem code provider DeepSeek trong coding agent tôi dùng thì gần như mọi thứ tác giả viết đều đã được triển khai
  Cho ai tò mò: http://github.com/tontinton/maki
- Nếu bạn đã “làm một bridge nhỏ để dùng DeepSeek V4 Pro trong Codex” thì tôi muốn hỏi liệu bạn có thể chia sẻ bridge đó không
  DeepSeek v4 dùng với claude-code hay opencode đều rất tốt. Với tôi thì claude code tốn ít chi phí hơn opencode, có lẽ là nhờ môi trường thực thi được thiết kế tốt hơn
- Cái này trông như gắn native vào terminal. Tức là có vẻ không có app riêng để chạy hoặc bọc agent bên trong TUI
  Cuối cùng thì có vẻ là kiểu nhập câu tiếng Anh thông thường thay vì lệnh
Website này trông như do Codex làm. Tôi từng bảo Codex tạo một HTML tổng quan tính năng cho team, và nó cho ra một con quái vật trang trí quá tay nhưng gần như chẳng có thông tin có ý nghĩa nào, với các khối thống kê to đùng, cùng font, màu, layout, thậm chí cả hero section y hệt
Nó cũng tệ trên mobile như trang này. Cuối cùng tôi chuyển sang nhờ Claude làm một file HTML một trang, và khoảng 95% là dùng được ngay để trình bày rõ ý đồ, chỉ cần sửa chút ít
- Dạo này thiết kế dựa trên LLM trông rất hay như vậy. Tôi không hiểu sao mọi người lại không thấy các tổ hợp font serif nghiêng mạnh đó là xấu
  Trên mobile, ví dụ code cứ liên tục đẩy nội dung đi chỗ khác nên phần lớn trang rất khó đọc. Tất nhiên có thể tôi đang quá khắt khe và ý định thì tốt, nhưng một website đơn giản hơn có lẽ là đủ
- Chỉ câu “Claude đã làm một file HTML một trang và 95% là dùng được ngay” thì không nói lên được nhiều điều về bất kỳ model nào
  Suy cho cùng, như kỹ sư phần mềm nào cũng biết, bỏ bớt tính năng thì dự án nào cũng có thể đơn giản đi rất nhanh
Điều tôi muốn tác giả hiểu là có những người muốn một binary đơn lẻ tự chứa không ngốn nửa bộ nhớ máy tính, nên họ muốn viết bằng Rust hay Go
- Tôi thật sự mừng vì có nhiều phần mềm mới ra bằng Rust, Go và Zig
  Giá trị và sự tiện lợi phát triển mà các ngôn ngữ thông dịch chậm từng mang lại đang dần biến mất. Các ngôn ngữ mới đã có sẵn nhiều thứ tốt theo mặc định, hay chính xác hơn là những cuộc gọi cảnh báo lúc 1 giờ sáng bắt đầu khiến chúng ta nổi giận
- Dù có dùng AI và đủ kiểu tuyên bố đi nữa, tôi vẫn muốn nghe giải thích vì sao chẳng hạn lại không thể dùng coding agent bằng Go thuần
  Go đã có rất nhiều thư viện terminal tốt rồi
- Nếu bạn muốn thử một binary đơn lẻ tự chứa mà ngốn hơn nửa bộ nhớ máy tính thì còn có ds4-agent
- Đặc biệt trong thời đại coding agent, nếu muốn thứ như vậy thì chẳng phải cứ tự làm là được sao
- Làm bot lập trình mà lại tiết kiệm việc lập trình thì nghe cũng nói lên được điều gì đó
Tôi không thích trang đó. Hiệu ứng gõ chữ làm kích thước vùng ví dụ thay đổi liên tục, khiến nội dung bên dưới bị đẩy lên đẩy xuống
Trải nghiệm người dùng thật sự rất tệ
- Có agent hay không thì người ta vẫn phải test website ở nhiều độ phân giải hoặc ít nhất theo các bề rộng cửa sổ khác nhau
  Nhưng có vẻ đây đang dần trở thành một kỹ năng thất truyền
- Trông như rác AI thiết kế do Claude tạo ra
Với tư cách người đã làm môi trường thực thi suốt 1 năm, tôi thấy phía opencode không phải ngu mà làm hỏng cache tiền tố
Thường họ cố tình làm vậy vì khi thử nghiệm thì kết quả tổng thể tốt hơn
Nếu bạn nghĩ dsv4 khác đủ nhiều so với hành vi trung bình của các model khác, thì chỉ cần gửi PR tới môi trường thực thi mà bạn muốn, thêm xử lý ngoại lệ cụ thể kèm bằng chứng. Mù quáng giả định rằng “vì cache thì lúc nào cũng phải append-only” chỉ là lãng phí thời gian của mọi người
Đây không phải agent do DeepSeek tạo ra nên tiêu đề gây hiểu nhầm
Giờ thì thương hiệu DeepSeek đã đủ mạnh để đến giai đoạn mọi người muốn bám theo độ nhận diện thương hiệu đó
Khá thú vị. Tôi đang là thuê bao Claude 200 USD/tháng, và từ trước đến giờ gần như không cần dùng gì khác
Nhưng Claude càng ngày càng hạn chế workflow của tôi, nhất là sau những thay đổi gần đây với IDE/-p, tôi càng muốn chuyển đi nơi khác
Tôi thật sự cần suy luận tối tân nên cũng thấy lo, nhưng vẫn thấy DeepSeek đáng quan tâm
- Nếu bạn muốn suy luận tối tân thì nên thử vài model khác để tự xem chúng khác model hàng đầu đến mức nào
  Tôi đã làm vậy và nhận ra chỉ Qwen-2.5-Max thôi cũng đã đủ. Với các tác vụ đồ chơi tôi làm thì Claude Sonnet 3.5 chắc cũng đủ. Tôi đâu có nhắm tới huy chương Fields toán học
- Hôm nay tôi giao một tác vụ reverse engineering khá phức tạp cho DS-4 xhigh và GPT-5.5 xhigh
  Sau khoảng 6 tiếng thì cả hai đều thất bại trong việc reverse engineering hoàn chỉnh, nhưng khác biệt rất lớn
  DS cứ 30 phút lại dừng và nói rằng đã hoàn tất reverse engineering đầy đủ, giờ mọi thứ sẽ chạy, nhưng thực tế còn chưa xong nổi 1%. Tôi đã chỉ thị rất rõ là không được dùng vài lối tắt cụ thể mà nó vẫn cứ tìm cách đi đường tắt, hoàn toàn thất bại
  Trong khi đó GPT-5.5 thật sự gây ấn tượng. Nó làm đúng việc cần làm, hoàn thành các lớp ban đầu rồi chỉ chuyển sang bước tiếp theo khi thật sự chắc rằng đã hiểu đầy đủ điều cần thiết. Trong suốt 6 tiếng đó, tôi chỉ thêm prompt khi thấy nó đang đi đúng hướng và muốn nắn nhẹ sang cách tốt hơn một chút. Không hề có cảm giác phải vật lộn với nó
  Dĩ nhiên sau khi nén ngữ cảnh thì đôi lúc nó vẫn bật ra kiểu “tôi không thể giúp reverse engineering”, nhưng sang session mới thì lại xử lý gọn gàng
  Tôi đã hủy thuê bao Claude một tháng trước nên không so trực tiếp được, nhưng DeepSeek khiến tôi nhớ rất nhiều tới cảm giác làm việc với Opus 4.6/4.7. Với một số người đó có thể là tín hiệu tích cực, nhưng khi nhìn GPT-5.5 thì mới thấy kiểu làm việc của Claude/DS khó chịu đến mức nào
- Bạn nên cứ giữ gói 200 USD/tháng, đừng thử gói coding 10 USD với model open-weight và hạn mức cao hơn
  Anthropic cần tiền của bạn để sống sót, và bạn cũng sẽ ngủ ngon hơn khi nghĩ rằng mình đang dùng thứ tối tân nhất
- Thay vì bỏ hẳn model của Anthropic, bạn có thể dùng chúng cho vài việc như lập kế hoạch rồi giao phần triển khai cho DeepSeek hoặc tương tự
  Dù công cụ khác nhau thì bản kế hoạch Markdown vẫn hoạt động khá tốt. Nếu tôi hạ từ gói 5x Max xuống Pro thì tôi định làm như vậy
  Tôi cũng đang làm một launcher giúp dùng provider bên thứ ba dễ dàng trong Claude Code: https://ccode.kronis.dev
  Local proxy đã hoạt động rồi, hiện chỉ còn thiếu chuyển model động. Có vẻ không khó để thêm vào, và tùy tiến độ thì chắc 1–2 tuần nữa sẽ có
  Tôi không nghĩ rời Anthropic hoàn toàn là khôn ngoan. Model của họ rất tốt, và có thuê bao thì còn có các tính năng như Remote Control mà tôi thích. Tuy vậy, đổi tier để tiết kiệm chút tiền thì có vẻ khả thi. Mặt khác, vẫn cần một mức chuẩn chất lượng. Trước đây khi tôi dùng GLM 4.6 trên Cerebras thì kết quả hời hợt khá nhiều
- Nếu muốn suy luận tối tân thì bạn nên dùng GPT 5.5 Pro
Tôi thích việc họ tập trung vào hiệu quả cache hit. Xin chúc mừng team DeepSeek đã làm ra một sản phẩm tuyệt vời tối đa hóa hiệu quả chi phí cho người dùng
- Tôi đã dùng một thời gian và hoàn toàn đồng ý. Theo tôi nó tốt ngang Codex hay Claude mà tôi dùng cùng
  Ở các phân khúc nhạy cảm về chi phí thì đây là bên thắng cuộc, và nếu startup nào đó gói ghém tốt với việc tính đến lưu giữ dữ liệu thì nó có thể trở thành sản phẩm tuyệt vời để bán cho doanh nghiệp. Vì với coding assistant, vấn đề cốt lõi là lưu giữ dữ liệu và quyền riêng tư
- Để bạn biết, dự án này là side project của một ai đó
  “Dự án mã nguồn mở độc lập · Không liên quan tới DeepSeek”
- Cộng thêm chi phí API vốn đã rẻ thì chắc có thể chạy cùng một tác vụ trong nhiều ngày
- Tôi không hiểu hiệu quả cache hit này đạt được bằng cách nào. Chẳng phải chỉ là vấn đề không thay đổi ngữ cảnh trước đó sao?
  Tôi không hiểu ở đây có những tay nắm điều chỉnh nào
Tôi đã thử và ô nhập văn bản có nền đen với chữ tối màu
Tôi đã kiểm tra tài liệu và nhờ DeepSeek v4, Claude, Gemini hỗ trợ về font/style, nhưng chẳng cách nào hiệu quả ngoài việc chạy trong terminal theme tối. Thật điên rồ. Chẳng lẽ các dev của dự án này không ai dùng theme sáng sao?
- Tôi đồng ý đó là vấn đề, nhưng chắc là họ thật sự không dùng
  Theme sáng rất hiếm người dùng

DeepSeek Reasonix - tác nhân lập trình native cho DeepSeek với tỷ lệ cache cao và chi phí thấp

Bài viết liên quan

2 bình luận

Ý kiến trên Hacker News