- Công cụ giám sát hiển thị theo thời gian thực trên terminal nhiều thông tin như mức dùng token của Claude AI, tốc độ tiêu hao, dự đoán mức tiêu thụ
- Thanh tiến trình đầy màu sắc được cập nhật mỗi 3 giây, cùng dự đoán tiêu hao token thông minh
- Khi vượt giới hạn gói cơ bản, công cụ phân tích lịch sử phiên để ngay lập tức chuyển sang giới hạn thực tế
- Tự động nhận diện và hỗ trợ các gói sử dụng như Pro/Max5/Max20/custom_max
- Cảnh báo theo thời gian thực khi token của từng phiên sắp chạm/ngang hoặc vượt giới hạn, hoặc có nguy cơ cạn trước khi phiên được reset
- Giao diện được tối ưu cho luồng sử dụng Claude thực tế
- Hỗ trợ cài bằng npm, pip, khuyến nghị dùng môi trường ảo (venv/virtualenv), hỗ trợ đầy đủ Mac/Linux/Windows
Hiểu về phiên Claude
- Mô hình cửa sổ trượt 5 giờ
- Phiên được duy trì trong 5 giờ kể từ thời điểm gửi tin nhắn đầu tiên
- Giới hạn được áp dụng theo từng phiên, và có thể có nhiều phiên hoạt động đồng thời
- Việc reset thực tế diễn ra sau mỗi 5 giờ tính theo mốc tin nhắn của tôi
- Có thể chỉ định mốc thời gian reset phiên/token theo lịch làm việc của mình
Kịch bản sử dụng
- Lập trình viên làm việc ban ngày/buổi sáng: điều chỉnh lịch reset token theo giờ bắt đầu công việc (ví dụ: 9 giờ) để lập kế hoạch hiệu quả hơn
- Người làm việc ban đêm: dùng reset token theo lịch cá nhân như nửa đêm
- Người dùng có giới hạn biến động: dùng chế độ custom_max để tự động nhận diện giới hạn phù hợp với môi trường thực tế
- Lập trình viên toàn cầu/từ xa: di chuyển qua nhiều múi giờ, đặt thời gian reset theo nhóm → tối ưu cộng tác
- Kiểm tra trạng thái nhanh: chỉ cần chạy đơn giản (không cần quan tâm cấu hình)
Best practice khi thiết lập môi trường
- Bắt đầu giám sát ngay khi bắt đầu phiên
- Chạy monitor ngay khi bắt đầu công việc với Claude (
./ccusage_monitor.py)
- Các gói hỗ trợ
- pro: khoảng 7.000 token (dùng thử và nhu cầu nhẹ)
- max5: khoảng 35.000 token (phát triển hằng ngày)
- max20: khoảng 140.000 token (dự án lớn và mức sử dụng trung bình/cao)
- custom_max: chế độ tự động nhận diện (dùng giá trị tối đa dựa trên lịch sử sử dụng thực tế)
- Cải thiện độ chính xác khi theo dõi token của toàn bộ phiên
- Có thể tính tốc độ tiêu hao token và cảnh báo sớm khi sắp chạm giới hạn
- Dùng môi trường ảo Python (venv)
- Tạo shell alias tùy chỉnh
Best practice khi sử dụng
- Theo dõi Burn Rate (tốc độ tiêu hao) liên tục
- Cẩn thận khi mức dùng token đột ngột tăng vọt
- Điều chỉnh cường độ công việc theo thời gian và lượng token còn lại
- Sắp xếp các việc lớn như refactor quy mô lớn trước hoặc sau thời điểm reset phiên (khởi tạo lại token)
- Lập lịch phiên một cách chiến lược
- Chỉ định rõ múi giờ
Mẹo tối ưu
- Thiết lập môi trường terminal
- Khuyến nghị terminal rộng ít nhất 80 ký tự
- Hỗ trợ màu sắc giúp tối đa hóa phản hồi trực quan
- Nên theo dõi liên tục trong một cửa sổ riêng
- Tích hợp vào workflow
- Chiến lược nhiều phiên
- Mỗi phiên cố định 5 giờ, có thể quản lý đồng thời các phiên chồng lấp
- Các tác vụ dài có thể phân tán qua nhiều phiên, nhưng cần chú ý giới hạn/thời điểm hết hạn của từng phiên
Ví dụ workflow thực tế
- Phát triển dự án lớn
./ccusage_monitor.py --plan max20 --reset-hour 8 --timezone America/New_York
- Reset token lúc 8 giờ sáng → bắt đầu phát triển tính năng chính
- 10 giờ kiểm tra Burn Rate rồi điều chỉnh tốc độ làm việc
- 12 giờ rà soát và điều phối lịch buổi chiều
- 14 giờ mở phiên mới, xử lý các issue phức tạp
- 16 giờ làm việc nhẹ/chuẩn bị cho phiên buổi tối
- Sử dụng thiên về học tập/thử nghiệm
./ccusage_monitor.py --plan pro
- Phù hợp cho học nhẹ và viết mã thử nghiệm
- Phát triển tập trung theo sprint
./ccusage_monitor.py --plan max20 --reset-hour 6
- Cấu hình phù hợp cho các đợt phát triển dự kiến tiêu hao lượng lớn token
2 bình luận
Cũng như vậy thôi: https://vi.news.hada.io/topic?id=21560
Ý kiến Hacker News
Tôi thấy bức bối vì Claude thiếu minh bạch, và rất thích ý tưởng này Tính năng cốt lõi của Claude Code là quản lý ngữ cảnh và giới hạn tốt hơn so với ứng dụng desktop (ví dụ: chế độ compact, hiển thị % dung lượng còn lại), nhưng vẫn có cảm giác là chưa đủ Thêm một góp ý nữa là, cá nhân tôi thấy việc dùng quá nhiều emoji trong README của dự án tạo cảm giác rất thiếu chuyên nghiệp, như thể đây là một dự án được code bởi AI chỉ theo “vibe” mà không được kiểm soát tử tế
Hồi tôi mới vào ngành phần mềm, nếu bị bắt gặp dùng emoji trong codebase thì không khác gì bị tống vào viện tâm thần Giờ thời thế thay đổi hẳn rồi, tôi lại dùng emoji khá thường xuyên để sắp xếp ngữ cảnh theo trực quan Bây giờ code của tôi có đủ nhiều emoji để khiến chính tôi thấy vui
Dạo này ở các startup hoặc công ty trẻ thấy kiểu emoji này rất nhiều Chắc ảnh hưởng từ Notion là lớn Ở công ty tôi, cứ tạo list, page hay lời mời lịch nào cũng luôn chọn emoji kèm theo
Tôi thấy khá mỉa mai khi một bình luận như thế này lại xuất hiện dưới một phần mềm được tạo ra cho việc code bằng AI
Nếu nhìn vào code thực tế thì đúng là chỉ có một file Python 400 dòng bọc quanh ccusage Nên cảm giác như vậy cũng là điều dễ hiểu
Với phần mô tả PR hay README do AI tạo ra, tôi luôn thêm vào prompt điều kiện “ngắn gọn, không dùng câu chữ màu mè hay emoji” Làm vậy thì bữa tiệc emoji gây rối sẽ biến thành tài liệu đàng hoàng Tất nhiên còn tùy từng tình huống
Tôi là tác giả của ccusage, và rất vui khi thấy mọi người dùng mã nguồn mở của chúng tôi theo nhiều cách khác nhau Để lại lời nhắn tích cực: Happy vibe coding!
Để tham khảo, giới hạn token tối đa trong một phiên trước đây của tôi là khoảng 337.492, và tôi dùng gói Max20 cùng Opus khoảng 99% thời gian Tôi đã dùng Claude Code từ ngày 27 tháng 5, tổng cộng 1.374.439.311 token, tương đương khoảng 3.397 USD
Tôi dùng gói Max20 hết khoảng 2.100 USD giá trị Tôi tự hỏi không biết API đang lời biên cực lớn hay họ đang lỗ Tôi dùng hằng ngày nhưng không nghĩ là mình dùng quá mức
Tôi tò mò không biết có hay bị dính giới hạn tốc độ trên Opus không, và có cảm thấy nó chậm hơn Sonnet không
Tôi có thể cảm nhận khá trực giác là lượng token mình đã dùng đang gần chạm giới hạn đến đâu Tôi cũng nhận ra thời điểm cuộc trò chuyện sắp chạm trần, và khi đó sẽ dùng phần tài nguyên còn lại cuối cùng để tạo bản tóm tắt rồi chuyển sang một cuộc trò chuyện mới để tiếp tục làm việc Cảm giác như những công cụ AI này giờ đã trở thành một phần đồng hồ sinh học của tôi Mỗi thứ Tư giới hạn hằng tuần của ChatGPT lại được reset, nên thứ Tư với tôi giống như một ngày Chủ nhật mới
Tôi quan sát thấy nếu mức dùng token không chạm 100% trước khi cửa sổ thời gian trôi qua thì nó sẽ không được reset Ví dụ, dùng đến 90% rồi bước sang cửa sổ kế tiếp, nếu nhanh chóng dùng nốt 10% còn lại thì sẽ phải chờ rất lâu
Tôi đã làm một công cụ UI (crystal) để có thể dùng nhiều phiên Claude Code cùng lúc Vì thường làm nhiều tính năng song song nên tôi hay chạm giới hạn tài khoản Thường thì tôi đụng giới hạn gần thời điểm reset, nhưng sẽ tốt hơn nếu biết trước lúc nào nên nghỉ
Tôi dùng Claude Code cực nhiều, nhưng lại ngại tự viết tooling cho worktree và nhiều phiên làm việc vì hiểu biết về git của mình chưa đủ chắc Thành thật mà nói tôi cũng hơi sợ khi dùng công cụ này; lý tưởng nhất là muốn chạy từng worktree trong container, nhưng có cảm giác sẽ rất khó để làm nó mượt như Crystal
Tôi thích công cụ này, nhưng Crystal đã là tên của một ngôn ngữ lập trình tôi từng dùng từ lâu rồi nên hơi dễ nhầm
Nếu bạn tạo issue trên GitHub (ở đây), tôi cũng có thể thử tích hợp với usage monitor của mình
Quá hay Tôi suýt nữa đã bảo Laude làm cho tôi một công cụ như thế này không chỉ theo từng dự án mà còn cho 5 dự án chạy đồng thời Rất đồng cảm với nhiều cơ hội ứng dụng
Rất thú vị, nhưng tôi thắc mắc liệu giới hạn token của gói Pro thật sự chỉ là 7.000 hay không Tức là còn chưa đến 7.000 từ, nhưng trên thực tế lại có cảm giác dùng được nhiều hơn hẳn Nếu đúng vậy thì chỉ cần hội thoại hơi dài một chút là chắc sẽ chạm trần rất nhanh, nhưng tôi thì chưa từng gặp lần nào Không biết đó có phải là giới hạn chỉ áp dụng cho Claude Code không, vì tôi vẫn chưa dùng Claude Code nhiều nên cũng không rõ
Quá xuất sắc, cảm ơn vì đã làm ra nó Không biết có thể cài bằng uv không Kèm theo liên kết uv, người này cũng chia sẻ ví dụ lệnh shell bằng cách liệt kê từng bước cài đặt
Nhân tiện, gần như mọi thứ cài được bằng pip cũng cài được bằng uv, nên dùng uv cũng có thể đơn giản hơn
Tôi thắc mắc liệu công cụ này ngoài việc gọi shell để chạy ccusage thì còn điểm hữu ích nào khác không Thành thật mà nói tôi hơi thất vọng với kiểu dự án này, cảm giác như làm một phát bằng công cụ AI là xong Ở Show HN thậm chí còn không nhắc rằng toàn bộ phần việc thực tế được xử lý bởi công cụ khác, điều đó khá đáng tiếc
Hôm qua tôi có một trải nghiệm lạ với Claude Code Tôi đã thử chuyển một trang bảng phtml viết bằng PHP cũ sang bố cục div mới nhưng thất bại và tốn khoảng 4 USD Có thể là do vấn đề WSL, nhưng tôi mong chuyện như vậy đừng xảy ra thường xuyên