Giám sát mức sử dụng Claude Code – trình theo dõi thời gian thực để né giới hạn sử dụng

(github.com/Maciek-roboblog)

12 điểm bởi GN⁺ 2025-06-21 | 2 bình luận | Chia sẻ qua WhatsApp

Công cụ giám sát hiển thị theo thời gian thực trên terminal nhiều thông tin như mức dùng token của Claude AI, tốc độ tiêu hao, dự đoán mức tiêu thụ
Thanh tiến trình đầy màu sắc được cập nhật mỗi 3 giây, cùng dự đoán tiêu hao token thông minh
Khi vượt giới hạn gói cơ bản, công cụ phân tích lịch sử phiên để ngay lập tức chuyển sang giới hạn thực tế
Tự động nhận diện và hỗ trợ các gói sử dụng như Pro/Max5/Max20/custom_max
Cảnh báo theo thời gian thực khi token của từng phiên sắp chạm/ngang hoặc vượt giới hạn, hoặc có nguy cơ cạn trước khi phiên được reset
Giao diện được tối ưu cho luồng sử dụng Claude thực tế
Hỗ trợ cài bằng npm, pip, khuyến nghị dùng môi trường ảo (venv/virtualenv), hỗ trợ đầy đủ Mac/Linux/Windows

Hiểu về phiên Claude

Mô hình cửa sổ trượt 5 giờ
- Phiên được duy trì trong 5 giờ kể từ thời điểm gửi tin nhắn đầu tiên
- Giới hạn được áp dụng theo từng phiên, và có thể có nhiều phiên hoạt động đồng thời
- Việc reset thực tế diễn ra sau mỗi 5 giờ tính theo mốc tin nhắn của tôi
Có thể chỉ định mốc thời gian reset phiên/token theo lịch làm việc của mình

Kịch bản sử dụng

Lập trình viên làm việc ban ngày/buổi sáng: điều chỉnh lịch reset token theo giờ bắt đầu công việc (ví dụ: 9 giờ) để lập kế hoạch hiệu quả hơn
Người làm việc ban đêm: dùng reset token theo lịch cá nhân như nửa đêm
Người dùng có giới hạn biến động: dùng chế độ custom_max để tự động nhận diện giới hạn phù hợp với môi trường thực tế
Lập trình viên toàn cầu/từ xa: di chuyển qua nhiều múi giờ, đặt thời gian reset theo nhóm → tối ưu cộng tác
Kiểm tra trạng thái nhanh: chỉ cần chạy đơn giản (không cần quan tâm cấu hình)

Best practice khi thiết lập môi trường

Bắt đầu giám sát ngay khi bắt đầu phiên
- Chạy monitor ngay khi bắt đầu công việc với Claude (./ccusage_monitor.py)
- Các gói hỗ trợ
  - pro: khoảng 7.000 token (dùng thử và nhu cầu nhẹ)
  - max5: khoảng 35.000 token (phát triển hằng ngày)
  - max20: khoảng 140.000 token (dự án lớn và mức sử dụng trung bình/cao)
  - custom_max: chế độ tự động nhận diện (dùng giá trị tối đa dựa trên lịch sử sử dụng thực tế)
- Cải thiện độ chính xác khi theo dõi token của toàn bộ phiên
- Có thể tính tốc độ tiêu hao token và cảnh báo sớm khi sắp chạm giới hạn
Dùng môi trường ảo Python (venv)
- Tránh xung đột phụ thuộc, tách biệt môi trường, đảm bảo khả năng tái lập theo từng dự án
- Cài đặt và chạy:
```
python3 -m venv venv  
source venv/bin/activate  
pip install pytz  
```
  Quảng cáo
- Khi xóa chỉ cần xóa thư mục môi trường ảo để gỡ sạch sẽ
Tạo shell alias tùy chỉnh
- Rút gọn các lệnh lặp lại thành một dòng
```
alias claude-monitor='cd ~/Claude-Code-Usage-Monitor && source venv/bin/activate && ./ccusage_monitor.py'  
```
- Thêm vào .bashrc hoặc .zshrc để chỉ cần nhập một lần là chạy monitor ngay

Best practice khi sử dụng

Theo dõi Burn Rate (tốc độ tiêu hao) liên tục
- Cẩn thận khi mức dùng token đột ngột tăng vọt
- Điều chỉnh cường độ công việc theo thời gian và lượng token còn lại
- Sắp xếp các việc lớn như refactor quy mô lớn trước hoặc sau thời điểm reset phiên (khởi tạo lại token)
Lập lịch phiên một cách chiến lược
- Bắt đầu việc lớn ngay sau khi token reset, và khi sắp chạm giới hạn thì chuyển sang việc nhẹ
```
./ccusage_monitor.py --reset-hour 9  
```
- Có thể vận hành chồng nhiều phiên nhờ quy tắc 5 giờ cho từng phiên
Chỉ định rõ múi giờ
- Phản ánh đúng múi giờ làm việc/cộng tác thực tế để dự đoán chính xác thời điểm reset token và quản lý lịch trình
```
./ccusage_monitor.py --timezone Asia/Seoul  
```
  Quảng cáo
- Tránh sai lệch thời gian và giảm nhầm lẫn về thời điểm hết hạn phiên khi cộng tác đa quốc gia/đa nhóm

Mẹo tối ưu

Thiết lập môi trường terminal
- Khuyến nghị terminal rộng ít nhất 80 ký tự
- Hỗ trợ màu sắc giúp tối đa hóa phản hồi trực quan
- Nên theo dõi liên tục trong một cửa sổ riêng
Tích hợp vào workflow
- Có thể dùng terminal multiplexer như tmux để vừa phát triển vừa giám sát
```
tmux new-session -d -s claude-monitor './ccusage_monitor.py'  
tmux attach -t claude-monitor  
```
Chiến lược nhiều phiên
- Mỗi phiên cố định 5 giờ, có thể quản lý đồng thời các phiên chồng lấp
- Các tác vụ dài có thể phân tán qua nhiều phiên, nhưng cần chú ý giới hạn/thời điểm hết hạn của từng phiên

Ví dụ workflow thực tế

Phát triển dự án lớn
```
./ccusage_monitor.py --plan max20 --reset-hour 8 --timezone America/New_York  
```
- Reset token lúc 8 giờ sáng → bắt đầu phát triển tính năng chính
- 10 giờ kiểm tra Burn Rate rồi điều chỉnh tốc độ làm việc
- 12 giờ rà soát và điều phối lịch buổi chiều
- 14 giờ mở phiên mới, xử lý các issue phức tạp
- 16 giờ làm việc nhẹ/chuẩn bị cho phiên buổi tối
Sử dụng thiên về học tập/thử nghiệm
```
./ccusage_monitor.py --plan pro  
```
- Phù hợp cho học nhẹ và viết mã thử nghiệm
Phát triển tập trung theo sprint
```
./ccusage_monitor.py --plan max20 --reset-hour 6  
```
- Cấu hình phù hợp cho các đợt phát triển dự kiến tiêu hao lượng lớn token

2 bình luận

fanotify 2025-06-21

Cũng như vậy thôi: https://vi.news.hada.io/topic?id=21560

GN⁺ 2025-06-21

Ý kiến Hacker News

Tôi thấy bức bối vì Claude thiếu minh bạch, và rất thích ý tưởng này Tính năng cốt lõi của Claude Code là quản lý ngữ cảnh và giới hạn tốt hơn so với ứng dụng desktop (ví dụ: chế độ compact, hiển thị % dung lượng còn lại), nhưng vẫn có cảm giác là chưa đủ Thêm một góp ý nữa là, cá nhân tôi thấy việc dùng quá nhiều emoji trong README của dự án tạo cảm giác rất thiếu chuyên nghiệp, như thể đây là một dự án được code bởi AI chỉ theo “vibe” mà không được kiểm soát tử tế
- Hồi tôi mới vào ngành phần mềm, nếu bị bắt gặp dùng emoji trong codebase thì không khác gì bị tống vào viện tâm thần Giờ thời thế thay đổi hẳn rồi, tôi lại dùng emoji khá thường xuyên để sắp xếp ngữ cảnh theo trực quan Bây giờ code của tôi có đủ nhiều emoji để khiến chính tôi thấy vui
- Dạo này ở các startup hoặc công ty trẻ thấy kiểu emoji này rất nhiều Chắc ảnh hưởng từ Notion là lớn Ở công ty tôi, cứ tạo list, page hay lời mời lịch nào cũng luôn chọn emoji kèm theo
- Tôi thấy khá mỉa mai khi một bình luận như thế này lại xuất hiện dưới một phần mềm được tạo ra cho việc code bằng AI
- Nếu nhìn vào code thực tế thì đúng là chỉ có một file Python 400 dòng bọc quanh ccusage Nên cảm giác như vậy cũng là điều dễ hiểu
- Với phần mô tả PR hay README do AI tạo ra, tôi luôn thêm vào prompt điều kiện “ngắn gọn, không dùng câu chữ màu mè hay emoji” Làm vậy thì bữa tiệc emoji gây rối sẽ biến thành tài liệu đàng hoàng Tất nhiên còn tùy từng tình huống
Tôi là tác giả của ccusage, và rất vui khi thấy mọi người dùng mã nguồn mở của chúng tôi theo nhiều cách khác nhau Để lại lời nhắn tích cực: Happy vibe coding!
- Điều thú vị là Show HN của ccusage lại không có lấy một bình luận nào, còn thread này thì cực kỳ sôi động Liên kết thread liên quan
Để tham khảo, giới hạn token tối đa trong một phiên trước đây của tôi là khoảng 337.492, và tôi dùng gói Max20 cùng Opus khoảng 99% thời gian Tôi đã dùng Claude Code từ ngày 27 tháng 5, tổng cộng 1.374.439.311 token, tương đương khoảng 3.397 USD
- Tôi dùng gói Max20 hết khoảng 2.100 USD giá trị Tôi tự hỏi không biết API đang lời biên cực lớn hay họ đang lỗ Tôi dùng hằng ngày nhưng không nghĩ là mình dùng quá mức
- Tôi tò mò không biết có hay bị dính giới hạn tốc độ trên Opus không, và có cảm thấy nó chậm hơn Sonnet không
Tôi có thể cảm nhận khá trực giác là lượng token mình đã dùng đang gần chạm giới hạn đến đâu Tôi cũng nhận ra thời điểm cuộc trò chuyện sắp chạm trần, và khi đó sẽ dùng phần tài nguyên còn lại cuối cùng để tạo bản tóm tắt rồi chuyển sang một cuộc trò chuyện mới để tiếp tục làm việc Cảm giác như những công cụ AI này giờ đã trở thành một phần đồng hồ sinh học của tôi Mỗi thứ Tư giới hạn hằng tuần của ChatGPT lại được reset, nên thứ Tư với tôi giống như một ngày Chủ nhật mới
Tôi quan sát thấy nếu mức dùng token không chạm 100% trước khi cửa sổ thời gian trôi qua thì nó sẽ không được reset Ví dụ, dùng đến 90% rồi bước sang cửa sổ kế tiếp, nếu nhanh chóng dùng nốt 10% còn lại thì sẽ phải chờ rất lâu
Tôi đã làm một công cụ UI (crystal) để có thể dùng nhiều phiên Claude Code cùng lúc Vì thường làm nhiều tính năng song song nên tôi hay chạm giới hạn tài khoản Thường thì tôi đụng giới hạn gần thời điểm reset, nhưng sẽ tốt hơn nếu biết trước lúc nào nên nghỉ
- Tôi dùng Claude Code cực nhiều, nhưng lại ngại tự viết tooling cho worktree và nhiều phiên làm việc vì hiểu biết về git của mình chưa đủ chắc Thành thật mà nói tôi cũng hơi sợ khi dùng công cụ này; lý tưởng nhất là muốn chạy từng worktree trong container, nhưng có cảm giác sẽ rất khó để làm nó mượt như Crystal
- Tôi thích công cụ này, nhưng Crystal đã là tên của một ngôn ngữ lập trình tôi từng dùng từ lâu rồi nên hơi dễ nhầm
- Nếu bạn tạo issue trên GitHub (ở đây), tôi cũng có thể thử tích hợp với usage monitor của mình
- Quá hay Tôi suýt nữa đã bảo Laude làm cho tôi một công cụ như thế này không chỉ theo từng dự án mà còn cho 5 dự án chạy đồng thời Rất đồng cảm với nhiều cơ hội ứng dụng
Rất thú vị, nhưng tôi thắc mắc liệu giới hạn token của gói Pro thật sự chỉ là 7.000 hay không Tức là còn chưa đến 7.000 từ, nhưng trên thực tế lại có cảm giác dùng được nhiều hơn hẳn Nếu đúng vậy thì chỉ cần hội thoại hơi dài một chút là chắc sẽ chạm trần rất nhanh, nhưng tôi thì chưa từng gặp lần nào Không biết đó có phải là giới hạn chỉ áp dụng cho Claude Code không, vì tôi vẫn chưa dùng Claude Code nhiều nên cũng không rõ
- Gói Pro là 20 USD mỗi tháng. Gần đây mới có quyền truy cập claude code Nhưng tôi nghe nói chỉ với vài truy vấn là một số người dùng đã chạm giới hạn Nên tôi nghĩ các con số đó có lẽ là đúng Giới hạn của giao diện chat và giới hạn của Claude Code là tách biệt
Quá xuất sắc, cảm ơn vì đã làm ra nó Không biết có thể cài bằng uv không Kèm theo liên kết uv, người này cũng chia sẻ ví dụ lệnh shell bằng cách liệt kê từng bước cài đặt
- Nếu repo đó được tổ chức theo cấu trúc package như project.toml chẳng hạn, thì có thể cài nhanh hơn bằng pipx (pipx) như sau

pipx install git+https://github.com/Maciek-roboblog/Claude-Code-Usage-Monitor ccusage_monitor uv chắc cũng có lệnh tương tự (uvx), nhưng tôi không rõ nó có cùng chức năng/mục đích như pipx hay không

Nhân tiện, gần như mọi thứ cài được bằng pip cũng cài được bằng uv, nên dùng uv cũng có thể đơn giản hơn
Tôi thắc mắc liệu công cụ này ngoài việc gọi shell để chạy ccusage thì còn điểm hữu ích nào khác không Thành thật mà nói tôi hơi thất vọng với kiểu dự án này, cảm giác như làm một phát bằng công cụ AI là xong Ở Show HN thậm chí còn không nhắc rằng toàn bộ phần việc thực tế được xử lý bởi công cụ khác, điều đó khá đáng tiếc
Hôm qua tôi có một trải nghiệm lạ với Claude Code Tôi đã thử chuyển một trang bảng phtml viết bằng PHP cũ sang bố cục div mới nhưng thất bại và tốn khoảng 4 USD Có thể là do vấn đề WSL, nhưng tôi mong chuyện như vậy đừng xảy ra thường xuyên
- Claude Code có đường cong học khá dốc Cần thực hiện các phiên trò chuyện dài, thảo luận kỹ yêu cầu và dẫn dắt mô hình bằng các câu hỏi rõ ràng Dù vậy thỉnh thoảng những thất bại như thế vẫn có thể xảy ra, nên phải luôn nhớ đây là một công cụ rất đắt đỏ Nó không phải phép màu như các YouTuber hay blogger vẫn nói

Giám sát mức sử dụng Claude Code – trình theo dõi thời gian thực để né giới hạn sử dụng

Hiểu về phiên Claude

Kịch bản sử dụng

Best practice khi thiết lập môi trường

Best practice khi sử dụng

Mẹo tối ưu

Ví dụ workflow thực tế

Bài viết liên quan

2 bình luận

Ý kiến Hacker News