12 điểm bởi GN⁺ 2025-06-21 | 2 bình luận | Chia sẻ qua WhatsApp
  • Công cụ giám sát hiển thị theo thời gian thực trên terminal nhiều thông tin như mức dùng token của Claude AI, tốc độ tiêu hao, dự đoán mức tiêu thụ
  • Thanh tiến trình đầy màu sắc được cập nhật mỗi 3 giây, cùng dự đoán tiêu hao token thông minh
  • Khi vượt giới hạn gói cơ bản, công cụ phân tích lịch sử phiên để ngay lập tức chuyển sang giới hạn thực tế
  • Tự động nhận diện và hỗ trợ các gói sử dụng như Pro/Max5/Max20/custom_max
  • Cảnh báo theo thời gian thực khi token của từng phiên sắp chạm/ngang hoặc vượt giới hạn, hoặc có nguy cơ cạn trước khi phiên được reset
  • Giao diện được tối ưu cho luồng sử dụng Claude thực tế
  • Hỗ trợ cài bằng npm, pip, khuyến nghị dùng môi trường ảo (venv/virtualenv), hỗ trợ đầy đủ Mac/Linux/Windows

Hiểu về phiên Claude

  • Mô hình cửa sổ trượt 5 giờ
    • Phiên được duy trì trong 5 giờ kể từ thời điểm gửi tin nhắn đầu tiên
    • Giới hạn được áp dụng theo từng phiên, và có thể có nhiều phiên hoạt động đồng thời
    • Việc reset thực tế diễn ra sau mỗi 5 giờ tính theo mốc tin nhắn của tôi
  • Có thể chỉ định mốc thời gian reset phiên/token theo lịch làm việc của mình

Kịch bản sử dụng

  • Lập trình viên làm việc ban ngày/buổi sáng: điều chỉnh lịch reset token theo giờ bắt đầu công việc (ví dụ: 9 giờ) để lập kế hoạch hiệu quả hơn
  • Người làm việc ban đêm: dùng reset token theo lịch cá nhân như nửa đêm
  • Người dùng có giới hạn biến động: dùng chế độ custom_max để tự động nhận diện giới hạn phù hợp với môi trường thực tế
  • Lập trình viên toàn cầu/từ xa: di chuyển qua nhiều múi giờ, đặt thời gian reset theo nhóm → tối ưu cộng tác
  • Kiểm tra trạng thái nhanh: chỉ cần chạy đơn giản (không cần quan tâm cấu hình)

Best practice khi thiết lập môi trường

  • Bắt đầu giám sát ngay khi bắt đầu phiên
    • Chạy monitor ngay khi bắt đầu công việc với Claude (./ccusage_monitor.py)
    • Các gói hỗ trợ
      • pro: khoảng 7.000 token (dùng thử và nhu cầu nhẹ)
      • max5: khoảng 35.000 token (phát triển hằng ngày)
      • max20: khoảng 140.000 token (dự án lớn và mức sử dụng trung bình/cao)
      • custom_max: chế độ tự động nhận diện (dùng giá trị tối đa dựa trên lịch sử sử dụng thực tế)
    • Cải thiện độ chính xác khi theo dõi token của toàn bộ phiên
    • Có thể tính tốc độ tiêu hao token và cảnh báo sớm khi sắp chạm giới hạn
  • Dùng môi trường ảo Python (venv)
    • Tránh xung đột phụ thuộc, tách biệt môi trường, đảm bảo khả năng tái lập theo từng dự án
    • Cài đặt và chạy:
      python3 -m venv venv  
      source venv/bin/activate  
      pip install pytz  
      
    • Khi xóa chỉ cần xóa thư mục môi trường ảo để gỡ sạch sẽ
  • Tạo shell alias tùy chỉnh
    • Rút gọn các lệnh lặp lại thành một dòng
      alias claude-monitor='cd ~/Claude-Code-Usage-Monitor && source venv/bin/activate && ./ccusage_monitor.py'  
      
    • Thêm vào .bashrc hoặc .zshrc để chỉ cần nhập một lần là chạy monitor ngay

Best practice khi sử dụng

  • Theo dõi Burn Rate (tốc độ tiêu hao) liên tục
    • Cẩn thận khi mức dùng token đột ngột tăng vọt
    • Điều chỉnh cường độ công việc theo thời gian và lượng token còn lại
    • Sắp xếp các việc lớn như refactor quy mô lớn trước hoặc sau thời điểm reset phiên (khởi tạo lại token)
  • Lập lịch phiên một cách chiến lược
    • Bắt đầu việc lớn ngay sau khi token reset, và khi sắp chạm giới hạn thì chuyển sang việc nhẹ
      ./ccusage_monitor.py --reset-hour 9  
      
    • Có thể vận hành chồng nhiều phiên nhờ quy tắc 5 giờ cho từng phiên
  • Chỉ định rõ múi giờ
    • Phản ánh đúng múi giờ làm việc/cộng tác thực tế để dự đoán chính xác thời điểm reset token và quản lý lịch trình
      ./ccusage_monitor.py --timezone Asia/Seoul  
      
    • Tránh sai lệch thời gian và giảm nhầm lẫn về thời điểm hết hạn phiên khi cộng tác đa quốc gia/đa nhóm

Mẹo tối ưu

  • Thiết lập môi trường terminal
    • Khuyến nghị terminal rộng ít nhất 80 ký tự
    • Hỗ trợ màu sắc giúp tối đa hóa phản hồi trực quan
    • Nên theo dõi liên tục trong một cửa sổ riêng
  • Tích hợp vào workflow
    • Có thể dùng terminal multiplexer như tmux để vừa phát triển vừa giám sát
      tmux new-session -d -s claude-monitor './ccusage_monitor.py'  
      tmux attach -t claude-monitor  
      
  • Chiến lược nhiều phiên
    • Mỗi phiên cố định 5 giờ, có thể quản lý đồng thời các phiên chồng lấp
    • Các tác vụ dài có thể phân tán qua nhiều phiên, nhưng cần chú ý giới hạn/thời điểm hết hạn của từng phiên

Ví dụ workflow thực tế

  • Phát triển dự án lớn
    ./ccusage_monitor.py --plan max20 --reset-hour 8 --timezone America/New_York  
    
    • Reset token lúc 8 giờ sáng → bắt đầu phát triển tính năng chính
    • 10 giờ kiểm tra Burn Rate rồi điều chỉnh tốc độ làm việc
    • 12 giờ rà soát và điều phối lịch buổi chiều
    • 14 giờ mở phiên mới, xử lý các issue phức tạp
    • 16 giờ làm việc nhẹ/chuẩn bị cho phiên buổi tối
  • Sử dụng thiên về học tập/thử nghiệm
    ./ccusage_monitor.py --plan pro  
    
    • Phù hợp cho học nhẹ và viết mã thử nghiệm
  • Phát triển tập trung theo sprint
    ./ccusage_monitor.py --plan max20 --reset-hour 6  
    
    • Cấu hình phù hợp cho các đợt phát triển dự kiến tiêu hao lượng lớn token

2 bình luận

 
fanotify 2025-06-21

Cũng như vậy thôi: https://vi.news.hada.io/topic?id=21560

 
GN⁺ 2025-06-21
Ý kiến Hacker News
  • Tôi thấy bức bối vì Claude thiếu minh bạch, và rất thích ý tưởng này Tính năng cốt lõi của Claude Code là quản lý ngữ cảnh và giới hạn tốt hơn so với ứng dụng desktop (ví dụ: chế độ compact, hiển thị % dung lượng còn lại), nhưng vẫn có cảm giác là chưa đủ Thêm một góp ý nữa là, cá nhân tôi thấy việc dùng quá nhiều emoji trong README của dự án tạo cảm giác rất thiếu chuyên nghiệp, như thể đây là một dự án được code bởi AI chỉ theo “vibe” mà không được kiểm soát tử tế

    • Hồi tôi mới vào ngành phần mềm, nếu bị bắt gặp dùng emoji trong codebase thì không khác gì bị tống vào viện tâm thần Giờ thời thế thay đổi hẳn rồi, tôi lại dùng emoji khá thường xuyên để sắp xếp ngữ cảnh theo trực quan Bây giờ code của tôi có đủ nhiều emoji để khiến chính tôi thấy vui

    • Dạo này ở các startup hoặc công ty trẻ thấy kiểu emoji này rất nhiều Chắc ảnh hưởng từ Notion là lớn Ở công ty tôi, cứ tạo list, page hay lời mời lịch nào cũng luôn chọn emoji kèm theo

    • Tôi thấy khá mỉa mai khi một bình luận như thế này lại xuất hiện dưới một phần mềm được tạo ra cho việc code bằng AI

    • Nếu nhìn vào code thực tế thì đúng là chỉ có một file Python 400 dòng bọc quanh ccusage Nên cảm giác như vậy cũng là điều dễ hiểu

    • Với phần mô tả PR hay README do AI tạo ra, tôi luôn thêm vào prompt điều kiện “ngắn gọn, không dùng câu chữ màu mè hay emoji” Làm vậy thì bữa tiệc emoji gây rối sẽ biến thành tài liệu đàng hoàng Tất nhiên còn tùy từng tình huống

  • Tôi là tác giả của ccusage, và rất vui khi thấy mọi người dùng mã nguồn mở của chúng tôi theo nhiều cách khác nhau Để lại lời nhắn tích cực: Happy vibe coding!

    • Điều thú vị là Show HN của ccusage lại không có lấy một bình luận nào, còn thread này thì cực kỳ sôi động Liên kết thread liên quan
  • Để tham khảo, giới hạn token tối đa trong một phiên trước đây của tôi là khoảng 337.492, và tôi dùng gói Max20 cùng Opus khoảng 99% thời gian Tôi đã dùng Claude Code từ ngày 27 tháng 5, tổng cộng 1.374.439.311 token, tương đương khoảng 3.397 USD

    • Tôi dùng gói Max20 hết khoảng 2.100 USD giá trị Tôi tự hỏi không biết API đang lời biên cực lớn hay họ đang lỗ Tôi dùng hằng ngày nhưng không nghĩ là mình dùng quá mức

    • Tôi tò mò không biết có hay bị dính giới hạn tốc độ trên Opus không, và có cảm thấy nó chậm hơn Sonnet không

  • Tôi có thể cảm nhận khá trực giác là lượng token mình đã dùng đang gần chạm giới hạn đến đâu Tôi cũng nhận ra thời điểm cuộc trò chuyện sắp chạm trần, và khi đó sẽ dùng phần tài nguyên còn lại cuối cùng để tạo bản tóm tắt rồi chuyển sang một cuộc trò chuyện mới để tiếp tục làm việc Cảm giác như những công cụ AI này giờ đã trở thành một phần đồng hồ sinh học của tôi Mỗi thứ Tư giới hạn hằng tuần của ChatGPT lại được reset, nên thứ Tư với tôi giống như một ngày Chủ nhật mới

  • Tôi quan sát thấy nếu mức dùng token không chạm 100% trước khi cửa sổ thời gian trôi qua thì nó sẽ không được reset Ví dụ, dùng đến 90% rồi bước sang cửa sổ kế tiếp, nếu nhanh chóng dùng nốt 10% còn lại thì sẽ phải chờ rất lâu

  • Tôi đã làm một công cụ UI (crystal) để có thể dùng nhiều phiên Claude Code cùng lúc Vì thường làm nhiều tính năng song song nên tôi hay chạm giới hạn tài khoản Thường thì tôi đụng giới hạn gần thời điểm reset, nhưng sẽ tốt hơn nếu biết trước lúc nào nên nghỉ

    • Tôi dùng Claude Code cực nhiều, nhưng lại ngại tự viết tooling cho worktree và nhiều phiên làm việc vì hiểu biết về git của mình chưa đủ chắc Thành thật mà nói tôi cũng hơi sợ khi dùng công cụ này; lý tưởng nhất là muốn chạy từng worktree trong container, nhưng có cảm giác sẽ rất khó để làm nó mượt như Crystal

    • Tôi thích công cụ này, nhưng Crystal đã là tên của một ngôn ngữ lập trình tôi từng dùng từ lâu rồi nên hơi dễ nhầm

    • Nếu bạn tạo issue trên GitHub (ở đây), tôi cũng có thể thử tích hợp với usage monitor của mình

    • Quá hay Tôi suýt nữa đã bảo Laude làm cho tôi một công cụ như thế này không chỉ theo từng dự án mà còn cho 5 dự án chạy đồng thời Rất đồng cảm với nhiều cơ hội ứng dụng

  • Rất thú vị, nhưng tôi thắc mắc liệu giới hạn token của gói Pro thật sự chỉ là 7.000 hay không Tức là còn chưa đến 7.000 từ, nhưng trên thực tế lại có cảm giác dùng được nhiều hơn hẳn Nếu đúng vậy thì chỉ cần hội thoại hơi dài một chút là chắc sẽ chạm trần rất nhanh, nhưng tôi thì chưa từng gặp lần nào Không biết đó có phải là giới hạn chỉ áp dụng cho Claude Code không, vì tôi vẫn chưa dùng Claude Code nhiều nên cũng không rõ

    • Gói Pro là 20 USD mỗi tháng. Gần đây mới có quyền truy cập claude code Nhưng tôi nghe nói chỉ với vài truy vấn là một số người dùng đã chạm giới hạn Nên tôi nghĩ các con số đó có lẽ là đúng Giới hạn của giao diện chat và giới hạn của Claude Code là tách biệt
  • Quá xuất sắc, cảm ơn vì đã làm ra nó Không biết có thể cài bằng uv không Kèm theo liên kết uv, người này cũng chia sẻ ví dụ lệnh shell bằng cách liệt kê từng bước cài đặt

    • Nếu repo đó được tổ chức theo cấu trúc package như project.toml chẳng hạn, thì có thể cài nhanh hơn bằng pipx (pipx) như sau

pipx install git+https://github.com/Maciek-roboblog/Claude-Code-Usage-Monitor ccusage_monitor uv chắc cũng có lệnh tương tự (uvx), nhưng tôi không rõ nó có cùng chức năng/mục đích như pipx hay không

  • Nhân tiện, gần như mọi thứ cài được bằng pip cũng cài được bằng uv, nên dùng uv cũng có thể đơn giản hơn

  • Tôi thắc mắc liệu công cụ này ngoài việc gọi shell để chạy ccusage thì còn điểm hữu ích nào khác không Thành thật mà nói tôi hơi thất vọng với kiểu dự án này, cảm giác như làm một phát bằng công cụ AI là xong Ở Show HN thậm chí còn không nhắc rằng toàn bộ phần việc thực tế được xử lý bởi công cụ khác, điều đó khá đáng tiếc

  • Hôm qua tôi có một trải nghiệm lạ với Claude Code Tôi đã thử chuyển một trang bảng phtml viết bằng PHP cũ sang bố cục div mới nhưng thất bại và tốn khoảng 4 USD Có thể là do vấn đề WSL, nhưng tôi mong chuyện như vậy đừng xảy ra thường xuyên

    • Claude Code có đường cong học khá dốc Cần thực hiện các phiên trò chuyện dài, thảo luận kỹ yêu cầu và dẫn dắt mô hình bằng các câu hỏi rõ ràng Dù vậy thỉnh thoảng những thất bại như thế vẫn có thể xảy ra, nên phải luôn nhớ đây là một công cụ rất đắt đỏ Nó không phải phép màu như các YouTuber hay blogger vẫn nói