Vì sao gói đăng ký Claude rẻ hơn API tới 36 lần và vì sao ‘Max 5x’ mới là điểm tối ưu thực sự
(reddit.com)- Trong mẫu sử dụng kiểu agent, dùng theo hình thức đăng ký cho thấy hiệu quả chi phí cao hơn 36 lần
- Gói ‘Max 5x’ có giới hạn theo phiên gấp 6 lần, giới hạn theo tuần gấp 8,3 lần, nên mức sử dụng thực tế còn cao hơn con số marketing đưa ra
- Gói ‘Max 20x’ chỉ mở rộng đúng 20 lần nếu tính theo phiên 5 giờ, còn giới hạn theo tuần chỉ dừng ở khoảng gấp 2 lần Max 5x
- Trên giao diện web, chi phí tái sử dụng context đã cache là 0 đồng, trong khi API khi gửi lại cùng context sẽ tiếp tục bị tính 10% chi phí input
- Bằng cách suy ngược các giá trị mức sử dụng số thực dấu chấm động, bài viết phục dựng được các con số giới hạn đăng ký và phân tích khá chính xác cấu trúc credit·token nội bộ
Bối cảnh phân tích và cách tiếp cận
- Các giá trị thập phân mức sử dụng có độ chính xác bất thường hiển thị trong Claude web UI cho thấy đó là kết quả tính toán nội bộ
- Những giá trị như
0.16327272727272726được cho là xuất phát từ hệ thống credit nội bộ dựa trên phân số - Bài viết dùng Stern–Brocot tree để suy ngược các giá trị này về dạng phân số
- Những giá trị như
- Từ đó có thể phục dựng lại giới hạn theo phiên, giới hạn theo tuần và đơn vị credit thực tế
Khác biệt trong cấu trúc chi phí giữa đăng ký web và API
- Gói đăng ký Claude trên web không phát sinh thêm chi phí input dù tham chiếu lặp lại cùng một ngữ cảnh hội thoại
- API phải gửi lại cùng context trong mỗi request, và ngay cả khi cache hit vẫn bị tính 10% chi phí token input
- Với các kiểu sử dụng như lập trình dạng agent, nơi context dài được tiêu thụ lặp đi lặp lại, chênh lệch chi phí tăng lên rất nhanh
Giới hạn thực tế của gói ‘Max 20x’
- Nhãn ‘20x’ chỉ áp dụng cho mức sử dụng theo phiên 5 giờ
- Giới hạn sử dụng cộng dồn theo tuần chỉ bị giới hạn ở khoảng gấp 2 lần Max 5x
- Có lợi cho các đợt dùng tốc độ cao trong thời gian ngắn, nhưng kém hiệu quả hơn khi dùng liên tục trong thời gian dài
Hiệu quả thực tế của gói ‘Max 5x’
- Giới hạn theo phiên được mở rộng lên khoảng 6 lần so với Pro
- Giới hạn theo tuần tăng lên khoảng 8,3 lần so với Pro
- Đây là gói được xác nhận là có mức cung cấp thực tế còn lớn hơn tên gọi
- Ở mức $100/tháng, gói này cho thấy hiệu quả chi phí vượt trội so với API
Kết luận về hiệu quả chi phí
- Với các công việc phát triển dựa trên agent như code thời gian dài hay Claude Code, đăng ký có lợi hơn API rất nhiều
- Đặc biệt, gói ‘Max 5x’ là điểm cân bằng tốt nhất giữa tốc độ·độ bền·chi phí
- Theo cấu trúc hiện tại, đây là lựa chọn tối ưu cho người dùng nâng cao và lập trình viên
Liên kết bài gốc: suspiciously precise floats, or, how I got Claude's real limits
Tổng hợp bình luận Reddit
- Nhìn chung, các bình luận đồng tình mạnh mẽ rằng phép phân tích số liệu của OP là hợp lý
- Đặc biệt, nhiều ý kiến hội tụ ở điểm gói ‘Max 5x’ giá $100/tháng có hiệu quả chi phí tốt nhất cho người dùng nặng
- Nhờ cấu trúc tái sử dụng context cache trên web UI là miễn phí, chênh lệch chi phí so với API trở nên rất lớn trong các phiên dài và kiểu dùng dạng agent
- Ngay cả trong cộng đồng người dùng Max 5x thực tế cũng có nhiều chia sẻ rằng dùng cả ngày vẫn gần như không chạm giới hạn
- Nhận định ‘Max 20x là cái bẫy’ cũng được bổ sung giải thích
- Tổng giới hạn sử dụng theo tuần chỉ khoảng gấp 2 lần Max 5x
- Trong khi đó giới hạn theo phiên 5 giờ lại mở rộng gấp 4 lần
- Vì vậy, có thể xem 20x dành cho các đợt bùng nổ ngắn hạn (sprint), còn 5x phù hợp với sử dụng bền bỉ dài hạn (marathon)
- Cảnh báo mạnh nhất được nêu ra là sự thiếu minh bạch của Anthropic
- Phân tích lần này đều dựa trên các con số suy ngược
- Các giới hạn nội bộ có thể thay đổi mà không báo trước
- Nó hữu ích cho tối ưu chi phí ngắn hạn, nhưng rủi ro nếu lấy làm cơ sở cho quyết định kinh doanh dài hạn
- Mẹo thực tế hữu ích nhất là cách dùng tiện ích mở rộng Claude Code cho VS Code
- Có thể đăng nhập bằng tài khoản đăng ký claude.ai thay vì API key
- Nhờ đó có thể dùng hạn mức của gói đăng ký mà không tiêu hao credit API
- Nhiều người phản hồi rằng đây là điều họ chưa từng biết
- Một điểm bàn thêm là khác biệt về quyền riêng tư và điều khoản sử dụng
- Web UI và API có Terms of Service khác nhau
- Với công việc xử lý mã nguồn nhạy cảm hoặc độc quyền, vẫn có nhận thức rằng dùng API an toàn hơn
- Ở chiều ngược lại, cũng có ý kiến cho rằng giới hạn sử dụng lại giúp tăng năng suất
- Càng gần như không giới hạn thì prompt càng dễ trở nên dài dòng và kém hiệu quả
- Việc có giới hạn buộc người dùng phải thiết kế prompt cô đọng và có chủ đích hơn
- Nhìn chung, không khí trong phần bình luận là
- “Ở thời điểm hiện tại, Max 5x là lựa chọn tối ưu” như một đồng thuận thực tế
- Đồng thời vẫn đi kèm sự dè chừng rằng “cấu trúc này có thể thay đổi bất cứ lúc nào”
2 bình luận
Tôi bật 8 agent chạy cùng lúc nên chạm limit rất nhanh.
Là vì bạn chưa dùng nhiều thôi.... cứ quẩy quẩy một hồi là bay sạch cả 20 lần ngay~