- Từ đầu tuần này, Anthropic đã siết chặt giới hạn sử dụng đối với người dùng Claude Code mà không báo trước
- Đặc biệt, làn sóng phàn nàn bùng lên mạnh mẽ từ các người dùng nặng của gói Max giá $200/tháng; khi chạm giới hạn, họ chỉ nhận được thông báo “Claude usage limit reached” mà không có giải thích cụ thể
- Do giới hạn bị giảm mà không có thông báo trước hay công bố thay đổi, một số người dùng đã hiểu lầm rằng gói đăng ký của họ bị hạ cấp hoặc hệ thống theo dõi mức sử dụng bị lỗi
- Anthropic chỉ chính thức đề cập rằng một số người dùng đang gặp phản hồi chậm, không đưa ra giải thích chi tiết, cũng không cho biết nguyên nhân hay thời điểm khắc phục chính xác
- API quá tải, lỗi mạng và các sự cố liên quan cũng xuất hiện cùng lúc, khiến mức độ bất mãn gia tăng; người dùng đang yêu cầu khôi phục niềm tin thông qua giới hạn rõ ràng hơn và cải thiện cách giao tiếp
Việc siết giới hạn đột ngột và sự hỗn loạn
- Từ thứ Hai tuần trước, giới hạn sử dụng Claude Code bất ngờ bị siết lại, khiến nhiều người dùng vô tình chạm ngưỡng hạn chế
- Chỉ có thông báo “Claude usage limit reached”, kèm nội dung cho biết lệnh cấm sẽ được gỡ sau một khoảng thời gian nhất định (vài giờ), nhưng không có hướng dẫn cụ thể về việc giới hạn đã thay đổi ra sao
- Đặc biệt với các thuê bao đắt tiền như gói Max $200, sự nghi ngờ càng tăng do lỗi theo dõi mức sử dụng và hiểu lầm rằng gói bị hạ cấp
- Trên các trang issue của GitHub, làn sóng phàn nàn bùng nổ về tính thiếu minh bạch trong cách tính mức sử dụng, chẳng hạn có người nói: “Tôi chỉ gửi vài yêu cầu trong 30 phút mà đã vượt mốc 900 tin nhắn”
- Một người dùng cho biết: “Với giới hạn này thì không thể tiếp tục dự án được”, đồng thời than phiền rằng “ngay cả Gemini hay Kimi cũng không phải lựa chọn thay thế”
Phản hồi chính thức và các vấn đề mạng
- Anthropic nói rằng “một số người dùng đang gặp phản hồi chậm”, nhưng né tránh giải thích thêm
- Trong cùng thời gian đó, lỗi API overload và gián đoạn mạng cũng xảy ra đồng thời, nhưng trang trạng thái chính thức lại hiển thị hoạt động 100%, tạo ra sự lệch pha thông tin
- Cấu trúc không chính thức và có thể thay đổi, trong đó giới hạn và dung lượng khả dụng được quyết định linh hoạt theo nhu cầu, càng làm tình hình thêm rối rắm
Cấu trúc gói cước phức tạp và chính sách sử dụng gây ra hỗn loạn
- Các gói cước của Anthropic chỉ cung cấp giới hạn theo bậc và phần giải thích chung, không bảo đảm rõ ràng về mức sử dụng; cả miễn phí/Pro/Max đều gây nhầm lẫn vì được mô tả là “thay đổi theo nhu cầu” thay vì có trần cố định rõ ràng
- Gói Max: được công bố có hạn mức cao hơn Pro 20 lần, còn Pro cao hơn gói miễn phí 5 lần, nhưng giá trị giới hạn tuyệt đối không được công khai
- Ngay cả hạn mức miễn phí cũng được ghi rõ là “thay đổi theo nhu cầu”, tức là không có bảo đảm tuyệt đối về lượng sử dụng
- Người dùng cho biết trước đợt siết giới hạn lần này, thực tế họ từng có thể dùng dịch vụ ở mức rất cao (ví dụ: gọi API trị giá hơn một nghìn đô la mỗi ngày), nên họ vốn đã xem gói Max là một mô hình thiếu ổn định và khó duy trì lâu dài
- Vì vậy họ không bất ngờ trước việc siết giới hạn, nhưng chỉ ra rằng thiếu minh bạch mới là vấn đề lớn nhất
- Ý kiến tiêu biểu từ người dùng là: “Hãy giao tiếp minh bạch. Thiếu giao tiếp sẽ làm mất niềm tin”
Bản chất của vấn đề giao tiếp và niềm tin
- Một số người dùng cho biết họ hiểu rằng hạn mức của gói Max có thể không bền vững về dài hạn, nhưng vẫn nhấn mạnh yêu cầu “chỉ cần giao tiếp minh bạch”
- Những thay đổi không báo trước và hướng dẫn mơ hồ đang dẫn đến sự suy giảm niềm tin của người dùng
- Thông báo giới hạn rõ ràng và trao đổi trước, cùng với phản ứng nhanh trước sự cố, là các yếu tố cực kỳ quan trọng để duy trì dịch vụ và bảo đảm niềm tin của khách hàng
2 bình luận
Có vẻ vì đây là sản phẩm ở tuyến đầu của agentic coding nên lưu lượng đang đổ về khá nhiều..
Ý kiến trên Hacker News
Một người dùng xin được ẩn danh cho biết sau khi bị áp hạn mức sử dụng, họ không thể tiếp tục dự án nữa. Cảm giác như đã chạm trần vibe, giờ là lúc phải tự mình suy nghĩ
Claude 4.0 nếu xét về trí thông minh thô thì không hẳn thông minh hơn các mô hình đầu bảng khác. Nhưng nó được tinh chỉnh cực tốt để dùng đúng công cụ trong quá trình lập trình. Nếu các mô hình khác sớm bắt kịp thì sẽ khó mà siết hạn mức kiểu này được. Với Google thì họ có lợi thế về dòng tiền tuyệt đối vì tự triển khai silicon và còn tối ưu trực tiếp. Thú vị là trong phần bình luận ở đây hầu như không thấy ai hiểu về định luật mở rộng compute. Mọi người cứ nghĩ theo mô hình kiểu Uber là đến lúc nào đó hệ thống sẽ phải tăng giá, nhưng AI không phải lao động con người. Theo thời gian, chi phí tính toán sẽ giảm. Đặt cược và chấp nhận lỗ trong ngắn hạn thật ra lại là chiến lược có xác suất thành công cao nhất, và tôi không nghĩ đó là hành động ngu ngốc. Rất nhiều người đang chờ bong bóng này vỡ để có thể tỏ ra thông minh bằng câu "tôi đã đoán trước", nhưng về dài hạn thì cuối cùng hướng đi này vẫn là đúng
Tôi đã dùng Claude Code với gói cơ bản $20/tháng cho dự án phụ. Dù không dùng hết toàn bộ giờ làm việc thì số lượt gọi vẫn khá dồi dào. Tôi tưởng sẽ chạm nhanh trần $20 nhưng cuối cùng lại không chạm tới. Thành thật mà nói, những phần AI không làm được thì tôi vẫn phải tự sửa hoặc code tay khá nhiều, nhưng mức tiêu thụ token thực sự có cảm giác rất hào phóng. Nếu so với giá API thì có cảm giác như mỗi ngày đang dùng lượng token trị giá $10~$20. Có vẻ ban đầu họ đặt hạn mức rất rộng để thu hút người dùng, giờ thì không gánh nổi công suất nên bắt đầu siết lại. Như bài viết nói, tôi không thể tưởng tượng phải dùng nhiều đến mức nào mới vượt cả hạn mức của gói $200/tháng
Nếu Apple bán cho bạn một chiếc MacBook M4 rồi âm thầm hạ hiệu năng xuống ngang M1 mà không cảnh báo gì, thì truyền thông công nghệ lẫn các tổ chức bảo vệ người tiêu dùng đều sẽ làm ầm lên. Thế mà các công ty AI thì lại có thể bán quyền sử dụng với giá 100 đô rồi âm thầm giảm hiệu năng mà chẳng mấy ai phản ứng. Tôi thật sự thắc mắc sao chuyện này lại có thể xảy ra
Tôi nghĩ hiện giờ có lẽ họ vẫn đang vận hành trong tình trạng lỗ nên chưa phải lúc để nổi giận. Cursor cũng tương tự ở chỗ chính sách giá thiếu minh bạch. Tôi đang trả gói Max, nhưng nhìn báo cáo API thì dường như đã dùng gần $1,000 rồi. Tôi cũng không biết còn lại bao nhiêu quota, mà thông tin giá phía API cung cấp cũng thấy khó tin
Tôi muốn xem video quay lại bối cảnh công việc thực tế nơi mọi người thường xuyên chạm hạn mức. Bản thân tôi chủ yếu dùng sonnet để code, mà ngay cả hạn mức cơ bản của gói $20/tháng cũng chưa từng chạm tới. Tôi dùng nó để viết đặc tả, tài liệu, làm các tác vụ lặp lại dựa trên ví dụ phổ biến, hoặc dựng lặp đi lặp lại một dịch vụ cụ thể. Nếu không phải kiểu viết lại cả codebase thì nhiều chỉnh sửa nhỏ có khi tự làm còn nhanh hơn là giải thích vấn đề bằng tiếng Anh cho AI rồi để nó chạy một vòng lớn
Vài ngày trước tôi vừa làm một đợt refactor lớn ở hai dự án, đồng thời song song xử lý phần thiết kế cho hai dự án khác. Kiểm tra mức dùng Gemini API thì thấy một ngày đã tiêu hết $200 rồi. Người dùng hoàn toàn có thể chạy còn nặng hơn thế. Tôi không nghĩ chính sách $200/tháng không giới hạn có thể mang lại lợi nhuận cho công ty. Có lẽ sắp tới sẽ xuất hiện các hệ thống phân bổ công việc thông minh có tính đến chi phí. openrouter có vẻ cũng đang hướng đến điều này, nhưng để route cho đúng thì sẽ cần lượng thông tin ngữ cảnh khổng lồ
Có bình luận nói rằng sau khi bị giới hạn sử dụng thì "dự án thực sự không thể tiến triển được nữa". Họ đã thử Gemini, Kimi và các công cụ khác, nhưng không có công cụ nào có bộ tính năng đa dạng như Claude Code. Đó là một đánh giá kiểu PMF (product-market fit)
Tuần này tôi bắt đầu dùng gói $200/tháng, trong khi trước đó mỗi tháng vốn đã chi hơn $300 tiền token API. Tôi cũng từng nghĩ "không hiểu phía Anthropic làm sao cân đối lời lỗ được với mức này". Nhưng rồi lỗi API quá tải xảy ra liên tục nên cuối cùng tôi hủy gói và quay lại dùng token API. Tôi không biết họ đang theo đuổi chính sách này với ý đồ gì, nhưng bản thân tôi sẵn sàng trả tiền để dùng. Đừng chỉ giương khẩu hiệu $200/tháng cho đẹp mà hãy đảm bảo truy cập ổn định cho người dùng
Khó mà phân biệt đây là chất lượng dịch vụ bị cố ý hạ xuống, hay chỉ là nhu cầu tăng quá nhanh khiến máy chủ không chịu nổi nên họ tạm thời giảm hạn mức để đối phó. Nếu nhu cầu tiếp tục tăng thì các hạn chế này có thể còn trở thành trạng thái thường trực và nghiêm trọng hơn. Tôi không nghĩ Anthropic lại đúng lúc này đi tối ưu COGS (giá vốn hàng bán). Họ đang có cơ hội chiếm trọn thị trường DevTools, lại có nhiều tiền mặt và ý chí đầu tư mạnh, nên việc làm suy yếu sức mạnh sản phẩm sẽ là cái nhìn quá ngắn hạn