5 điểm bởi GN⁺ 2025-07-18 | 2 bình luận | Chia sẻ qua WhatsApp
  • Từ đầu tuần này, Anthropic đã siết chặt giới hạn sử dụng đối với người dùng Claude Code mà không báo trước
  • Đặc biệt, làn sóng phàn nàn bùng lên mạnh mẽ từ các người dùng nặng của gói Max giá $200/tháng; khi chạm giới hạn, họ chỉ nhận được thông báo “Claude usage limit reached” mà không có giải thích cụ thể
  • Do giới hạn bị giảm mà không có thông báo trước hay công bố thay đổi, một số người dùng đã hiểu lầm rằng gói đăng ký của họ bị hạ cấp hoặc hệ thống theo dõi mức sử dụng bị lỗi
  • Anthropic chỉ chính thức đề cập rằng một số người dùng đang gặp phản hồi chậm, không đưa ra giải thích chi tiết, cũng không cho biết nguyên nhân hay thời điểm khắc phục chính xác
  • API quá tải, lỗi mạng và các sự cố liên quan cũng xuất hiện cùng lúc, khiến mức độ bất mãn gia tăng; người dùng đang yêu cầu khôi phục niềm tin thông qua giới hạn rõ ràng hơn và cải thiện cách giao tiếp

Việc siết giới hạn đột ngột và sự hỗn loạn

  • Từ thứ Hai tuần trước, giới hạn sử dụng Claude Code bất ngờ bị siết lại, khiến nhiều người dùng vô tình chạm ngưỡng hạn chế
  • Chỉ có thông báo “Claude usage limit reached”, kèm nội dung cho biết lệnh cấm sẽ được gỡ sau một khoảng thời gian nhất định (vài giờ), nhưng không có hướng dẫn cụ thể về việc giới hạn đã thay đổi ra sao
  • Đặc biệt với các thuê bao đắt tiền như gói Max $200, sự nghi ngờ càng tăng do lỗi theo dõi mức sử dụnghiểu lầm rằng gói bị hạ cấp
  • Trên các trang issue của GitHub, làn sóng phàn nàn bùng nổ về tính thiếu minh bạch trong cách tính mức sử dụng, chẳng hạn có người nói: “Tôi chỉ gửi vài yêu cầu trong 30 phút mà đã vượt mốc 900 tin nhắn”
  • Một người dùng cho biết: “Với giới hạn này thì không thể tiếp tục dự án được”, đồng thời than phiền rằng “ngay cả Gemini hay Kimi cũng không phải lựa chọn thay thế”

Phản hồi chính thức và các vấn đề mạng

  • Anthropic nói rằng “một số người dùng đang gặp phản hồi chậm”, nhưng né tránh giải thích thêm
  • Trong cùng thời gian đó, lỗi API overload và gián đoạn mạng cũng xảy ra đồng thời, nhưng trang trạng thái chính thức lại hiển thị hoạt động 100%, tạo ra sự lệch pha thông tin
  • Cấu trúc không chính thức và có thể thay đổi, trong đó giới hạn và dung lượng khả dụng được quyết định linh hoạt theo nhu cầu, càng làm tình hình thêm rối rắm

Cấu trúc gói cước phức tạp và chính sách sử dụng gây ra hỗn loạn

  • Các gói cước của Anthropic chỉ cung cấp giới hạn theo bậc và phần giải thích chung, không bảo đảm rõ ràng về mức sử dụng; cả miễn phí/Pro/Max đều gây nhầm lẫn vì được mô tả là “thay đổi theo nhu cầu” thay vì có trần cố định rõ ràng
    • Gói Max: được công bố có hạn mức cao hơn Pro 20 lần, còn Pro cao hơn gói miễn phí 5 lần, nhưng giá trị giới hạn tuyệt đối không được công khai
    • Ngay cả hạn mức miễn phí cũng được ghi rõ là “thay đổi theo nhu cầu”, tức là không có bảo đảm tuyệt đối về lượng sử dụng
  • Người dùng cho biết trước đợt siết giới hạn lần này, thực tế họ từng có thể dùng dịch vụ ở mức rất cao (ví dụ: gọi API trị giá hơn một nghìn đô la mỗi ngày), nên họ vốn đã xem gói Max là một mô hình thiếu ổn định và khó duy trì lâu dài
  • Vì vậy họ không bất ngờ trước việc siết giới hạn, nhưng chỉ ra rằng thiếu minh bạch mới là vấn đề lớn nhất
    • Ý kiến tiêu biểu từ người dùng là: “Hãy giao tiếp minh bạch. Thiếu giao tiếp sẽ làm mất niềm tin

Bản chất của vấn đề giao tiếp và niềm tin

  • Một số người dùng cho biết họ hiểu rằng hạn mức của gói Max có thể không bền vững về dài hạn, nhưng vẫn nhấn mạnh yêu cầu “chỉ cần giao tiếp minh bạch”
  • Những thay đổi không báo trước và hướng dẫn mơ hồ đang dẫn đến sự suy giảm niềm tin của người dùng
  • Thông báo giới hạn rõ ràng và trao đổi trước, cùng với phản ứng nhanh trước sự cố, là các yếu tố cực kỳ quan trọng để duy trì dịch vụ và bảo đảm niềm tin của khách hàng

2 bình luận

 
princox 2025-07-22

Có vẻ vì đây là sản phẩm ở tuyến đầu của agentic coding nên lưu lượng đang đổ về khá nhiều..

 
GN⁺ 2025-07-18
Ý kiến trên Hacker News
  • Một người dùng xin được ẩn danh cho biết sau khi bị áp hạn mức sử dụng, họ không thể tiếp tục dự án nữa. Cảm giác như đã chạm trần vibe, giờ là lúc phải tự mình suy nghĩ

    • Nói vậy cũng đúng, nhưng tiền đề cốt lõi mà các công ty này đang bán là có thể thuê ngoài một phần đáng kể việc "suy nghĩ", và các khoản đầu tư vào AI cũng phụ thuộc rất nhiều vào giả định đó. Đổ vào một đống tiền khổng lồ như vậy mà thị trường vẫn như cũ thì thấy hơi lạ
    • Có lẽ sẽ không chỉ dừng ở mức phải suy nghĩ thêm một chút. Muốn tiếp tục dự án thì có khi sẽ phải suy nghĩ sâu hơn rất nhiều, thậm chí cần đến năng lực tư duy ở mức cực hạn
    • Có ai mà ngờ được việc phụ thuộc quá mạnh vào một dịch vụ bên thứ ba với khả năng duy trì dài hạn chưa rõ ràng lại có thể gây vấn đề chứ, một câu hỏi đầy mỉa mai. Cảm giác như quay lại thời compiler trả phí hay mainframe từ xa, và con người thì cứ lặp đi lặp lại những sai lầm này
    • Tôi chắc đến 99% là những người dùng này không phải kiểu vibe coder không biết code. Những người như vậy sẽ dùng công cụ như lovable chứ không đụng vào tool chạy trong terminal
    • Tôi cũng vào đây để bình luận đúng về đoạn trích đó. Ngạc nhiên vì tình huống này đã đến sớm như vậy, nhưng nghĩ kỹ thì cũng không hẳn đáng ngạc nhiên
  • Claude 4.0 nếu xét về trí thông minh thô thì không hẳn thông minh hơn các mô hình đầu bảng khác. Nhưng nó được tinh chỉnh cực tốt để dùng đúng công cụ trong quá trình lập trình. Nếu các mô hình khác sớm bắt kịp thì sẽ khó mà siết hạn mức kiểu này được. Với Google thì họ có lợi thế về dòng tiền tuyệt đối vì tự triển khai silicon và còn tối ưu trực tiếp. Thú vị là trong phần bình luận ở đây hầu như không thấy ai hiểu về định luật mở rộng compute. Mọi người cứ nghĩ theo mô hình kiểu Uber là đến lúc nào đó hệ thống sẽ phải tăng giá, nhưng AI không phải lao động con người. Theo thời gian, chi phí tính toán sẽ giảm. Đặt cược và chấp nhận lỗ trong ngắn hạn thật ra lại là chiến lược có xác suất thành công cao nhất, và tôi không nghĩ đó là hành động ngu ngốc. Rất nhiều người đang chờ bong bóng này vỡ để có thể tỏ ra thông minh bằng câu "tôi đã đoán trước", nhưng về dài hạn thì cuối cùng hướng đi này vẫn là đúng

    • Ngay cả khi định luật Moore còn hiệu lực, điều đó cũng chỉ có nghĩa là chi phí compute giảm một nửa sau mỗi 18 tháng, với giả định hiệu suất sử dụng tài nguyên máy tính không đổi và hiệu suất điện năng trên mỗi phép tính cũng giữ nguyên. Có bình luận nói gói $200/tháng thực tế đội lên thành $4000/tháng; xét theo hiệu quả chi phí thì phải mất 8 năm mới bù được. Không rõ họ có sẵn sàng chịu lỗ suốt 8 năm hay không
    • Thực ra nếu nói cho đúng, các mô hình hiện tại cũng không "thông minh" như chúng tự thể hiện. Vẫn còn rất xa AGI. Quản lý ngữ cảnh, tách tác vụ, thử lại, tránh vòng lặp vô hạn, lộ ra đúng công cụ cần thiết... những thứ đó còn quan trọng hơn
    • Tôi không dùng gói $100/tháng mà trả theo đơn giá API nên dùng Claude Code rất cẩn thận. Ngày đầu tiên nó rơi vào vòng lặp, lặp đi lặp lại cùng hai lời giải sai và chỉ dừng sau khi đốt hết $30. Từ đó về sau tôi chỉ dùng khoảng $3~$5/ngày mà vẫn làm được rất nhiều thứ hiệu quả. Anthropic cần tìm cách tạo động lực để lập trình viên dùng Claude Code khôn ngoan hơn. Không kiểm soát là nó thật sự bốc đầu và chạy loạn
    • Vấn đề của mô hình là nó tạo ra một lượng khổng lồ nội dung vô dụng. Khi ngành còn nhỏ thì mức độ ô nhiễm này chưa thành vấn đề, nhưng nếu mở rộng ra quy mô toàn cầu thì việc dọn hậu quả sẽ không hề đơn giản
    • Claude cũng ổn, nhưng nếu cần "độ thông minh" thì lại là chuyện khác. Cá nhân tôi thấy Mistral medium 3 hay devstral medium đang bị đánh giá thấp. Cả hai đều không hẳn "thông minh", nhưng nếu chỉ cần code hữu dụng cho các tác vụ đơn giản thì tỷ lệ giá/hiệu năng rất ổn
  • Tôi đã dùng Claude Code với gói cơ bản $20/tháng cho dự án phụ. Dù không dùng hết toàn bộ giờ làm việc thì số lượt gọi vẫn khá dồi dào. Tôi tưởng sẽ chạm nhanh trần $20 nhưng cuối cùng lại không chạm tới. Thành thật mà nói, những phần AI không làm được thì tôi vẫn phải tự sửa hoặc code tay khá nhiều, nhưng mức tiêu thụ token thực sự có cảm giác rất hào phóng. Nếu so với giá API thì có cảm giác như mỗi ngày đang dùng lượng token trị giá $10~$20. Có vẻ ban đầu họ đặt hạn mức rất rộng để thu hút người dùng, giờ thì không gánh nổi công suất nên bắt đầu siết lại. Như bài viết nói, tôi không thể tưởng tượng phải dùng nhiều đến mức nào mới vượt cả hạn mức của gói $200/tháng

    • Trong Claude Code có vô số cách để dùng token hiệu quả hơn. Tôi hơi đoán là sắp tới sẽ có mô hình chuyên biệt riêng cho Claude Code. Theo trải nghiệm thử nghiệm của tôi, rất nhiều token bị lãng phí vào những vòng lặp vô nghĩa như đọc lại toàn bộ script Python chỉ để kiểm tra trạng thái comment, hoặc đọc lại script R chỉ để xem có đóng ngoặc vuông hay chưa. Chỉ cần xử lý các mẫu kém hiệu quả như vậy thôi cũng có thể tiết kiệm kha khá tài nguyên
    • Dạo này các hạn mức kiểu này thay đổi rất nhanh, thậm chí theo tuần hoặc theo vài ngày, và còn khác nhau theo múi giờ, vị trí, ngày tạo tài khoản nữa
    • Tôi từng chạm hạn mức trên CC chỉ trong một giờ với đúng một request. Cũng không phải Opus. Dùng một thời gian thì sớm muộn cũng hiện thông báo cảnh báo gần như báo trước, nhưng tiếc là họ không nêu rõ hạn mức mà lại tạo cảm giác chỉ muốn upsell lên gói cao hơn
    • Quy trình suy nghĩ (Thinking) thường kém hiệu quả hơn chat thông thường rất nhiều. Dùng nhiều là có thể ngốn hàng trăm đô rất nhanh
    • Nếu bạn chưa chạm hạn mức thì có thể đó là dấu hiệu nên viết prompt sáng tạo hơn. Tôi từng ném ra một prompt rồi để nó làm việc gần như độc lập trong cả tiếng đồng hồ để chạm hạn mức. Bạn có thể tạo các sub-agent chạy song song, hoặc để nó làm việc hoàn toàn tự động trong thời gian dài. Nên nhìn ở góc rộng hơn thay vì chỉ kiểu "làm giúp tôi việc này"
  • Nếu Apple bán cho bạn một chiếc MacBook M4 rồi âm thầm hạ hiệu năng xuống ngang M1 mà không cảnh báo gì, thì truyền thông công nghệ lẫn các tổ chức bảo vệ người tiêu dùng đều sẽ làm ầm lên. Thế mà các công ty AI thì lại có thể bán quyền sử dụng với giá 100 đô rồi âm thầm giảm hiệu năng mà chẳng mấy ai phản ứng. Tôi thật sự thắc mắc sao chuyện này lại có thể xảy ra

    • Từ phía công ty, họ có công suất hữu hạn nên muốn cung cấp một sản phẩm hợp lý cho tất cả người dùng. Có vẻ việc đặt ra và tuân thủ hạn mức phù hợp là cực kỳ khó. Có lẽ họ đang vật lộn với việc dự báo công suất thực tế và số người tham gia. Đối thủ cũng chưa nhiều và giá cả cũng không có chuẩn cố định nào. Hy vọng sau này sẽ khá hơn
  • Tôi nghĩ hiện giờ có lẽ họ vẫn đang vận hành trong tình trạng lỗ nên chưa phải lúc để nổi giận. Cursor cũng tương tự ở chỗ chính sách giá thiếu minh bạch. Tôi đang trả gói Max, nhưng nhìn báo cáo API thì dường như đã dùng gần $1,000 rồi. Tôi cũng không biết còn lại bao nhiêu quota, mà thông tin giá phía API cung cấp cũng thấy khó tin

    • Đồng nghiệp của tôi còn nói tháng này họ đã đốt $1,000 mỗi tuần. Nghĩ đến chuyện công ty chỉ phải trả mức thuê bao $200/tháng thì đúng là quá bất ngờ
    • Bên tôi hôm qua vừa kết thúc closed alpha và đang suy nghĩ về chính sách giá tối ưu. Nếu có thể cho phản hồi thì thật sự rất cảm kích, xem tại https://www.charlielabs.ai/pricing
    • Tôi muốn biết bạn đang dùng công cụ nào để kiểm tra chi phí, có phải cursor-stats không
    • Tôi không đồng ý với ý cho rằng vì họ đang vận hành lỗ nên mình nên rộng lượng. Tôi thật sự chán ngấy các sản phẩm cứ tung ra trước khi có mô hình doanh thu rõ ràng
  • Tôi muốn xem video quay lại bối cảnh công việc thực tế nơi mọi người thường xuyên chạm hạn mức. Bản thân tôi chủ yếu dùng sonnet để code, mà ngay cả hạn mức cơ bản của gói $20/tháng cũng chưa từng chạm tới. Tôi dùng nó để viết đặc tả, tài liệu, làm các tác vụ lặp lại dựa trên ví dụ phổ biến, hoặc dựng lặp đi lặp lại một dịch vụ cụ thể. Nếu không phải kiểu viết lại cả codebase thì nhiều chỉnh sửa nhỏ có khi tự làm còn nhanh hơn là giải thích vấn đề bằng tiếng Anh cho AI rồi để nó chạy một vòng lớn

    • Tôi chạm hạn mức khi dùng Opus và workflow dài. Cụ thể là tách thành hai workflow lớn là lập kế hoạch và triển khai; chỉ riêng việc nghiên cứu ý tưởng và tạo tài liệu kế hoạch đã tốn cỡ $10~$30 tiền API. Trong lúc review thì tôi tự sửa các lỗi nhỏ hoặc phần bị dài dòng, rồi sang bước tiếp theo là triển khai. Bước triển khai lại rẻ hơn. Từ tài liệu kế hoạch này tôi còn cho nó tự động tạo GitHub PR. Muốn chạm rate limit của gói Max $100 thì chỉ cần lặp chu kỳ như vậy 3~4 lần trong vòng 5 tiếng là đủ. Bạn cũng có thể ném cho Opus những chỉ dẫn rất phức tạp nên độ tin cậy cực cao. Nếu chỉ dùng Code theo kiểu tương tác đơn giản thì gần như không bao giờ chạm hạn mức. Có vẻ chủ yếu là vibe coder hay phá trần này
    • Khi AI không còn hội tụ về hướng đáp án đúng nữa, thì cuối cùng con người vẫn sẽ là người phải tự hoàn tất phần còn lại
    • Tôi tò mò không biết bạn có đang dùng Claude Code cùng với sonnet không. Nếu chỉ dùng trên web thì cảm giác hạn mức rộng rãi hơn rất nhiều
    • Tuần này dù đang ở gói Max nhưng ngay cả tác vụ đơn giản cũng không làm xong nổi. Không phải chỉ người dùng Max mới bị quá tải. Cảm giác như rate limit bị áp ngẫu nhiên bất cứ lúc nào. Có khi ngay prompt đầu tiên đã bị chặn
    • Nhìn chung con người tự làm thì nhanh hơn, nhưng tôi làm việc theo kiểu interrupt-driven, chuyển qua lại nhiều tác vụ, nên tôi chỉ cần ném prompt thật nhanh rồi chờ nó chạy nền. Dù agent có mất lâu gấp 3 lần thì thời gian của tôi cũng chỉ tốn vài giây để gõ prompt
  • Vài ngày trước tôi vừa làm một đợt refactor lớn ở hai dự án, đồng thời song song xử lý phần thiết kế cho hai dự án khác. Kiểm tra mức dùng Gemini API thì thấy một ngày đã tiêu hết $200 rồi. Người dùng hoàn toàn có thể chạy còn nặng hơn thế. Tôi không nghĩ chính sách $200/tháng không giới hạn có thể mang lại lợi nhuận cho công ty. Có lẽ sắp tới sẽ xuất hiện các hệ thống phân bổ công việc thông minh có tính đến chi phí. openrouter có vẻ cũng đang hướng đến điều này, nhưng để route cho đúng thì sẽ cần lượng thông tin ngữ cảnh khổng lồ

  • Có bình luận nói rằng sau khi bị giới hạn sử dụng thì "dự án thực sự không thể tiến triển được nữa". Họ đã thử Gemini, Kimi và các công cụ khác, nhưng không có công cụ nào có bộ tính năng đa dạng như Claude Code. Đó là một đánh giá kiểu PMF (product-market fit)

  • Tuần này tôi bắt đầu dùng gói $200/tháng, trong khi trước đó mỗi tháng vốn đã chi hơn $300 tiền token API. Tôi cũng từng nghĩ "không hiểu phía Anthropic làm sao cân đối lời lỗ được với mức này". Nhưng rồi lỗi API quá tải xảy ra liên tục nên cuối cùng tôi hủy gói và quay lại dùng token API. Tôi không biết họ đang theo đuổi chính sách này với ý đồ gì, nhưng bản thân tôi sẵn sàng trả tiền để dùng. Đừng chỉ giương khẩu hiệu $200/tháng cho đẹp mà hãy đảm bảo truy cập ổn định cho người dùng

    • Tôi tò mò không biết bạn gặp trải nghiệm đó với Opus hay không. Cũng muốn biết bạn làm tác vụ gì. Tôi chỉ từng tốn cực nhiều token khi xử lý một file mã nguồn lớn cỡ 2.5MB. Ngoài trường hợp đó ra thì ngay cả gói 100EUR tôi cũng không dùng hết. Tôi chủ yếu chỉ dùng Opus
    • Ngay từ đầu tôi đã nghi đơn giá API bị định quá cao so với chi phí thực. Tôi chỉ nạp thử $5 để nghịch thì nó chạy tính toán khoảng 30 phút, tương đương cỡ 3 tiếng trải nghiệm thực tế. Nếu quy đổi thô thành $10/giờ thì thành $90,000/năm. Tôi vẫn chưa tin chi phí mua và vận hành GPU lại lên tới 90 nghìn đô mỗi năm như vậy. Tôi vẫn chưa thấy thuyết phục rằng chi phí hạ tầng GPU đã vượt quá mức đầu tư phần cứng thông thường
  • Khó mà phân biệt đây là chất lượng dịch vụ bị cố ý hạ xuống, hay chỉ là nhu cầu tăng quá nhanh khiến máy chủ không chịu nổi nên họ tạm thời giảm hạn mức để đối phó. Nếu nhu cầu tiếp tục tăng thì các hạn chế này có thể còn trở thành trạng thái thường trực và nghiêm trọng hơn. Tôi không nghĩ Anthropic lại đúng lúc này đi tối ưu COGS (giá vốn hàng bán). Họ đang có cơ hội chiếm trọn thị trường DevTools, lại có nhiều tiền mặt và ý chí đầu tư mạnh, nên việc làm suy yếu sức mạnh sản phẩm sẽ là cái nhìn quá ngắn hạn

    • Đã có rất nhiều người rời bỏ Cursor rất nhanh. Với tôi đổi IDE là chuyện lớn nên tôi còn chưa từng thử Cursor. Claude Code là một khái niệm tốt hơn nhiều và không nhất thiết phải gắn với IDE. Vì vậy chuyển sang đối thủ cạnh tranh thậm chí còn dễ hơn. Theo nghĩa đó, đặc tính mô hình của Claude Code lại có thể hàm chứa rủi ro rằng việc giành thị phần rốt cuộc trở nên vô nghĩa.