7 điểm bởi ragingwind 2026-04-24 | 13 bình luận | Chia sẻ qua WhatsApp

Trong tháng qua, đã có liên tiếp các báo cáo từ một số người dùng rằng chất lượng phản hồi của Claude bị giảm sút. Sau khi điều tra, Anthropic xác nhận nguyên nhân là do ba thay đổi khác nhau cùng ảnh hưởng đến Claude Code, Claude Agent SDK và Claude Cowork. Bản thân API không bị ảnh hưởng, và công ty cho biết mọi vấn đề đã được khắc phục tính đến ngày 20 tháng 4 năm 2026 (v2.1.116). Bản postmortem này trình bày nguyên nhân sự cố, nội dung sửa lỗi và các biện pháp ngăn tái diễn.

Nguyên nhân và diễn biến của ba sự cố

  • Hạ giá trị mặc định của mức độ nỗ lực suy luận (reasoning effort) (4 tháng 3): Claude Code đã đổi mức độ nỗ lực suy luận mặc định từ high xuống medium. Đây là biện pháp nhằm giảm thời gian chờ quá lâu đến mức giao diện trông như bị treo, nhưng người dùng cảm nhận rõ chất lượng phản hồi đi xuống, nên cuối cùng thay đổi này đã bị hoàn tác vào ngày 7 tháng 4. Hiện tại, mặc định được đặt là xhigh cho Opus 4.7 và high cho các model còn lại.
  • Xóa lịch sử suy luận do lỗi tối ưu hóa cache (26 tháng 3): Khi nối lại một phiên đã nhàn rỗi hơn 1 giờ, một tính năng vốn được thiết kế để chỉ dọn dẹp bản ghi suy luận (thinking) trước đó đúng một lần đã, do lỗi, liên tục xóa chúng ở mọi lượt hội thoại sau đó. Vì vậy Claude không còn nhớ vì sao mình đã thực hiện một số tác vụ nhất định, dẫn đến hiện tượng “hay quên”, phản hồi lặp lại và chọn công cụ bất thường mà người dùng gặp phải. Việc cache miss (không tìm thấy dữ liệu đã lưu) lặp đi lặp lại cũng gây tác dụng phụ là hạn mức sử dụng bị tiêu hao nhanh hơn dự kiến. Lỗi này được sửa vào ngày 10 tháng 4.
  • Chỉ thị rút gọn quá mức trong system prompt (16 tháng 4): Để giảm đầu ra dài dòng của Opus 4.7, Anthropic đã thêm vào system prompt câu lệnh “văn bản giữa các lần gọi công cụ phải trong 25 từ, phản hồi cuối cùng trong 100 từ”. Các thử nghiệm nội bộ không cho thấy vấn đề, nhưng sau đó xác nhận nó ảnh hưởng tiêu cực đến chất lượng coding thực tế, nên đã bị gỡ bỏ vào ngày 20 tháng 4.

Vì sao việc phát hiện vấn đề bị chậm

  • Ba thay đổi được áp dụng ở các thời điểm khác nhau, trên các phạm vi lưu lượng khác nhau, nên chúng trông giống như một sự suy giảm chất lượng tổng thể nhưng thiếu nhất quán, khiến khó xác định từng nguyên nhân riêng lẻ.
  • Có khác biệt giữa môi trường test nội bộ và môi trường người dùng thực tế. Với lỗi cache, việc tái hiện ngay trong nội bộ vốn đã không dễ do một thử nghiệm riêng đang diễn ra và sự khác nhau trong cách UI hiển thị.
  • Bộ đánh giá hiện có (eval suite) chưa đủ rộng. Tác động của thay đổi system prompt chỉ lộ ra mức sụt hiệu năng 3% sau khi chạy các đánh giá đa dạng hơn.
Quảng cáo

Biện pháp ngăn tái diễn

  • Bắt buộc nhân viên nội bộ sử dụng đúng bản build public, để giảm độ lệch so với các bản build dành cho test nội bộ.
  • Tăng cường kiểm soát với các thay đổi của system prompt. Mọi thay đổi sẽ phải trải qua đánh giá diện rộng theo từng model, phân tích riêng ảnh hưởng của từng dòng (ablation), đồng thời triển khai dần và dành đủ thời gian xác minh (soak period).
  • Cải thiện công cụ Code Review. Từ thực tế là Opus 4.7 đã có thể phát hiện lỗi cache khi được cung cấp toàn bộ kho mã liên quan làm ngữ cảnh, Anthropic sẽ mở rộng phạm vi repository có thể được tham chiếu trong lúc code review.
  • Mở kênh giao tiếp với người dùng (@ClaudeDevs) để chia sẻ minh bạch bối cảnh đằng sau các quyết định về sản phẩm.

Về điểm “không có chuyện cố ý làm giảm chất lượng”

  • Anthropic khẳng định họ chưa từng cố ý làm giảm chất lượng model, đồng thời xác nhận API và lớp suy luận (inference layer) không bị ảnh hưởng. Tuy vậy, việc thay đổi cấu hình và các lỗi ở lớp sản phẩm (Claude Code) cùng tác động chồng chéo đã thực sự khiến chất lượng mà người dùng cảm nhận bị giảm xuống. Công ty cũng đồng thời công bố biện pháp đặt lại hạn mức sử dụng cho mọi người đăng ký thuê bao.

13 bình luận

 
crawler 2026-04-24

Sao mà cả ba nguyên nhân gây sự cố đều liên quan trực tiếp đến chuyện cắt giảm chi phí vậy trời hahaha
Có vẻ họ thực sự đang thiếu hụt tài nguyên GPU nghiêm trọng đến mức phải làm giảm hiệu năng như thế nhỉ.....

 
colus001 2026-04-24

Đây mới là đáp án đúng, nhưng viện cớ thì dài dòng ghê lol

 
youknowone 2026-04-24

Họ viết dài dòng rằng suốt thời gian qua đã triển khai mà không hề kiểm thử bản build công khai, rồi sau khi triển khai xong cũng không kiểm thử luôn. Ngay cả tôi cũng đạp phải lỗi đó ngay vào ngày 26 tháng 3, vậy mà ở nội bộ lại mất tới 3 tuần để xác nhận thì có hợp lý không...

 
youknowone 2026-04-24

Ngay sau khi bản vá được triển khai, hạn mức 5 giờ vốn phải dùng 3–4 giờ mới hết lại bắt đầu bị tiêu sạch chỉ trong 30 phút. Có lẽ vì tài khoản nhân viên thì không có hạn mức 5 giờ, hoặc ít nhất cũng không thiếu đến mức phải vừa làm vừa liên tục nhìn /usage, nên chắc phải mất khá lâu họ mới phát hiện ra.

 
amond 2026-04-24

Nhìn vào claude code trong benchmark hằng ngày SWE-Bench-Pro (bộ được tuyển chọn) thì thấy một điều thú vị.

Trong giai đoạn 10/4~20/4, runtime giảm một nửa (653s→345s), số lần gọi tool giảm một nửa (3.3K→1.8K), token giảm 18%, nhưng pass rate lại tăng thêm 16 điểm phần trăm. Việc cả bốn trục cùng lúc dịch chuyển theo hướng tích cực như vậy không phải là mẫu thường gặp.

Bản postmortem ngày 23/4 nói về 3 sự cố xảy ra trong quá trình đó, và nhìn kỹ thì tất cả đều phát sinh vì "cố giảm token/latency".

Trong khi đó, codex(gpt-5.4-xhigh) gần như không có biến động số liệu trong cùng giai đoạn. Pass rate cố định quanh mức 56%, còn token/runtime/tool call cũng vẫn ở mức gấp đôi claude code.

 
colus001 2026-04-24

Có khi đây không phải là postmortem sự cố mà là postmortem về cắt giảm chi phí?

 
sudoeng 2026-04-24

Bắt buộc nhân viên nội bộ sử dụng bản build công khai thực tế để giảm độ lệch với bản build dùng cho kiểm thử nội bộ.
lolol

 
lim8603 2026-04-25

Có vẻ như họ đã dạy YAGNI cho Opus 4.7. Mỗi lần ra quyết định kiến trúc, nó đều viện lý do là sửa đổi dần dần theo YAGNI nên tôi cũng nghĩ chắc là vậy, nhưng rồi cuối cùng vẫn gây ra sự cố. Một đứa bạn trí nhớ vốn cũng không dài mà lại còn hình thành thói quen trì hoãn nữa thì đúng là chuyện lớn.

 
tazuya 2026-04-24

Lúc ban đầu khi vấn đề được nêu ra thì cứ khăng khăng là không có vấn đề gì, rồi đến khi vụ việc trở nên quá lớn, có vẻ không thể che đậy nổi nữa nên mới công khai — có phải chỉ mình tôi nghĩ vậy không?

 
unsure4000 2026-04-24

Ngay cả web claude.ai cũng có cảm giác khả năng sử dụng bị giảm sút lặt vặt... Tôi cũng đã tắt cả bộ nhớ để tiết kiệm token.

 
xguru 2026-04-24

Sau khi đọc thông báo này, tôi lại càng có cảm giác khó tin tưởng Anthropic hơn.

Có 2 bài liên quan ở trên, và 2 bài này cách nhau 7 tháng. Vấn đề thì giống hệt nhau, đều là 3 vấn đề.

Phân tích hậu kiểm về ba sự cố suy giảm chất lượng Claude gần đây 2025-09-19
Cập nhật về các báo cáo chất lượng Claude Code gần đây 2026-04-24

 
skageektp 2026-04-24

Tôi tức tương đương với 5 đô tín dụng!!

 
wedding 2026-04-24

Lắm lời ghê..