19 điểm bởi minsuchae 2025-11-18 | 16 bình luận | Chia sẻ qua WhatsApp

🚨 Sự cố mạng toàn cầu của Cloudflare

  • Đang điều tra (47 phút trước): Cloudflare đã ghi nhận và đang điều tra tình trạng lỗi 500 trên diện rộng cùng sự cố bảng điều khiển/API ảnh hưởng đến nhiều khách hàng.

  • Cập nhật (32 phút trước): Chúng tôi vẫn đang tiếp tục điều tra sự cố.

  • Đang khôi phục (14 phút trước): Các dịch vụ đang trong quá trình được khôi phục, nhưng trong lúc công việc khôi phục vẫn tiếp diễn, khách hàng có thể tiếp tục quan sát thấy tỷ lệ lỗi cao hơn bình thường.

Hiện tại đã xảy ra sự cố diện rộng trên Twitter và các dịch vụ khác; chức năng CDN đã tạm thời được khôi phục.

16 bình luận

 
jjpark78 2025-11-19

Hardening việc tiếp nhận các tệp cấu hình do Cloudflare tạo ra theo cùng cách mà chúng ta xử lý dữ liệu đầu vào do người dùng tạo ra

Có vẻ đây là một bài học rất đáng giá.

Trong khi chúng ta áp dụng đủ mọi kiểu kiểm chứng cho dữ liệu đầu vào của người dùng,

thì những dữ liệu quan trọng được tạo ra ở nội bộ lại thực ra không được kiểm chứng đến mức này.

Tổ chức càng trở nên đồ sộ thì dù nội dung đó đã được tài liệu hóa, nó cũng có thể không được phát hiện, và
khi kích thước được đặt khá dư dả nên một thời gian dài không có vấn đề gì, rồi sau đó bị lãng quên, đến lúc vượt quá giới hạn kích thước
thì đúng là sụp đổ tinh thần... thật sự...

 
jamiecha 2025-11-19

https://blog.cloudflare.com/18-november-2025-outage/…
Cuối cùng thì sự cố đã nổ ra ở unwrap() được xử lý hơi hời hợt một chút, nhưng vì ngay từ đầu giả định về kích thước của tệp cấu hình đã bị phá vỡ nên cũng khó mà đổ hoàn toàn lỗi cho nó. Đáng lẽ phía "tạo" tệp cấu hình phải có đoạn mã kiểm tra xem giả định kiểu này có được tuân thủ hay không, nhưng có lẽ vì người phụ trách khác nhau nên giới hạn kích thước đã không được coi là quá quan trọng chăng?

 
jjpark78 2025-11-19

https://blog.cloudflare.com/18-november-2025-outage/

Dù vậy, nhờ những báo cáo hậu kiểm trung thực như thế này mà có lẽ tôi vẫn sẽ tiếp tục dùng Cloudflare.

Nếu là công ty trong nước thì chắc họ sẽ bảo là do hacker Triều Tiên gây ra..

 
onestone 2025-11-19

Dạo gần đây có vẻ như tôi thường xuyên chứng kiến sự cố của các dịch vụ liên quan đến đám mây hơn.

 
quack337 2025-11-19

À! Rạng sáng nay lệnh git clone của repo GitHub bị treo nên tôi đã hoảng hốt,
thì ra là do sự cố này.

 
minsuchae 2025-11-19

Có vẻ toàn bộ đã được khôi phục sau 6 giờ xảy ra sự cố.
Cập nhật
Các dịch vụ của Cloudflare hiện đang hoạt động bình thường. Chúng tôi không còn quan sát thấy tỷ lệ lỗi hoặc độ trễ tăng cao trên toàn mạng.

Các nhóm kỹ sư của chúng tôi vẫn đang tiếp tục giám sát chặt chẽ nền tảng và tiến hành điều tra sâu hơn về gián đoạn trước đó, nhưng hiện tại không có thay đổi cấu hình nào được thực hiện.

Ở thời điểm này, có thể xem là an toàn để bật lại bất kỳ dịch vụ Cloudflare nào đã tạm thời bị vô hiệu hóa trong thời gian xảy ra sự cố. Chúng tôi sẽ cung cấp bản cập nhật cuối cùng sau khi hoàn tất điều tra.
Đăng 28 phút trước. 18 Nov 2025 - 17:44 UTC

 
jic5760 2025-11-19

Cho đến tận vừa nãy còn không vào được dashboard, giờ thì vào được rồi..

 
kimjoin2 2025-11-19

Dịch vụ đã bị gián đoạn khoảng 3 tiếng.

 
lsdcnu 2025-11-18

Nhanh thật.

 
rkjun 2025-11-18

To chuyện rồi. Mong là sẽ khôi phục nhanh thôi... mà có vẻ vẫn chưa thể phục hồi ngay được.. 😢

 
galadbran 2025-11-18

Lần xảy ra sự cố diện rộng trước đó, Twitter vẫn hoạt động ổn nên đã nhận được rất nhiều lời khen, nhưng trong sự cố lần này thì ngay cả Twitter cũng không tránh khỏi...

 
bbulbum 2025-11-18

Haha, tôi cũng thấy các dịch vụ liên quan đến Cloudflare bị sập nên vào GeekNews trước tiên.
Cảm ơn vì đã truyền tin nhanh chóng.
Lỗi ở CDN nằm ngay tuyến đầu của dịch vụ đúng là có sức lan tỏa rất lớn.
Các lập trình viên thì có lẽ sẽ phần nào đoán được sự cố này là vấn đề ở đâu, nhưng người dùng sẽ hiểu đó là vấn đề của chính dịch vụ, nên có vẻ những sự cố của các dịch vụ hạ tầng như thế này thực sự không hề dễ xử lý về nhiều mặt.

 
bbulbum 2025-11-18

Nghĩ kỹ thì việc không xử lý được single point failure cũng là sai? Có lẽ đúng là sai thật...

 
crawler 2025-11-18

Vừa thấy server sập là tôi vào GeekNews ngay lập tức.
Đúng là đã có bài được đăng lên rồi haha.
Không biết lần này là vì lý do gì nữa.

 
laeyoung 2025-11-18

Tưởng chỉ là claude code web tạm thời không vào được, hóa ra là do sự cố Cloudflare.