Báo cáo phân tích sự cố của sự kiện giảm giá 100% tháng 1 năm 2022
(tech.inflab.com)Đây là bài viết phân tích sự cố về việc dịch vụ Inflearn liên tục không thể sử dụng được từ ngày 3 đến ngày 17 tháng 1 năm 2022. Bài viết trình bày chi tiết toàn bộ quá trình từ phát hiện sự cố, ứng phó ban đầu, tái diễn, phân tích nguyên nhân gốc rễ cho đến khắc phục nguyên nhân gốc rễ.
5 bình luận
Cảm ơn vì bài viết hay. Nhưng đã có từ rất hay là “nhìn lại”, vậy tại sao bạn lại dùng từ “giải phẫu” nhỉ? Không phải là sai, nhưng cảm giác hơi tiêu cực.
Với bản dịch của Postmortem, có vẻ người ta thường dùng từ “giải phẫu” để chỉ báo cáo về các biện pháp đã được thực hiện sau khi sự cố xảy ra.
Tôi thấy cách nói này khá thú vị vì nghĩ rằng nó mang sắc thái như “mổ tử thi” vì dịch vụ đã chết rồi (...). Nhưng cũng có thể người khác sẽ cảm nhận khác. 'm '
Tôi nghĩ sắc thái ở đây giống như email kiểm điểm sau sự cố (postmortem email) của Netflix.
Đặc biệt, phần phân tích nguyên nhân gốc rễ giúp có thể cảm nhận được tác động mà Dead Tuple của PostgreSQL có thể gây ra cho dịch vụ có lẽ sẽ là tài liệu tham khảo rất hữu ích.