25 điểm bởi tenshi 2022-02-03 | 5 bình luận | Chia sẻ qua WhatsApp

Đây là bài viết phân tích sự cố về việc dịch vụ Inflearn liên tục không thể sử dụng được từ ngày 3 đến ngày 17 tháng 1 năm 2022. Bài viết trình bày chi tiết toàn bộ quá trình từ phát hiện sự cố, ứng phó ban đầu, tái diễn, phân tích nguyên nhân gốc rễ cho đến khắc phục nguyên nhân gốc rễ.

5 bình luận

 
xor100 2022-02-03

Cảm ơn vì bài viết hay. Nhưng đã có từ rất hay là “nhìn lại”, vậy tại sao bạn lại dùng từ “giải phẫu” nhỉ? Không phải là sai, nhưng cảm giác hơi tiêu cực.

 
kbumsik 2022-02-04

Với bản dịch của Postmortem, có vẻ người ta thường dùng từ “giải phẫu” để chỉ báo cáo về các biện pháp đã được thực hiện sau khi sự cố xảy ra.

 
ffdd270 2022-02-04

Tôi thấy cách nói này khá thú vị vì nghĩ rằng nó mang sắc thái như “mổ tử thi” vì dịch vụ đã chết rồi (...). Nhưng cũng có thể người khác sẽ cảm nhận khác. 'm '

 
budlebee 2022-02-03

Tôi nghĩ sắc thái ở đây giống như email kiểm điểm sau sự cố (postmortem email) của Netflix.

 
tenshi 2022-02-03

Đặc biệt, với bảng bài giảng, do có các cột dung lượng lớn (mã HTML của cột giới thiệu bài giảng), nên dung lượng của từng Dead Tuple là cực kỳ lớn.

Vì vậy, các truy vấn cập nhật diễn ra thường xuyên sẽ dẫn tới việc tạo ra hàng loạt Dead Tuple dung lượng lớn.

Đặc biệt, phần phân tích nguyên nhân gốc rễ giúp có thể cảm nhận được tác động mà Dead Tuple của PostgreSQL có thể gây ra cho dịch vụ có lẽ sẽ là tài liệu tham khảo rất hữu ích.