10 điểm bởi before30 2020-12-26 | 1 bình luận | Chia sẻ qua WhatsApp

https://how.complexsystems.fail/

https://www.youtube.com/watch?v=2S0k12uZR14

Trong tác phẩm How Complex System Fail của Richard Cook, tác giả đề cập đến 18 nguyên nhân khiến các hệ thống phức tạp thất bại và các phương pháp để giảm thiểu thất bại.

1. Hệ thống phức tạp về bản chất là hệ thống nguy hiểm.

2. Hệ thống phức tạp bảo vệ thành công trước thất bại.

Khi sự cố xảy ra, nhiều tầng phòng vệ sẽ được xây dựng. Những lớp phòng vệ này bao gồm các thành phần kỹ thuật (backup, system safety feature, v.v.), thành phần con người (đào tạo, kiến thức), tổ chức, thể chế, v.v.

3. Thảm họa (Catastrophe) cần nhiều lần thất bại. - SPoF là chưa đủ.

Sự cố lớn hình thành từ việc nhiều tai nạn nhỏ cộng dồn lại.

4. Hệ thống phức tạp chứa các tổ hợp lỗi tiềm ẩn và luôn thay đổi bên trong.

5. Hệ thống phức tạp vận hành trong chế độ suy giảm hiệu năng.

6. Thảm họa (Catastrophe) luôn cận kề.

7. Root Cause sau sự cố về cơ bản là sai lầm.

8. Đánh giá hiệu suất sau sự cố mang tính thiên kiến hồi cứu.

9. Vận hành có hai vai trò. (nhà sản xuất, người phòng vệ trước sự cố)

10. Mọi hành động của người thực thi đều là một canh bạc.

Sau sự cố, thất bại thường trông như thể không thể tránh khỏi, và hành động của người thực thi có vẻ là sai lầm. Nhưng trên thực tế, mọi hành động của người thực thi đều là một canh bạc, tức là hành động diễn ra khi đối mặt với kết quả không chắc chắn. Mức độ bất định có thể thay đổi. Chỉ sau sự cố người ta mới biết rằng hành động của người thực thi là một canh bạc. Thông thường, trong phân tích hậu kiểm, những canh bạc như vậy bị xem là những canh bạc tồi. Tuy nhiên, kết quả thành công cũng đồng thời là kết quả của một canh bạc.

11. Hành động ở nơi khó khăn nhất giúp giải quyết sự mơ hồ.

12. Người thực thi là thành phần có khả năng thích ứng của hệ thống phức tạp.

13. Chuyên môn của con người đối với hệ thống phức tạp liên tục thay đổi.

14. Thay đổi mang đến những hình thức thất bại mới.

15. Cách nhìn về 'nguyên nhân' giới hạn hiệu quả của việc phòng vệ trước các sự kiện trong tương lai.

16. An toàn không phải là một thành phần mà là đặc tính của hệ thống.

An toàn là thuộc tính của hệ thống. Trạng thái an toàn của mọi hệ thống luôn thay đổi. Cần quản lý rủi ro một cách liên tục và có hệ thống.

17. Con người liên tục tạo ra sự an toàn.

18. Công việc không có thất bại cần có trải nghiệm về thất bại.

1 bình luận

 
gramer2188 2021-01-06

Dạo này chắc vì đang chuẩn bị cho chaos engineering nên những bài viết dưới đây cứ đọng lại trong tôi.

  • Thảm họa (Catastrophe) luôn ở ngay trước mắt.

  • Muốn có những công việc không thất bại thì cần có trải nghiệm thất bại.