1 điểm bởi GN⁺ 2024-07-22 | 3 bình luận | Chia sẻ qua WhatsApp

Các trường hợp sự cố trên Debian và Rocky Linux

  • CrowdStrike là một nhà cung cấp dịch vụ an ninh mạng nổi tiếng, gần đây được xác định là nguyên nhân gây ra lỗi Blue Screen of Death (BSOD) trên PC Windows
  • Vấn đề này đã làm gián đoạn hoạt động trong nhiều lĩnh vực như hãng hàng không, ngân hàng và nhà cung cấp dịch vụ y tế, nhưng không ảnh hưởng đến máy Mac hay PC Linux
  • Tuy nhiên, người dùng Debian và Rocky Linux cũng đã gặp các sự cố nghiêm trọng do bản cập nhật của CrowdStrike trong nhiều tháng, nhưng không được chú ý nhiều
  • Điều này làm dấy lên lo ngại về quy trình cập nhật phần mềm và kiểm thử của CrowdStrike

Trường hợp sự cố trên Debian Linux

  • Vào tháng 4, toàn bộ các máy chủ Debian Linux của một viện nghiên cứu công nghệ dân sự đã đồng loạt bị sập và từ chối khởi động do một bản cập nhật của CrowdStrike
  • Dù bản cập nhật này không tương thích với phiên bản ổn định mới nhất của Debian, cấu hình Linux đó vẫn được cho là nằm trong phạm vi hỗ trợ
  • Đội ngũ IT phát hiện rằng hệ thống có thể khởi động nếu gỡ bỏ CrowdStrike và đã báo cáo sự việc này
  • Một thành viên trong nhóm bày tỏ sự bất mãn với phản hồi chậm trễ của CrowdStrike, cho biết sau khi thừa nhận vấn đề, công ty đã mất nhiều tuần mới cung cấp được phân tích nguyên nhân gốc rễ
  • Kết quả phân tích cho thấy cấu hình Debian Linux đó không nằm trong ma trận kiểm thử của CrowdStrike

Trường hợp sự cố trên Rocky Linux

  • Sau khi nâng cấp lên Rocky Linux 9.4, người dùng CrowdStrike cũng báo cáo một vấn đề tương tự khi máy chủ bị sập do lỗi kernel
  • Đội ngũ hỗ trợ của CrowdStrike đã thừa nhận vấn đề này, cho thấy một mô thức về việc kiểm thử chưa đầy đủ và thiếu cẩn trọng đối với các vấn đề tương thích trên nhiều hệ điều hành

Hướng cải thiện

  • Để ngăn các vấn đề như vậy trong tương lai, CrowdStrike cần ưu tiên kiểm thử nghiêm ngặt trên mọi cấu hình được hỗ trợ
  • Đồng thời, các tổ chức cũng nên thận trọng với các bản cập nhật của CrowdStrike và chuẩn bị kế hoạch khẩn cấp để giảm thiểu các sự cố tiềm tàng

3 bình luận

 
click 2024-07-22

Có vẻ như AI đã tóm tắt quảng cáo chứ không phải nội dung bài viết.

 
xguru 2024-07-22

Trang Neowin có cấu trúc HTML hơi kỳ nên toàn bộ quảng cáo ở thanh trên cùng bị nhận diện là nội dung bài viết. Tôi đã sửa lại rồi.

 
GN⁺ 2024-07-22
Ý kiến trên Hacker News
  • Hệ sinh thái OSS/Linux, dù được cấu thành từ các nhóm độc lập phối hợp lỏng lẻo và mã do cộng đồng viết miễn phí, vẫn vững chắc hơn phần mềm của các công ty trị giá hàng tỷ đô
    • Các lập trình viên hệ thống OSS viết mã công khai, có lẽ không chỉ vì “nhiều con mắt sẽ làm lỗi trở nên nông cạn”, mà còn vì “chỉ cần có ai đó nhìn vào thì mã tệ sẽ phải xấu hổ”
    • Tôi đang định biến một dự án thương mại thành mã nguồn mở, nhưng cần sửa rất nhiều trước khi công khai
    • Tôi đã xem qua nhiều codebase thương mại đóng, và cũng đã thấy rất nhiều đoạn mã còn tệ hơn nhiều
  • Có bình luận cho biết CrowdStrike đã gây sự cố cho các hệ thống Linux production vào ngày 19 tháng 4
  • Chất lượng sản phẩm, từ máy bay đến phần mềm, đang lao dốc tự do, và hiện nay việc thiếu QA dường như đã trở thành chuyện bình thường
  • Khi làm trong lĩnh vực này, tôi luôn tự hỏi: “Những thứ này có thực sự hữu ích không?”
    • Tôi tự hỏi liệu có nghiên cứu bên thứ ba nào về hiệu quả của CrowdStrike và các sản phẩm tương tự hay không, hay chúng chỉ đang khiến cuộc sống của chúng ta tệ hơn vì một màn trình diễn bảo mật
  • Có báo cáo rằng CrowdStrike chèn một DLL có lỗi vào các ứng dụng Windows, khiến ứng dụng có thể tự sập
  • Vấn đề là các công ty có thể dùng những điều khoản hợp đồng để né tránh trách nhiệm đối với hậu quả phát sinh
    • Có lẽ cần vô hiệu hóa các điều khoản kiểu này, tương tự như các điều khoản phủ nhận thiệt hại do mất mạng
    • Ít nhất thì cũng phải bị hạn chế
  • Bản cập nhật không tương thích với phiên bản ổn định mới nhất của Debian
    • Phân tích cho thấy cấu hình Debian Linux không nằm trong test matrix
    • Điều này gần như là gian dối. Họ tuyên bố hỗ trợ nhưng thực tế lại không hề kiểm thử
    • Giống như nhà sản xuất ô tô không lắp dây an toàn. Thật khó hiểu vì sao CrowdStrike không bị trừng phạt
  • CrowdStrike nên ưu tiên kiểm thử nghiêm ngặt trên mọi cấu hình được hỗ trợ
    • Kiểm thử tốn kém, và trong một thị trường cạnh tranh, họ không bán sản phẩm cho các công ty thực sự cần hoặc muốn nó
    • Đây là mô hình kinh doanh ép bán sản phẩm cho doanh nghiệp, nên không có động lực để đầu tư vào chất lượng
  • Câu “không ai nhận ra” có nghĩa là CrowdStrike đã kìm hãm sự chú ý của truyền thông
    • Ngay trong ngày lỗi xảy ra, bài đăng trên HN đã có bình luận nói rằng họ đã cố báo cáo vấn đề từ vài tháng trước
    • Bài báo cũng viết rằng mọi người đã nhận ra. Vậy nên tôi tự hỏi là ai đã không nhận ra, hay chỉ là vì vấn đề không đủ nổi để bị bỏ qua
  • Tôi tò mò không biết có ai đang dùng CrowdStrike không, và nó thực sự làm gì
    • Nó được cài trên laptop công ty của tôi, và trông giống như keylogger cùng trình giám sát hoạt động
    • Người ta nói “không có gì để che giấu”, nhưng tôi vẫn thấy khó chịu khi có một siêu quản trị viên nào đó trong công ty theo dõi mình