- Nhóm nghiên cứu AI của Microsoft đã vô tình làm lộ 38 terabyte dữ liệu riêng tư khi công khai dữ liệu huấn luyện mã nguồn mở trên GitHub
- Dữ liệu bị lộ bao gồm bản sao lưu ổ đĩa làm việc của hai nhân viên, thông tin bí mật, khóa riêng, mật khẩu và hơn 30.000 tin nhắn nội bộ trên Microsoft Teams
- Dữ liệu này được chia sẻ bằng SAS token, một tính năng của Azure cho phép chia sẻ dữ liệu trong tài khoản Azure Storage. Tuy nhiên, liên kết đã được cấu hình để chia sẻ toàn bộ tài khoản lưu trữ nên dữ liệu bị phơi bày
- Sự cố này nhấn mạnh những rủi ro mới mà các tổ chức phải đối mặt khi ứng dụng AI, đồng thời cho thấy cần có thêm các bước kiểm tra bảo mật và cơ chế bảo vệ khi ngày càng nhiều kỹ sư xử lý khối lượng lớn dữ liệu huấn luyện
- Nhóm nghiên cứu Wiz đã phát hiện ra vụ lộ lọt này khi tìm thấy một container lưu trữ bị cấu hình sai trên internet
- Họ phát hiện kho lưu trữ GitHub có tên
robust-models-transfer thuộc tổ chức Microsoft; kho này được tạo ra để cung cấp mã nguồn mở và mô hình AI cho nhận dạng hình ảnh, nhưng do cấu hình sai đã cho phép một URL truy cập được nhiều hơn cả các mô hình mã nguồn mở
- Token được sử dụng cũng bị cấu hình sai để cấp quyền "toàn quyền kiểm soát", khiến kẻ tấn công có thể xem, xóa và ghi đè các tệp hiện có
- Vụ việc này làm nổi bật rủi ro bảo mật của SAS token, vốn có thể cấp mức truy cập cao vào tài khoản lưu trữ và có thể gặp vấn đề về thời hạn hết hiệu lực. Ngoài ra, chúng cũng khó quản lý và thu hồi
- Nhóm nghiên cứu Wiz khuyến nghị tránh sử dụng Account SAS cho chia sẻ ra bên ngoài do thiếu bảo mật và quản trị, thay vào đó nên dùng Stored Access Policy hoặc User Delegation SAS cho chia sẻ có giới hạn thời gian
- Nhóm cũng khuyến nghị tạo các tài khoản lưu trữ chuyên dụng cho việc chia sẻ ra bên ngoài và sử dụng CSPM để theo dõi và thực thi chính sách
- Sự cố này cũng nhắc nhở các nhóm bảo mật cần hiểu các rủi ro bảo mật vốn có ở từng giai đoạn của quy trình phát triển AI, bao gồm nguy cơ chia sẻ dữ liệu quá mức và tấn công chuỗi cung ứng
- Sau đó Microsoft đã vô hiệu hóa SAS token, thay thế nó trên GitHub và hoàn tất điều tra nội bộ về tác động tiềm ẩn
1 bình luận
Ý kiến trên Hacker News