-
Phát hiện bất thường chuỗi thời gian: Tổng quan 10 năm
-
Với sự phát triển của công nghệ thu thập dữ liệu gần đây và việc gia tăng dữ liệu streaming, nhu cầu phân tích chuỗi thời gian đã được nhấn mạnh. Vì vậy, phát hiện bất thường chuỗi thời gian đã trở thành một hoạt động quan trọng trong nhiều lĩnh vực như an ninh mạng, thị trường tài chính, thực thi pháp luật và y tế.
-
Văn liệu phát hiện bất thường truyền thống tập trung chủ yếu vào các phép đo thống kê; tuy nhiên, trong những năm gần đây, số lượng thuật toán học máy tăng lên đòi hỏi các phương pháp nghiên cứu phát hiện bất thường chuỗi thời gian có tính cấu trúc và tính tổng quát.
-
Bài khảo sát này nhóm và tóm tắt các giải pháp phát hiện bất thường hiện có theo một phân loại theo quy trình trong bối cảnh chuỗi thời gian. Ngoài ra, nó cũng cung cấp một phân loại riêng cho các phương pháp phát hiện bất thường, thực hiện phân tích tổng hợp tài liệu và phác thảo các xu hướng chung của nghiên cứu phát hiện bất thường chuỗi thời gian.
-
1 bình luận
Bình luận Hacker News
UCR Matrix Profile là một công cụ rất hiệu quả trong phân tích chuỗi thời gian. Đối với việc tìm kiếm motif và phát hiện bất thường, khác với các kỹ thuật truyền thống, không cần chỉnh kích thước cửa sổ hay ngưỡng, và có thể áp dụng cho nhiều lĩnh vực từ dữ liệu cảm biến sản xuất đến phân tích ECG và phát hiện động đất.
Sử dụng chức năng offset của Prometheus để đặt quy tắc ghi nhận trung bình hằng tuần. Trong hệ thống biến động theo chu kỳ tuần, tính trung bình của một chỉ số cụ thể rồi so sánh với giá trị hiện tại để thiết lập ngưỡng động. Gitlab cung cấp mô tả chi tiết về phương pháp này.
Không phản ánh công việc trong vài năm gần đây. Mô hình chuỗi thời gian Granite TS hoạt động tốt; mô hình phát hiện bất thường dự đoán N bước tiếp theo rồi kiểm tra mức độ sai khác giữa giá trị đo thực tế và dự đoán.
Trong lĩnh vực công nghệ nước, các thiết bị IoT giám sát lưu lượng nước, phát hiện rò rỉ và ước tính lượng nước tiêu thụ theo từng thiết bị. Phát hiện rò rỉ là việc nhận diện các bất thường trong chuỗi thời gian, và do nhiệt độ đường ống biến đổi theo mùa nên có thể cần nhiều phân phối.
Trong dự án theo dõi hiệu năng, tôi đã cố gắng phát hiện bất thường nhưng thiếu một giải pháp mã nguồn mở hoặc thương mại phù hợp. Đây là một lĩnh vực còn nhiều cơ hội.
Sự phức tạp của quá trình tạo dữ liệu, tính không hoàn hảo của hệ thống đo lường, và sự tương tác với các tác nhân ác ý có thể gây ra các hiện tượng bất thường. Những sự kiện bất thường này biểu hiện dưới dạng anomaly trong dữ liệu thu thập.
Tôi đang vận hành một startup cho phát hiện bất thường chuỗi thời gian trong máy móc công nghiệp và đã phát triển một giải pháp chạy offline. Nếu bạn quan tâm đến phần mềm công nghiệp có tính bảo mật cao, hãy liên hệ.
Nghiên cứu về TSAD của Eamonn Keogh rất thú vị.
Tôi bối rối vì vì sao SVM lại được phân loại là “Distribution-Based”. Thông thường nó không ước lượng mật độ tự do mô hình hay phân phối dựa trên mô hình.
10 năm trước khi theo học thạc sĩ, tôi đã xây dựng một hệ thống dự đoán lỗi online, nơi chúng tôi phát hiện và đáp ứng trước khi lỗi xảy ra. Có rất nhiều công việc trong lĩnh vực này nhưng tiếc là không có cơ hội làm lại.