xLSTMTime: Long-term Time Series Forecasting With xLSTM
- Trong vài năm gần đây, các mô hình dựa trên Transformer đã cho thấy hiệu năng nổi bật trong dự báo chuỗi thời gian dài hạn đa biến (LTSF). Tuy nhiên, chúng vẫn gặp phải các vấn đề như yêu cầu tính toán cao, khó nắm bắt động lực theo thời gian và quản lý các phụ thuộc dài hạn
- Sự xuất hiện của LTSF-Linear với cấu trúc tuyến tính đơn giản đã cho thấy hiệu năng vượt qua các mô hình dựa trên Transformer, từ đó khiến người ta phải đánh giá lại tính hữu dụng của Transformer trong dự báo chuỗi thời gian
- Để đáp lại điều đó, bài báo này trình bày kết quả áp dụng kiến trúc gần đây là mở rộng LSTM (xLSTM) vào LTSF. xLSTM có tiềm năng phù hợp với LTSF nhờ cơ chế exponential gating và cấu trúc bộ nhớ được sửa đổi với dung lượng cao hơn
- xLSTMTime, kiến trúc LTSF mà chúng tôi áp dụng, vượt qua các phương pháp hiện tại. Kết quả so sánh hiệu năng giữa nhiều mô hình hiện đại và xLSTMTime trên nhiều bộ dữ liệu thực tế đã chứng minh khả năng dự báo vượt trội của mô hình này
- Kết quả nghiên cứu của chúng tôi cho thấy các kiến trúc hồi quy được tinh chỉnh có thể cung cấp một phương án thay thế cạnh tranh cho các mô hình dựa trên Transformer trong các tác vụ LTSF, đồng thời gợi mở khả năng tái định hình bức tranh dự báo chuỗi thời gian
Tóm tắt của GN⁺
- Bài báo này giới thiệu xLSTM nhằm khắc phục những hạn chế của các mô hình dựa trên Transformer và cho thấy hiệu năng vượt trội trong dự báo chuỗi thời gian dài hạn
- xLSTMTime chứng minh khả năng dự báo vượt trội so với các mô hình hiện có thông qua cơ chế exponential gating và cấu trúc bộ nhớ được sửa đổi
- Nghiên cứu này làm nổi bật lại tiềm năng của kiến trúc hồi quy trong dự báo chuỗi thời gian và đề xuất một phương án thay thế mới cho các mô hình dựa trên Transformer
- Các dự án có chức năng tương tự gồm có Prophet của Facebook và DeepAR của Amazon
1 bình luận
Bình luận trên Hacker News