10 điểm bởi GN⁺ 2024-05-09 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Mô hình nền tảng dành cho dự báo chuỗi thời gian do Google Research phát triển
    • Được tiền huấn luyện trên 100 tỷ điểm dữ liệu chuỗi thời gian thực tế
    • Cho thấy hiệu năng zero-shot vượt trội trên nhiều benchmark công khai
    • Có thể áp dụng cho các bộ dữ liệu thuộc nhiều lĩnh vực và đơn vị thời gian khác nhau
  • Dự báo chuỗi thời gian được sử dụng rộng rãi trong nhiều lĩnh vực như bán lẻ, tài chính, sản xuất, y tế và khoa học tự nhiên
    • Ví dụ, trong lĩnh vực bán lẻ, việc cải thiện độ chính xác của dự báo nhu cầu góp phần giảm chi phí tồn kho và tăng doanh thu
  • Sự trỗi dậy của các mô hình deep learning
    • Các mô hình deep learning đã được sử dụng rộng rãi trong dự báo chuỗi thời gian nhờ chứng minh hiệu năng xuất sắc trong nhiều thiết lập khác nhau
    • Trong cuộc thi M5, các mô hình deep learning cũng đạt thành tích tốt
  • Sự phát triển của các mô hình ngôn ngữ lớn
    • Các mô hình ngôn ngữ lớn dùng cho các tác vụ xử lý ngôn ngữ tự nhiên như dịch thuật, tạo sinh dựa trên truy xuất và hoàn thiện mã đang phát triển rất nhanh
    • Chúng được huấn luyện trên lượng lớn dữ liệu văn bản và có khả năng nhận diện các mẫu ngôn ngữ
    • Khi kết hợp với tìm kiếm, chúng có thể được dùng như công cụ zero-shot mạnh mẽ để trả lời câu hỏi và tóm tắt các sự kiện hiện tại
  • Hạn chế của các mô hình dự báo dựa trên deep learning
    • Dù cho hiệu năng tốt hơn các phương pháp truyền thống, chúng vẫn gặp khó khăn trong việc giảm chi phí huấn luyện và suy luận
    • Cần một chu kỳ huấn luyện và kiểm chứng dài trước khi có thể kiểm thử mô hình trên dữ liệu chuỗi thời gian mới
  • TimesFM là mô hình nền tảng chỉ dùng decoder cho dự báo chuỗi thời gian
    • Một mô hình dự báo duy nhất được tiền huấn luyện trên 100 tỷ dữ liệu chuỗi thời gian thực tế
    • Có 2 triệu tham số, nhỏ hơn rất nhiều so với các mô hình ngôn ngữ lớn hiện đại
    • Trên các bộ dữ liệu thuộc nhiều lĩnh vực và đơn vị thời gian khác nhau, mô hình cho hiệu năng zero-shot tiệm cận các phương pháp học có giám sát tiên tiến nhất
    • Cung cấp ngay các dự báo phù hợp cho dữ liệu chuỗi thời gian chưa từng thấy mà không cần huấn luyện bổ sung
    • Giúp người dùng tập trung vào việc cải thiện dự báo cho các tác vụ downstream thực tế như lập kế hoạch nhu cầu bán lẻ
  • Bài báo: "A decoder-only foundation model for time-series forecasting", dự kiến được trình bày tại ICML 2024

Ý kiến của GN⁺

  • Đây là một mô hình dự báo chuỗi thời gian mới có vẻ đầy hứa hẹn, nhưng có lẽ vẫn cần được kiểm chứng thêm trên nhiều trường hợp sử dụng thực tế khác nhau. Đặc biệt, việc chưa hỗ trợ dự báo xác suất là một điểm còn đáng tiếc về mặt tính thực tiễn
  • Việc giá trị tần suất đưa vào đầu vào không nhất thiết phải phản ánh đúng tần suất thực của dữ liệu chuỗi thời gian mà có thể điều chỉnh tùy ý là điều thú vị, nhưng có vẻ cần thử nghiệm theo từng bộ dữ liệu và từng trường hợp sử dụng để xác định giá trị tối ưu
  • Checkpoint công khai đầu tiên tập trung vào chuỗi đơn biến, vì vậy có thể kỳ vọng một phiên bản hỗ trợ dự báo đa biến. Có lẽ cũng cần so sánh hiệu năng trên các bộ dữ liệu benchmark dự báo chuỗi thời gian đa biến
  • Khi áp dụng mô hình này, sẽ cần nhân sự có chuyên môn để lựa chọn và tinh chỉnh mô hình phù hợp với các thuộc tính của chuỗi thời gian cần dự báo (độ dài, phân phối, tính mùa vụ, tần suất, v.v.) và horizon dự báo mong muốn. Việc cung cấp API suy luận end-to-end có vẻ giúp việc sử dụng dễ dàng hơn, nhưng cũng cần cân nhắc các giới hạn của mô hình hộp đen
  • Một số thư viện dự báo chuỗi thời gian tương tự khác gồm có Kats của Meta, GluonTS, Darts và sktime. Nên so sánh đặc điểm cùng ưu nhược điểm của từng thư viện rồi chọn mô hình phù hợp nhất với dữ liệu thực tế

Chưa có bình luận nào.

Chưa có bình luận nào.