WeatherNext 2: Mô hình dự báo thời tiết tiên tiến nhất của Google DeepMind

(blog.google)

5 điểm bởi GN⁺ 2025-11-19 | 1 bình luận | Chia sẻ qua WhatsApp

WeatherNext 2 là mô hình dựa trên AI, cải thiện mạnh mẽ độ chính xác và hiệu quả của dự báo thời tiết toàn cầu
Tạo ra hàng trăm kịch bản thời tiết chỉ trong chưa đầy 1 phút trên một TPU, mang lại tốc độ dự báo nhanh hơn 8 lần so với các mô hình trước đây
Thông qua kiến trúc Functional Generative Network(FGN) mới, mô hình duy trì các dự báo nhất quán về mặt vật lý và hỗ trợ độ phân giải theo từng giờ
Dữ liệu dự báo có thể được sử dụng trên Earth Engine và BigQuery, đồng thời cung cấp khả năng suy luận tùy chỉnh thông qua chương trình truy cập sớm của Vertex AI
Công nghệ này nâng cấp các tính năng thời tiết trên toàn bộ dịch vụ của Google như Search, Gemini, Pixel Weather, Google Maps Platform

Tổng quan về WeatherNext 2

WeatherNext 2, do Google DeepMind và Google Research đồng phát triển, là một mô hình dự báo thời tiết dựa trên AI cung cấp tốc độ nhanh hơn 8 lần và độ phân giải theo từng giờ so với trước đây
- Tạo ra hàng trăm kịch bản thời tiết có thể xảy ra từ một đầu vào duy nhất
- Dự báo được hoàn tất trong chưa đầy 1 phút trên một TPU, trong khi các mô hình siêu máy tính dựa trên vật lý truyền thống cần mất nhiều giờ
Mô hình này cho thấy hiệu năng vượt trội hơn mô hình trước đó ở 99,9% biến số và thời gian dự báo (0~15 ngày) như nhiệt độ, tốc độ gió, độ ẩm
WeatherNext 2 cho phép dự báo độ phân giải cao trên toàn cầu và cũng được sử dụng để hỗ trợ ra quyết định cho các cơ quan khí tượng

Cách tiếp cận mô hình AI mới

WeatherNext 2 áp dụng một phương pháp mô hình hóa AI mới gọi là Functional Generative Network(FGN)
- Tiêm trực tiếp “nhiễu” vào cấu trúc mô hình để kết quả dự báo duy trì trạng thái thực tế về mặt vật lý và liên kết lẫn nhau
Cách tiếp cận này hữu ích cho cả dự báo “marginal” và “joint”
- Marginal là các yếu tố riêng lẻ (ví dụ: nhiệt độ tại một vị trí cụ thể, tốc độ gió theo độ cao, độ ẩm)
- Joint là hệ thống thời tiết quy mô lớn kết hợp nhiều yếu tố, thiết yếu để phân tích các hiện tượng phức hợp như khu vực nắng nóng hay dự báo sản lượng điện gió
Mô hình được huấn luyện chỉ bằng dữ liệu marginal, nhưng tự học các mẫu joint để thực hiện dự báo phức hợp

Truy cập và sử dụng dữ liệu

Dữ liệu dự báo của WeatherNext 2 được công khai trên Google Earth Engine và BigQuery
- Có thể tra cứu thông qua danh mục dữ liệu Earth Engine và BigQuery Analytics Hub
Trên Google Cloud Vertex AI, chương trình truy cập sớm cung cấp khả năng suy luận mô hình tùy chỉnh (inference)
Công nghệ này được tích hợp vào Search, Gemini, Pixel Weather, Weather API của Google Maps Platform, và trong tương lai cũng sẽ được áp dụng cho tính năng thông tin thời tiết của Google Maps

Từ nghiên cứu đến thực tế

WeatherNext 2 là một ví dụ về việc mở rộng thành quả nghiên cứu sang ứng dụng thực tế
- Thông qua công nghệ này, Google mở công cụ và dữ liệu để các nhà nghiên cứu, nhà phát triển và doanh nghiệp trên toàn thế giới có thể dùng vào việc giải quyết các vấn đề phức tạp
Trong tương lai, Google có kế hoạch tiếp tục cải thiện hiệu năng mô hình thông qua tích hợp các nguồn dữ liệu mới và mở rộng khả năng tiếp cận
Google cũng liên kết với Earth Engine, AlphaEarth Foundations, Earth AI nhằm tăng cường hệ sinh thái nghiên cứu AI địa không gian

Tài liệu bổ sung

Công bố bài báo (arXiv: 2506.10772) liên quan đến WeatherNext 2
Cung cấp tài liệu cho nhà phát triển, danh mục dữ liệu Earth Engine, ví dụ truy vấn BigQuery, trang đăng ký truy cập sớm Vertex AI
Các mô hình liên quan cũng được giới thiệu gồm GenCast (dự báo thời tiết cực đoan) và GraphCast (dự báo nhanh trên quy mô toàn cầu)

1 bình luận

GN⁺ 2025-11-19

Ý kiến trên Hacker News

Tôi đã đào khá sâu vào chủ đề này, và điều có thể khiến người ngoài thấy thú vị là các mô hình mới nhất như neuralgcm hay WeatherNext 1 đều được huấn luyện bằng hàm mục tiêu gọi là CRPS
Cách này hầu như không được dùng trong ML nói chung, tôi chỉ thấy nó trong dự báo thời tiết
Tóm lại, người ta thêm nhiễu ngẫu nhiên vào đầu vào rồi huấn luyện để vừa tối thiểu hóa loss thông thường (như L1), vừa tối đa hóa khác biệt giữa hai kết quả được tạo ra từ các giá trị khởi tạo nhiễu khác nhau
Tôi tự hỏi liệu cách tiếp cận này rồi có được áp dụng cho GenAI truyền thống hay không
- Tôi thắc mắc liệu nhiễu có phải được thêm vào tham số của mô hình chứ không phải đầu vào không
  Điều này làm tôi nhớ đến bài báo Variational Noise
  Nếu nhiễu được thêm vào đầu vào thì có vẻ sẽ giống các kỹ thuật SSL như DINO
- Gần đây tôi có làm một bài toán tối ưu hóa mà muốn cố ý tạo ra hai đầu ra khác nhau, nhưng không tìm được heuristic tốt
  Nó không liên quan đến GenAI, nhưng nếu biết đến cách CRPS này thì có lẽ đã hữu ích
- Cách tiếp cận này làm tôi nghĩ đến Variational Autoencoder
- Tôi muốn biết mục đích là gì mà lại dùng cách này thay vì loss L2
- Cần làm rõ rằng mô hình đúng là học từ dữ liệu quá khứ, nhưng khi dự báo thực tế thì nó vẫn được chạy ensemble nhiều lần với các quan sát mới
Gần đây tôi thấy dự báo thời tiết theo khu vực trên Google Search kém chính xác đi trông thấy
Vài tuần trước, nó liên tục dự báo nhiệt độ ban đêm sẽ xuống dưới 0, nhưng thực tế lại không như vậy
Khu vực của tôi vốn khó dự báo, nhưng các nguồn không phải của Google lại chính xác hơn hẳn
Tôi tự hỏi liệu rollout của mô hình mới đã diễn ra rồi nên khiến mọi thứ tệ hơn, hay ngược lại là sắp được cải thiện
Cũng muốn biết có trang nào cho phép so sánh hiệu năng dự báo của từng mô hình theo từng khu vực hay không
- API miễn phí của Open-Meteo khá hữu ích
  Nó có thể trực quan hóa dữ liệu dự báo theo từng mô hình và bao gồm nhiều mô hình lớn
  Chỉ là chưa có WeatherNext
- So sánh hiệu năng mô hình theo từng khu vực có vẻ là tính năng quá hiển nhiên, thế mà thực tế gần như không tồn tại. Tôi thắc mắc tại sao
Bài công bố nhấn mạnh vào tốc độ và số lượng kịch bản được cải thiện, nhưng tôi thấy thiếu giải thích về cải thiện độ chính xác
Câu như “WeatherNext 2 nhanh hơn 8 lần và cung cấp độ phân giải theo giờ” nghe rất hay, nhưng rốt cuộc với tư cách người dùng tôi chỉ muốn một bản dự báo chính xác
- Điểm quan trọng là người dùng cuối của sản phẩm này không phải là công chúng phổ thông
  Các chỉ số như điểm CRPS là dành cho chuyên gia, và chúng nhằm giải quyết vấn đề under-dispersion của các mô hình ensemble truyền thống
  Những cải tiến này cuối cùng sẽ là nền tảng để nâng độ chính xác của dự báo tất định mà người dùng phổ thông nhìn thấy
  Có thể xem công nghệ liên quan tại WeatherBench
- Với người dùng phổ thông thì phần giải thích còn thiếu
  Cốt lõi của dự báo thời tiết từ hàng chục năm nay là khái niệm các kịch bản ensemble, và “70% khả năng mưa” nghĩa là trong 100 kịch bản thì có 70 kịch bản có mưa
  Tức là không hề tồn tại một “bản dự báo chính xác” duy nhất
- Với tư cách người dùng, tôi cũng muốn thấy độ phân tán của bất định
  Nhiều ứng dụng thời tiết thể hiện điều này bằng hình ảnh khá tốt
- Benchmark quan trọng nhất là độ chính xác, và cần so sánh với các mô hình vật lý hiện có như GFS, ECMWF, v.v.
  Các mô hình này chạy trên những cụm HPC khổng lồ, nhưng vì chỉ cần tính toán tập trung rồi phân phối kết quả nên vẫn hiệu quả
- Đây là mô hình được huấn luyện trên dữ liệu quá khứ, nhưng có vẻ thiếu thành phần dựa trên vật lý
  Tôi muốn biết cơ sở vật lý cần thiết cho hiệu năng cao nằm ở đâu
Công cụ dự báo thời tiết của Google vốn đã rất xuất sắc, và dự báo đường đi bão trong mùa này chính xác đến mức đáng kinh ngạc
Trong khi đó, Global Forecasting System (GFS) của chính phủ Mỹ thì có vẻ ngày càng tệ đi
Bài liên quan: liên kết Ars Technica
- Tôi muốn biết cụ thể “GFS đang tệ đi” nghĩa là như thế nào
Đọc bài báo thì tôi không thấy nói rõ mô hình cần huấn luyện lại thường xuyên đến mức nào
Nếu cấu trúc của nó học phân bố theo từng khu vực, thì theo thời gian các mẫu sẽ thay đổi nên có lẽ cần huấn luyện lại định kỳ
Nếu mỗi tuần phải huấn luyện 3 ngày thì thực tế đó có thể trở thành bài toán chi phí
Điều này làm tôi nhớ đến một giai thoại thời Thế chiến II
Người ta kể rằng Kenneth Arrow phát hiện các dự báo dài hạn chẳng khác gì đoán ngẫu nhiên, nhưng cấp trên của ông lại trả lời rằng “dù biết là vô dụng, chúng tôi vẫn cần nó để lập kế hoạch”
- Tôi từng nghe trong lớp thống kê rằng thực ra thời tiết đẹp xuất hiện nhiều hơn thời tiết xấu rất nhiều
  Nên chỉ cần nói “không mưa” thì cũng đúng 90% rồi
  Điều mỉa mai là trước đây dự báo thời tiết còn kém chính xác hơn cả mức đó
  Các mô hình ngày nay thực sự chính xác đáng kinh ngạc, đến mức dự báo 10 ngày cũng gần như đúng
- Cũng có cách diễn giải rằng thuật bói toán thời cổ đại không chỉ là mê tín, mà là công cụ ra quyết định giúp con người hành động khi không thể tự quyết bằng cách chọn ngẫu nhiên
- Nó cũng gợi nhớ câu nói của Eisenhower: “Kế hoạch thì vô dụng, nhưng quá trình lập kế hoạch là điều thiết yếu”
Gần đây độ chính xác của ứng dụng thời tiết mặc định của Google đã giảm
Nhiều khi lệch khoảng 2~5 độ
Tôi đã thử ứng dụng Weawow do HN giới thiệu, tên thì không hay lắm nhưng độ chính xác rất tuyệt
Đây là ứng dụng khiến tôi hài lòng nhất từ trước đến nay
Tôi vẫn cảm thấy dự báo thời tiết dựa trên AI còn khá xa vời trong đời sống thực
So với thời bố mẹ tôi xem bản tin thời tiết trên TV, cảm nhận về độ chính xác dường như không khác biệt nhiều
Vẫn có những ngày dự báo nắng nhưng lại mưa như trút, hoặc dự báo mưa nhưng cả ngày lại nắng đẹp
Từ góc nhìn người tiêu dùng, có vẻ tiến bộ công nghệ chưa chuyển hóa thành độ tin cậy cảm nhận được trong thực tế
- Dữ liệu thì có: theo Our World in Data, độ chính xác dự báo đã cải thiện đều đặn
- Vấn đề nằm ở cách biểu đạt dữ liệu
  Ví dụ, trên Apple Weather, một “ngày mưa” được hiển thị như vậy chỉ cần có xác suất mưa cao ở bất kỳ thời điểm nào trong ngày
  Thực tế có thể chỉ mưa lúc 5 giờ sáng còn lại thì trời quang cả ngày
  Người dùng cần có khả năng diễn giải dữ liệu, và sẽ rất tốt nếu AI có thể đặt dự báo vào đúng ngữ cảnh theo mối quan tâm cá nhân của từng người
- Dự báo đang cải thiện đều đặn, nhưng đó là tiến hóa theo từng bước chứ không phải đột phá đột ngột
  Ví dụ, Weathergraph đã thêm dự báo mưa ngắn hạn của rainbow.ai, và đó là thứ chính xác nhất tôi từng dùng
  Bản thân dữ liệu radar cũng rất nhiễu, và quá trình làm sạch nó vốn đã là một mô hình ML
- Trên thực tế độ chính xác đã tăng rất nhiều
  Mức dự báo 1 ngày của 30 năm trước tương đương với độ chính xác của dự báo 4 ngày hiện nay
  Tuy nhiên không phải vì chúng ta hiểu thời tiết hơn, mà là nhờ năng lực tính toán tăng vọt
- Dự báo thời tiết thông thường vẫn chưa hoàn hảo
Tôi đã tự hỏi có thể dùng mô hình này ở đâu
Tôi đang tìm kiểu dự báo siêu địa phương như Dark Sky trước đây
- Giờ thì kết quả nghiên cứu này đã được tích hợp vào dịch vụ thực tế
  Dữ liệu dự báo của WeatherNext 2 có sẵn trong Earth Engine và BigQuery, đồng thời cũng có chương trình truy cập sớm trên Vertex AI cho suy luận tùy chỉnh
  Nó cũng đã được áp dụng trong Search, Gemini, Pixel Weather, Google Maps Platform Weather API
- Cá nhân tôi thích ứng dụng Windy nhất
  Nó cho phép so sánh chênh lệch dự báo giữa các mô hình, và hoạt ảnh vector gió rất thú vị về mặt trực quan
- Mô hình HRRR cũng rất xuất sắc
  Nó được cập nhật mỗi giờ và cung cấp dự báo 18 giờ với độ phân giải 15 phút, cũng như dự báo 48 giờ với độ phân giải 1 giờ
  Trang HRRR
- Trước đây Weather Underground từng tích hợp dữ liệu từ các trạm quan trắc thời tiết cá nhân
  Sau khi bị IBM mua lại thì đã thay đổi rất nhiều, nhưng có thể dự án đó vẫn còn tồn tại
- Cũng đáng tham khảo liên kết Weather API chính thức của Google
Tôi tự hỏi liệu mô hình đã cho ra dự báo bão chính xác nhất mùa này có phải là cùng một mô hình vừa được công bố lần này hay không
Bài liên quan: liên kết Ars Technica

WeatherNext 2: Mô hình dự báo thời tiết tiên tiến nhất của Google DeepMind

Tổng quan về WeatherNext 2

Cách tiếp cận mô hình AI mới

Truy cập và sử dụng dữ liệu

Từ nghiên cứu đến thực tế

Tài liệu bổ sung

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News