Intelligence artificielle & Météorologie : « On est à l’heure des révolutions ».

 

 

 

Intelligence artificielle & Météorologie : « On est à l’heure des révolutions ».

Comme de nombreuses sciences, la météorologie est bousculée par les innovations technologiques et l’intelligence artificielle. Désormais, plusieurs acteurs privés viennent concurrencer les centres de prévision traditionnels. Jusqu’où ces changements transformeront- ils le paysage des prévisions ? Chercheur permanent au Centre d’enseignement et de recherche en environnement atmosphérique (CEREA) de l’École des Ponts ParisTech, Alban Farchi nous livre son éclairage.   

 février 2024 - 6 mins de lecture
Crédit : Adobe Stock

Depuis 2020, vous collaborez avec le Centre européen pour les prévisions météorologiques à moyen terme (CEPMMT). Quel est votre rôle ?  

Un centre de météorologie a deux missions : produire des prévisions opérationnelles et faire de la recherche pour améliorer la précision des futures prévisions. Pour cela, il faut développer des algorithmes efficaces et précis. Mes recherches consistent à perfectionner ces algorithmes en fonction des données disponibles. Depuis 2019, nos équipes travaillent à combiner assimilation de données et apprentissage statistique 1 pour entraîner des réseaux de neurones à corriger les modèles de prévision. Autrement dit, au lieu de remplacer un modèle de prévision météo, qui repose sur des dizaines d'années d'expérience, comment le font de nombreux acteurs privés, nous proposons de lui adjoindre un modèle statistique (par exemple un réseau de neurones) pour améliorer la qualité des prévisions. 

Comment procédez-vous ?

Il faut numériser l’existant, le traduire mathématiquement. Par exemple, pour schématiser la Terre, ou une de ses régions, on définit une grille comportant des points dont le nombre détermine la précision de la discrétisation. Puis, pour chaque variable de notre modèle, on attribue une valeur par point de grille.

On distingue en général deux types de contributions : la dynamique à grande échelle, par exemple le transport par les vents, et la physique à petite échelle, comme la formation des nuages. La contribution physique s’appuie en grande partie sur des “paramétrisations sous maille”, qui représentent ce qui se passent à une échelle plus petite que la maille de la grille. Historiquement, ces paramétrisations sont construites et calibrées par des météorologues, sur la base de leur expertise.

Malgré tous les efforts des météorologues, les paramétrisations restent entachées d’erreurs. C’est là qu’intervient l’apprentissage statistique : en proposant des techniques pour calibrer des réseaux de neurones à corriger l’erreur modèle.

 
@ Alban Farchi, 2024

Pourquoi corriger un modèle est-il si complexe ?

Imaginez : une image de la Terre entière avec toutes les variables (température, pression, etc.) représente plusieurs giga-octets. Arriver à calibrer une correction là-dessus, c'est très ambitieux d’un point de vue technique. Cela signifie ingérer de très nombreuses données et ensuite leur donner du sens. La plupart des méthodes utilisent une base de données historique sur 40 ans. Multipliez par 365 jours puis par le nombre d’images par jour, c’est énorme ! L’entraînement des réseaux de neurones est donc très coûteux en temps de calcul. En tant que chercheurs, nous avons à être très réalistes pour exploiter au mieux nos quelques ressources technologiques.  

Comment faites-vous ?  

Une première solution consiste à réduire la résolution de la schématisation dont nous parlions et donc de notre grille. En général, nous nous basons sur quelque chose comme 32 points en latitude et 64 points en longitude. Soit seulement 2048 points au total sur la Terre. C’est une approximation très grossière, mais dans la mesure où nous travaillons sur l'erreur du modèle qui est souvent à grande échelle, nous arrivons à représenter les phénomènes ciblés avec plus ou moins de succès. 

Les prévisions météorologiques ont une valeur considérable. Elles impactent notre agriculture, nos armées, notre vie courante, notre économie... Aujourd’hui, à l’image de Google (GraphCast), Microsoft (Climax), Huaweï (Pangu-weather) ou NVIDIA (FourCastNet), de grandes multinationales investissent ce domaine en s’appuyant uniquement sur l’intelligence artificielle. Et elles prétendent que leurs modèles sont au moins aussi précis et plus rapides que les meilleurs modèles basés sur la physique. Qu’en est-il ?

Ces nouveaux acteurs privés développent leurs propres modèles de prévision et prétendent concurrencer les grands centres de prévision traditionnels. S’il est vrai qu’en matière de performance pure, ces modèles sont plus précis que les modèles physiques, ils ont tendance à produire des prévisions qui ne sont pas toujours cohérentes d’un point de vue physique et donc en général instables sur le long terme. En revanche, il est indéniable que ces nouveaux modèles sont plus rapides de plusieurs ordres de grandeur. Là où on utilisait jusqu’ici des CPU (unité centrale de calcul, UCC ; en anglais « central processing unit »), ces groupes s’appuient sur une architecture basée sur des supercalculateurs graphiques tels que les GPU (processeur graphique ; en anglais Graphics Processing Unit), capables de faire des opérations matricielles bien plus rapides. Mais, le différentiel en temps de calcul s’explique aussi par la méthode choisie. La méthode du statisticien sera construite autour des avantages proposés par les GPU, tandis que celle du physicien sera basée sur les équations du modèle et sur des schémas numériques qui comportent en général plus d’opérations élémentaires.

Depuis quand s’interroge-t-on sur ce que l’IA pourrait apporter à la météorologie ?

Il y a 5 ans, la majeure partie de la communauté scientifique était franchement sceptique par rapport à l’intérêt de l’IA, à l’image par exemple du CEPMMT qui a publié une comparaison entre modèles physiques et modèles statistiques. À l’époque il n’y avait pas débat : les implémentations des modèles statistiques étaient encore relativement naïves et loin d’égaler les performances des modèles météorologiques existants. Mais ces premières initiatives de « machine learning » n’étaient pas menées par des spécialistes de la prévision et, par la suite, les compagnies internationales ont débauché des météorologues pour les aider à concevoir des architectures efficaces et adaptées.

Puis début 2022, NVIDIA a lancé FourCastNet (pour Fourier Forecasting Neural Network) et pour la première fois, une équipe privée publiait un modèle qui retient l’attention. Malgré toutes les réserves, il s’agissait d’un modèle à grande échelle, produisant des images plus ou moins réalistes et à des temps de calculs très réduits. Cela a marqué un tournant.

Face à ces nouvelles perspectives, chercheurs et centres de prévision doivent-ils adopter une stratégie plus proactive vis-à-vis des techniques d'intelligence artificielle ?

Un exemple : ces derniers mois, le CEPMMT a considérablement remanié son organisation et actuellement, deux voies sont explorées. La première consiste à s'approprier les méthodes développées par les géants du privé en reproduisant voire en améliorant leurs modèles de sorte à établir une comparaison objective avec le modèle traditionnel. La deuxième approche, celle à laquelle nous œuvrons, vise à créer un modèle hybride, combinant IA et modèles traditionnels, autrement dit statistique et physique, pour obtenir une meilleure précision. C’est selon nous la démarche la plus prometteuse car les systèmes purement basés sur les réseaux de neurones présentent eux aussi des faiblesses. Par exemple, dans le temps long, ils ont tendance à lisser les prévisions, c’est-à-dire à donner moins de résolution que sur une échéance plus courte.  Or, le modèle physique, lui, va conserver sa résolution quel que soit l'horizon temporel parce qu’il a été calibré pour cela.

Dans ce contexte, comment le métier d’ingénieur est-il impacté ?

Son centre de gravité se déplace. Il n’est plus purement basé sur la physique. Il doit aussi être en mesure de construire un réseau de neurones et de le faire dialoguer avec le modèle physique. Mais n’oublions pas : idéalement, c'est quand même le météorologue, par son expertise, qui a la légitimité pour dire quelle correction statistique appliquer. Dans le cas de méthodes hybrides, il saura où placer le curseur pour équilibrer le modèle, et dans le cas des méthodes purement statistiques, il saura expliquer ce que le réseau de neurones doit produire.

Et demain, que peut-on imaginer dans le champ des prévisions ?

Est-ce qu’en 2030, le travail que l'on a accompli sera encore utilisé ou considéré comme totalement obsolète ? C'est difficile de le savoir. À l'heure actuelle, une transition s’opère et deux branches s'affrontent, modèles hybrides contre modèles purement statistiques. Et qui sait si cette dernière voie ne dominera pas dans les années à venir ?  Mais attention, jusqu’ici on parlait seulement de l’aspect prévision. Or, pour effectuer une prévision, il faut au préalable assimiler les observations récoltées pour calibrer le modèle. Pour l’instant, les modèles à réseau de neurones ne sont pas conçus pour cette tâche. Ce qui signifie que les modèles hybrides ont aujourd’hui un avantage. Mais tout va très vite, on est à l’heure des révolutions. Certaines équipes travaillent déjà à l’utilisation de réseaux de neurones pour l’assimilation de données. Par nature, les observations sont “déstructurées” et pour les rendre lisible par un réseau, cela semble peu évident. Mais il y a cinq ans, on avait le même scepticisme quant à la prévision.  Quoi qu’il en soit, c’est un sujet que l’on va sans doute investir très vite avec nos équipes. 

Propos recueillis par Stéphan Lemonsu.

  1. Dans le domaine de la météorologie, l'intelligence artificielle se traduit essentiellement par l'apprentissage automatique (ou apprentissage statistique - machine learning en anglais) et en particulier l'apprentissage profond (deep learning en anglais) c'est-à-dire les réseaux de neurones. Un modèle statistique est un modèle qui s'entraîne par apprentissage automatique et en général il s'agit d'un réseau de neurones. ↩︎

 

Références :