L’intelligence artificielle pour la prévision du temps

PDF

L’intelligence artificielle (IA), et en particulier les méthodes d’apprentissage profond utilisant les réseaux de neurones, a été exploitée avec succès dans un grand nombre d’applications ces dernières années. La prévision météorologique compte parmi les domaines d’application prometteurs, avec des utilisations de l’IA potentiellement nombreuses et susceptibles de conduire à des avancées méthodologiques majeures, associées à des gains significatifs en performance et en qualité. Au travers de quelques premières réalisations, cet article présente le potentiel de l’IA pour les différentes étapes de la prévision météorologique, de son calcul à son exploitation et sa communication. Les nouvelles questions et défis que pose l’utilisation de ces techniques sont également discutés.

1. L’Intelligence Artificielle, de quoi parle-t-on ?

Définir précisément l’intelligence artificielle est une première difficulté. Dans la suite, nous considèrerons qu’il s’agit d’un vaste ensemble de techniques, notamment mathématique et informatique, dont l’objectif est de reproduire certains aspects de l’intelligence humaine (raisonnement, créativité, par exemple). Loin d’être nouvelle, l’IA est apparue dès les années 1950, d’abord principalement sous la forme de systèmes experts : l’humain établit un ensemble de règles et d’instructions que la machine exécute. Les méthodes d’IA parmi les plus utilisées et les plus performantes aujourd’hui suivent une tout autre approche : l’humain ne prescrit plus de règles mais développe des programmes informatiques capables d’apprendre les meilleures relations dans les données. C’est ce qu’on appelle l’apprentissage machine (machine learning), dont la structure algorithmique s’appuie essentiellement sur des réseaux de neurones profonds (deep learning).

Réseau de neurones bicouche
Figure 1. Un réseau de neurones constitué d’une première couche contenant le signal d’entrée, d’une couche de sortie (la prévision du réseau), et de deux couches dites ‘cachées’, composées chacune de 5 neurones. Plus le nombre de couches cachées est grand plus le réseau est profond. Les traits noirs matérialisent les interactions entre les neurones des couches successives. [Source : tpe-ia.lescigales.org/maths.php]
Inspiré par le fonctionnement des neurones biologiques, un réseau de neurones artificiels est un ensemble de neurones structuré en plusieurs couches (Figure 1), qui transforme un signal d’entrée (par exemple la température à un instant t) en un signal de sortie (par exemple la température à l’instant t+1 heure). C’est dans la phase d’apprentissage (ou d’entraînement) qu’un réseau de neurones apprend sur des données, et de façon itérative, à résoudre le problème qui lui est posé (dans l’exemple précédent, prévoir la température une heure plus tard). Concrètement, cette étape consiste à calibrer les connexions entre les différentes couches de neurones (que l’on appelle également les poids du réseau), de façon à fournir la réponse la plus satisfaisante possible au problème posé. L’apprentissage d’un réseau de neurones nécessite d’une part des jeux de données d’entrée et de sortie suffisamment grands et représentatifs de l’ensemble des situations possibles, d’autre part des ressources de calcul importantes. La phase d’entraînement peut en effet être longue et coûteuse, d’autant plus que la complexité du problème, du réseau de neurones et des données est grande. Une fois le réseau entraîné, il peut être utilisé en inférence, c’est-à-dire comme modèle prédictif appliqué sur de nouvelles données. Contrairement à l’entraînement, cette étape d’inférence est très rapide.

Les réseaux de neurones formels ont été proposés dès les années 1940, mais ont été relativement peu exploités avant les années 2000. C’est l’augmentation de la puissance de calcul, et notamment l’arrivée des processeurs graphiques (les « GPU »), ainsi que la disponibilité de jeux de données massifs, qui ont permis à ces approches un retour en force depuis les années 2010.

Dans la suite de cet article, le terme d’IA sera principalement utilisé pour désigner les méthodes utilisant des réseaux de neurones profonds. Les réseaux de neurones convolutifs, introduits par Le Cun et al. [1], et spécifiquement conçus pour traiter des images en entrée, sont l’une des principales techniques appliquées à la prévision météorologique.

2. L’IA pour la prévision du temps

La prévision météorologique est le résultat d’une séquence d’étapes complexes dont l’élément central est le modèle de prévision (lire Les modèles de prévision météorologique). Des évolutions du modèle sont régulièrement proposées par les services météorologiques pour améliorer la qualité des prévisions. Il est notamment classique d’augmenter les résolutions des grilles de calcul et de complexifier la représentation des processus physiques. Il s’agit néanmoins dans les deux cas d’évolutions coûteuses, en développement et surtout en ressources de calcul. Les algorithmes d’IA, au contraire, présentent l’avantage d’être extrêmement rapides dans leur phase d’inférence. Ainsi, la résolution d’un problème physique complexe par l’IA est généralement de plusieurs ordres de grandeur inférieure aux approches classiques, qui nécessitent souvent de résoudre plusieurs centaines voire milliers d’équations. Cela fait de l’IA un outil potentiellement intéressant pour accélérer le calcul des prévisions, entre autres.

L’utilisation de l’IA en météorologie n’est pas nouvelle. Dès les années 1990, les techniques d’IA ont permis des développements novateurs dans le post-traitement statistique des prévisions météorologiques. Diverses applications ont par exemple été développées pour réduire les erreurs systématiques des prévisions [2]. En revanche, ce n’est que récemment que l’utilisation de l’IA s’est étendue au cœur de la modélisation atmosphérique.

2.1 Modèle physique et modèle d’IA : quelles différences ?

Les modèles physiques, dont les modèles de prévision météorologique actuellement opérationnels sont un exemple, sont construits à partir de la connaissance experte du fonctionnement du système étudié (l’atmosphère, dans le cas de la météo), traduite le plus souvent sous forme d’équations. Ces modèles ont l’avantage d’être interprétables physiquement, mais ils restent des approximations du système réel, limitées par notre compréhension des processus en jeu et par les contraintes imposées par les ressources de calcul.

Figure 2. Différentes approches de modélisation pour la prévision météorologique. [Schéma de l’auteur]
Les modèles d’IA fonctionnent de manière très différente puisqu’ils apprennent eux-mêmes, à partir de très grands jeux de données, les meilleures relations, statistiques, permettant de passer des données d’entrée aux données de sortie. En comparaison aux modèles physiques, les modèles d’IA sont moins interprétables (souvent qualifiés de « boîte noire ») et n’offrent pas de garantie sur le respect des lois physiques, mais ils peuvent permettre de découvrir des relations complexes, encore non comprises ou identifiées par les scientifiques.

Reprenons l’exemple de la prévision de température à une heure d’échéance. Son calcul avec un modèle physique revient à résoudre des équations bien connues prescrites par l’humain, tandis que son calcul avec un modèle d’IA consiste à appliquer une suite de relations statistiques apprises par un réseau de neurones sur les données durant la phase d’apprentissage. Modélisation physique et modélisation ‘IA’ sont donc deux approches très différentes dans leur fondement, mais également complémentaires, pour résoudre un problème donné (Figure 2).

2.2 Vers une hybridation des approches physique et IA pour la modélisation atmosphérique

Comme illustré Figure 2, l’intégration de l’IA dans le processus de prévision peut se faire sous différentes formes. La complémentarité des approches physique et IA a initialement motivé le développement de systèmes de prévision « hybrides », combinant la modélisation physique et l’IA. Il s’agit par exemple de remplacer les éléments les plus coûteux ou les moins bien représentés d’un modèle physique par un algorithme d’IA. D’autres travaux ont exploré la possibilité d’exploiter l’IA pour améliorer certaines caractéristiques des prévisions (par exemple la finesse de l’échantillonnage spatial), et in fine leur qualité, à moindre coût. Plusieurs exemples de prévisions hybrides sont présentés dans la suite.

Les paramétrisations physiques, qui simulent les effets des processus de fine échelle tels que le rayonnement, la convection ou la turbulence, sont actuellement parmi les composants les plus coûteux d’un modèle, ainsi qu’une des principales sources d’incertitude des prévisions météorologiques (et climatiques). Plusieurs travaux ont commencé à examiner la possibilité de remplacer tout ou partie de ces paramétrisations par des algorithmes d’IA, avec des premiers résultats prometteurs [3]. L’exemple présenté Figure 3 indique une très bonne cohérence entre les précipitations prévues par un modèle physique et par un modèle hybride, dans lequel les processus associés à la convection profonde sont appris par un réseau de neurones.

Figure 3. Moyennes annuelles des précipitation (en millimètre par jour) calculées avec (à gauche) un modèle de prévision physique et (à droite) un modèle hybride physique-IA. [Source : Blanka Balogh, reproduit avec la permission de l’auteur]
Augmenter la résolution spatiale du modèle de prévision permet de mieux décrire les phénomènes météorologiques de petite échelle. C’est particulièrement important pour la prévision d’événements à fort impact comme les orages, le brouillard, l’îlot de chaleur urbain, mais au prix d’une augmentation significative, voire rédhibitoire, du coût de calcul. La descente d’échelle statistique est une alternative à l’augmentation de résolution du modèle, qui consiste à apprendre une relation statistique entre des prévisions à basse résolution et des prévisions à plus haute résolution. Il est ainsi possible de simuler des prévisions à l’échelle locale en appliquant directement cette relation aux prévisions d’un modèle physique à plus basse résolution. Plusieurs études ont démontré la capacité des réseaux de neurones à résoudre efficacement ce problème [4]. Un exemple est présenté Figure 4 pour la descente d’échelle par IA d’une prévision de température.

Figure 4. Prévision de température calculée par (à gauche) un modèle physique à basse résolution, (milieu) une descente d’échelle IA de la prévision basse résolution et (à droite) un modèle physique à haute résolution. [Source : Antoine Doury, avec la permission de l’auteur]
Le dernier exemple concerne la prévision d’ensemble, utilisée pour caractériser les différents scénarios d’évolution possibles grâce à la réalisation en parallèle de plusieurs prévisions (lire La prévision d’ensemble). La prévision d’ensemble est désormais au cœur de la stratégie de nombreux services de prévision, mais ses caractéristiques, et en particulier le nombre de réalisations (aussi appelées « membres »), restent fortement contraintes par les ressources de calcul disponibles. Les prévisions d’ensemble utilisées de façon opérationnelle n’utilisent pas plus de 50 membres, alors qu’une estimation précise des distributions de probabilité de l’état futur de l’atmosphère en requiert plusieurs centaines ou milliers. L’IA pourrait-elle permettre de générer des réalisations supplémentaires en se substituant au modèle de prévision ? Des travaux récents [5] apportent de premiers éléments de réponse encourageants. S’appuyant sur des algorithmes d’IA générative (une catégorie d’IA utilisée pour créer de nouveaux contenus, et popularisée par des applications telles que ChatGPT ou DALL.E), ils montrent qu’il est possible de produire des champs météorologiques réalistes guidés par les simulations physiques, et ouvrent ainsi la voie à des prévisions d’ensemble hybrides de plusieurs dizaines voire centaines de membres.

2.3 Vers des modèles atmosphériques entièrement basés sur l’IA ?

Les précédents exemples ont montré comment l’IA peut compléter les systèmes de prévision météorologique physiques pour en améliorer les performances computationnelles et la qualité. Une nouvelle étape a récemment été franchie par plusieurs équipes de recherche, qui ont proposé de remplacer complètement le modèle de prévision physique par un modèle d’IA. C’est en 2022 et 2023 qu’une succession de travaux attaque le problème de la prévision météorologique globale à moyenne échéance par IA [6]. Contre toute attente, les modèles d’IA tels que Pangu-Weather ou GraphCast, entraînés sur plus de 40 ans de données historiques, rivalisent désormais sur certains aspects avec le modèle physique du Centre Européen de Prévision Météorologique à Moyen Terme (CEPMMT), considéré comme le meilleur modèle de prévision opérationnel actuellement. Les prévisions quotidiennes de ces nouveaux modèles n’ont pas tardé à être diffusées publiquement, le lecteur intéressé pourra les visualiser par exemple sur https://www.meteociel.fr/modeles/ecmwf_aifs.php et https://charts.ecmwf.int/.

Bien que ces modèles IA fournissent une représentation encore très partielle de l’atmosphère, loin de celle produite par les modèles physiques, et avec des faiblesses bien identifiées, la démonstration est faite qu’il est possible de prévoir une partie des paramètres météorologiques, avec une certaine qualité (Figure 5). Ces nouveaux modèles sont également capables d’anticiper plusieurs jours à l’avance les événements à fort impact tels que les tempêtes [7] ou les cyclones tropicaux.

Figure 5. Prévision de température (plage de couleur) et de vent (barbules), calculée par le modèle physique Arpège de Météo-France (à gauche) et le modèle IA PanguWeather (à droite) sur le domaine Europe-Atlantique. [Source : Météo-France]
Un atout indéniable des modèles IA est leur efficacité en coût de calcul lorsqu’ils sont utilisés en inférence. Les temps de production des prévisions à plusieurs jours d’échéance sont de quelques secondes ou minutes, soit bien inférieurs à ceux des modèles de prévision physiques qui se comptent en dizaines de minutes, voire plus. Ces premiers modèles IA ouvrent ainsi un nouveau champ de recherche avec de multiples questions scientifiques et techniques, et des opportunités nouvelles pour la prévision opérationnelle.

Pour que ces modèles IA deviennent de nouveaux outils exploitables pour la prévision du temps opérationnelle, et plus généralement pour toutes les applications nécessitant des données météorologiques, il reste néanmoins de nombreux verrous à lever. Le premier enjeu est de développer des modèles adaptés aux besoins des usagers, entraînés sur des données à très haute résolution spatiale, et capables de prévoir les variables météorologiques d’intérêt et les incertitudes associées. Cela soulève la question de la disponibilité et de l’accessibilité de ces jeux de données, et de la capacité à mobiliser des ressources de calcul conséquentes pour des entraînements pouvant atteindre plusieurs semaines. Le second enjeu est la mise au point de méthodes et de diagnostics d’interprétabilité et d’explicabilité de ces modèles. A l’instar des modèles physiques, il est légitime de pouvoir déterminer si l’IA a produit une bonne prévision pour les bonnes raisons ou, en cas de mauvaises prévisions, quels composants des réseaux de neurones sont en cause. Une perspective sous-jacente est le développement de réseaux de neurones informés par la physique, pour forcer les modèles à produire des solutions physiquement cohérentes.

3. L’IA pour l’expertise et la communication des prévisions

3.1 L’IA et les prévisionnistes

La prévision météorologique, qu’elle soit produite par un modèle physique ou un modèle d’IA, nécessite d’être expertisée par l’humain pour élaborer les bulletins, la vigilance, ou l’assistance à différents secteurs d’activité (lire Le rôle du prévisionniste). La production opérationnelle tend à évoluer vers une augmentation de l’information mise à disposition des utilisateurs, avec des prévisions rafraîchies plus fréquemment et effectuées sous forme d’ensembles. La quantité de données à expertiser est donc toujours plus grande, dans des temps qui restent souvent très contraints.

L’IA offre de nouvelles opportunités pour faciliter l’expertise humaine des prévisions opérationnelles. Ce sont en particulier ses capacités pour la reconnaissance de formes et la classification automatique qui peuvent être exploitées, afin d’extraire et de résumer l’information pertinente des grands volumes de données de prévisions ou d’observations. Deux exemples d’application sont présentés dans la suite.

Figure 6. Prévision de pluie (en plage de couleur, unité : millimètres par heure). L’orage de type ‘écho arqué’ détecté sur le Nord-Est de la France par un algorithme d’IA est délimité par le contour noir. [Source : Arnaud Mounier, avec l’autorisation de l’auteur]
L’élaboration de la prévision expertisée repose depuis des décennies sur la reconnaissance de structures météorologiques et de schémas conceptuels. Il s’agit par exemple, dans les prévisions des modèles, d’identifier la présence, de localiser et de caractériser des événements tels que les dépressions, les cyclones tropicaux, les structures orageuses. Ce travail long et fastidieux a longtemps été réalisé ‘à la main’ par les prévisionnistes. Dans de nombreux domaines, l’IA a montré de très bonnes performances pour effectuer de la détection d’objets, elle excelle par exemple à reconnaître des chiens et des chats dans des images. La transposition à la détection d’objets météorologiques est assez directe. En utilisant comme données d’entrée des cartes de pluie, de vent ou de pression, un réseau de neurones peut être entraîné à reconnaître des structures d’intérêt. La Figure 6 présente le résultat d’une IA entraînée à détecter un type d’orage particulièrement violent appelé ‘écho arqué’ (pour sa structure en forme d’arc). La synthèse de ces détections dans un grand nombre de prévisions peut ensuite fournir des produits utiles pour quantifier le risque d’occurrence d’un tel événement, et plus généralement pour la prise de décision [8].

Figure 7. La classification de plusieurs prévisions valides pour un même événement fait apparaître deux localisations privilégiées pour les pluies les plus fortes, représentées par les zones en violet et bleu. [Source : Arnaud Mounier, avec l’autorisation de l’auteur]
Une autre utilisation de l’IA concerne la synthèse de l’information de plusieurs dizaines de prévisions en un nombre limité de scénarios représentatifs, tels que le scénario majoritaire (celui qui se dégage préférentiellement de l’analyse des différentes prévisions) et quelques scénarios alternatifs (moins probables mais à ne pas écarter, en raison des incertitudes de prévision ou des risques associés à ces scénarios). Les méthodes de classification automatique, visant à regrouper des informations similaires au sein d’une même classe, sont particulièrement adaptées pour traiter ce problème. Cette approche peut par exemple être utilisée pour identifier les principaux scénarios de précipitations se dégageant d’un ensemble de plusieurs dizaines de prévisions (Figure 7).

3.2 L’IA et la communication des prévisions météo

Si l’IA est un outil pouvant être intégré tout au long de la chaîne de prévision, de la modélisation à son expertise, humaine et automatique, elle pourrait également changer la façon dont les prévisions seront communiquées ou accessibles aux usagers. L’IA, sous des formes plus ou moins sophistiquées, se cache déjà derrière certaines productions automatiques, qui alimentent par exemple des applications mobiles. Les nouveaux outils d’IA conversationnelle offrent aussi une nouveau moyen d’accès à l’information météo, permettant une formulation explicite de la demande de l’usager (Figure 8). L’IA pourrait-elle aller jusqu’à remplacer les présentateurs météo ? Une première réponse a été récemment apportée par la Suisse (Figure 9). Ces technologies en sont encore à leurs débuts, mais elles pourraient bien être les prémices d’un nouveau standard de communication et d’interaction avec les usagers.

Figure 8. Extrait d’un échange avec l’outil d’IA conversationnelle Copilot.
Figure 9. Vidéo de Jade, un avatar généré par l’IA, présentant la météo en Suisse. Copie d’écran de la page web Météo de Jade – 20 avril 2023 – M le Média. Lien vers la vidéo

4. Messages à retenir

  • Les méthodes d’IA ont investi différents secteurs d’activité, et la prévision météorologique ne fait pas exception. La disponibilité de grands jeux de données et l’augmentation des ressources de calcul ont permis de développer des algorithmes d’IA performants, pouvant être appliqués dans les différentes étapes qui constituent la chaine de prévision météorologique opérationnelle. Si la plupart de ces réalisations sont encore à l’état de recherche, leur exploitation opérationnelle semble désormais envisageable à court ou moyen terme.
  • L’élément le plus inattendu et potentiellement le plus impact est l’avènement des modèles de prévision météorologique entièrement basés sur l’IA. Alors que le développement incrémental de la prévision numérique du temps depuis les années 1950 est souvent qualifié de ‘révolution lente’, c’est une révolution beaucoup plus rapide qui semble se mettre en marche avec l’IA. C’est aussi un nouveau pan de recherche qui s’ouvre devant les services météorologiques, avec de nouveaux enjeux scientifiques et techniques.
  • Ces progrès de l’IA ne doivent néanmoins pas faire perdre de vue la poursuite des travaux d’amélioration des modèles de prévision basés sur la physique, qui restent d’une importance capitale. Il ne s’agit pas, à ce stade, de remplacer l’un par l’autre, mais d’exploiter la complémentarité de ces deux approches

    Notes et références

    Image de couverture. Image créée par l’auteur et générée par DALL.E, une IA générative, à partir de la description textuelle « Réseaux de neurones pour la prévision météorologique« .

[1] Le Cun, Y., L. Bottou, Y. Bengio, & P. Haffner, 1998. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86, 2278–2324.

[2] Taillardat, M., A. Fougères, P. Naveau, & O. Mestre, 2019. Forest-Based and Semiparametric Methods for the Postprocessing of Rainfall Ensemble Forecasting. Wea. Forecasting, 34, 617–634, https://doi.org/10.1175/WAF-D-18-0149.1

[3] Balogh B., 2022. Vers une utilisation de l’Intelligence Artificielle dans un modèle numérique de climat. Thèse de doctorat en Océan, atmosphère, climat. Toulouse INPT.

[4] Doury, A., Somot, S., Gadat, S. et al., 2023. Regional climate model emulator based on deep learning: concept and first evaluation of a novel hybrid downscaling approach. Clim Dyn 60, 1751–1779. https://doi.org/10.1007/s00382-022-06343-9

[5] Brochet, C., L. Raynaud, N. Thome, M. Plu, & C. Rambour, 2023. Multivariate Emulation of Kilometer-Scale Numerical Weather Predictions with Generative Adversarial Networks: A Proof of Concept. Artif. Intell. Earth Syst., 2, 230006, https://doi.org/10.1175/AIES-D-23-0006.1

[6] Lguensat, R., 2023. Les nouveaux modèles de prévision météorologique basés sur l’intelligence artificielle : opportunité ou menace ? La Météorologie, 121, 11-15. 10.37053/lameteorologie-2023-0030

[7] Pardé, M., L. Raynaud, & A. Mounier, 2024. La prévision à moyenne échéance de la tempête Ciaràn par intelligence artificielle. La Météorologie, 125, 36-40, https://lameteorologie.fr/issues/2024/125/meteo_2024_125_36

[8] Mounier, A., L. Raynaud, L. Rottner, M. Plu, P. Arbogast, M. Kreitz, L. Mignan, & B. Touzé, 2022. Detection of Bow Echoes in Kilometer-Scale Forecasts Using a Convolutional Neural Network. Artif. Intell. Earth Syst., 1, e210010, https://doi.org/10.1175/AIES-D-21-0010.1


L’Encyclopédie de l’environnement est publiée par l’Association des Encyclopédies de l’Environnement et de l’Énergie (www.a3e.fr), contractuellement liée à l’université Grenoble Alpes et à Grenoble INP, et parrainée par l’Académie des sciences.

Pour citer cet article : RAYNAUD Laure (17 juin 2024), L’intelligence artificielle pour la prévision du temps, Encyclopédie de l’Environnement. Consulté le 21 novembre 2024 [en ligne ISSN 2555-0950] url : https://www.encyclopedie-environnement.org/air/intelligence-artificielle-prevision-temps/.

Les articles de l’Encyclopédie de l'environnement sont mis à disposition selon les termes de la licence Creative Commons BY-NC-SA qui autorise la reproduction sous réserve de : citer la source, ne pas en faire une utilisation commerciale, partager des conditions initiales à l’identique, reproduire à chaque réutilisation ou distribution la mention de cette licence Creative Commons BY-NC-SA.