Dépôt numérique
RECHERCHER

Application of Long Short-term Memory (LSTM) Networks for Short-range Streamflow Modeling – Application to a few Canadian Watersheds of Contrasting Climates

Téléchargements

Téléchargements par mois depuis la dernière année

Khoshkalam, Yegane ORCID logoORCID: https://orcid.org/0000-0001-8885-936X (2024). Application of Long Short-term Memory (LSTM) Networks for Short-range Streamflow Modeling – Application to a few Canadian Watersheds of Contrasting Climates Thèse. Québec, Université du Québec, Institut national de la recherche scientifique, Doctorat en sciences de l'eau, 263 p.

[thumbnail of T1139_YKhoshkalam_2025-EMBARGO 2026-02-12.pdf] PDF - Version acceptée
Document sous embargo jusqu'à 12 février 2026.

Télécharger (13MB)

Résumé

La prédiction et la prévision précises du débit sont des défis de longue date dans le domaine de l'hydrologie. Ces prédictions sont essentielles pour la gestion des inondations et l'optimisation du opérations des centrales hydroélectriques. Les modèles basés sur la physique (PBM) simulent les processus hydrologiques qui déterminent le débit. Cependant, leur calage efficace dépend souvent de l'accès à différents types de données, qui peuvent être manquantes, ce qui limite leur utilisation dans les régions où la disponibilité des données est faible. Cette thèse, structurée autour de trois objectifs, a exploré une approche différente pour la modélisation du débit, en se concentrant sur une approche guidée par les données et des réseaux de mémoire à long terme (LSTM), puis a été comparée avec un PBM semi-distribué, HYDROTEL, largement utilisé pour la prévision et la modélisation hydrologique dans de nombreuses régions, y compris le Territoire du Yukon et le Québec méridional. Les réseaux LSTM sont un type de réseau neuronal récurrent qui présente des similarités conceptuelles avec les PBM traditionnels. Cependant, la principale différence réside dans la capacité des LSTM à apprendre n'importe quel processus dérivé des données, alors que les PBM traditionnels sont limités par les relations physiques prédéfinies intégrées dans la structure du modèle. Les résultats du premier objectif ont démontré le succès du transfert d'un modèle LSTM entraîné sur l’ensemble de données CAMELS (ensemble de données source) à huit bassins versants du sud du Québec (ensemble de données cible) par une technique d'apprentissage par transfert (TL) qui a surpassé HYDROTEL. Plusieurs stratégies ont été implémentées pour améliorer la précision de la prédiction temporelle ( entraînement et test sur les mêmes bassins versants, mais à des périodes différentes), y compris l'utilisation de : (i) l'intégration des données (DI) des débits observés récemment, (ii) des débits simulés par HYDROTEL, (iii) différentes variables météorologiques et physiographiques des ensembles de données source et cible, (iv) de nombres incrémentaux de bassins versants d'entraînement de la région cible. Parmi ces approches, le modèle TL couplé à DI, et le nombre maximal de bassins versants de la région cible, a atteint la plus grande précision de prédiction (valeurs médianes de l'efficacité du modèle Kling-Gupta (KGE) et de l'efficacité du modèle Nash-Sutcliffe-log (Nash-log) de 0,94 et 0,95, respectivement, pour la période de test). Cependant, même le modèle DI-TL entraîné seulement sur huit bassins versants a montré une performance très efficace (valeurs médianes KGE et Nash-log de 0,90 et 0,92, respectivement). Dans notre deuxième objectif, nous avons cherché à savoir si l'application du TL et du raffinement (i.e., fine-tuning) basé sur des groupes de bassins versants ayant des caractéristiques hydrologiques et écologiques similaires permettrait d'améliorer davantage les prédictions de débit, tant sur le plan temporel que spatial (entraînement sur certains bassins versants et test sur d'autres bassins versants pour la même période). Les résultats indiquent que si le fine-tuning sur des bassins versants groupés et l'utilisation de la méthode DI améliorent les prédictions temporelles (valeur KGE médiane de 0,93), il ne résulte pas toujours en une amélioration des prédictions spatiales, bien que l'incorporation des données physiques d'HYDROTEL dans le TL (TL guidée par la physique) soit assez efficace (valeur KGE médiane de 0,56). Il est à noter que le modèle TL guidé par la physique, lorsqu'il a été raffiné sur des bassins versants sélectionnés au hasard (indépendamment du regroupement des bassins versants), s'est avéré aussi performant que le modèle HYDROTEL calé sur les mêmes bassins versants (KGE médiane de 0,85). Enfin, dans notre troisième objectif, un système d'ensemble basé sur des réseaux LSTM a été développé pour prévoir à court terme (0-14 jours d'avance) les débits en rivière et les apports aux réservoirs de plusieurs bassins versants du Territoire du Yukon, une région caractérisée par la rareté des données et des caractéristiques hydrologiques uniques. Les premières tentatives d'application du TL se sont révélées inefficaces, c'est pourquoi des modèles LSTM ont été développés individuellement pour chaque bassin versant. Alors que les modèles LSTM intégraient les débits récents, avec ou sans l’intégration de l'équivalent en eau de la neige (EEN), HYDROTEL a été couplé à un schéma d'Ensemble de filtre de Kalman (EnKF). Les deux modèles ont été entraînés sur les mêmes données historiques et forcés avec les mêmes prévisions météorologiques d'ensemble. Sur la base des scores déterministes et probabilistes, les résultats ont indiqué que pour chaque bassin le modèle LSTM utilisant le DI du débit et des apports au réservoir, et l'EEN produisait des prévisions plus précises et plus efficaces que celles du système HYDROTEL-EnKF, en particulier en capturant les forts débits de pointe au printemps. Cette thèse a démontré le potentiel des modèles basés sur les réseaux LSTM pour la modélisation du débit, en particulier dans les régions où la disponibilité en données est limitée, comme le Territoire du Yukon et certaines parties du Québec. Alors que le principal argument en faveur de l'utilisation des données massives dans le développement de modèles tels que les LSTM découle de leur applicabilité universelle potentielle, cette étude a illustré la possibilité de développer des modèles très efficaces, spécifiques à une région, pour la modélisation hydrologique, qui ont tout le potentiel de surpasser les PBM, sans nécessiter de vastes ensembles de données. Les travaux recherches futures pourraient porter sur l'amélioration des stratégies d’intégration des données (DI), l'utilisation de données plus pertinentes pour l'entraînement des modèles et l'affinement des techniques de TL afin de mieux exploiter les modèles pré-entraînés pour les prévisions hydrologiques.

Type de document: Thèse Thèse
Directeur de mémoire/thèse: Rousseau, Alain N.
Mots-clés libres: prédiction du débit; LSTM; apprentissage par transfert; intégration des données; HYDROTEL; prévision du débit en rivière et des apports aux réservoirs
Centre: Centre Eau Terre Environnement
Date de dépôt: 21 oct. 2025 18:10
Dernière modification: 21 oct. 2025 18:10
URI: https://espace.inrs.ca/id/eprint/16619

Gestion Actions (Identification requise)

Modifier la notice Modifier la notice