Larabi, Samah (2017). Nouvelles approches de calibration automatique appliquées à un modèle hydrologique conceptuel semi-distribué. Thèse. Québec, Université du Québec, Institut national de la recherche scientifique, Doctorat en sciences de l'eau, 264 p.
Prévisualisation |
PDF
Télécharger (13MB) | Prévisualisation |
Résumé
Les modèles hydrologiques sont des outils indispensables et largement utilisés pour la prévision des variables hydrologiques, gestion de réservoirs, prise de décision ou encore pour améliorer la compréhension des processus régissant le cycle hydrologique d’un bassin versant. Ces outils sont des ensembles d’équations mathématiques qui décrivent et représentent de manière relativement simple les processus hydrologiques occurrents dans un bassin versant. Chaque modèle inclut plusieurs paramètres pour décrire l’état du système en question. Certains de ces paramètres sont conceptuels ou indisponibles par mesure directe et nécessitent une estimation à partir de données historiques avant de mettre en place le modèle. Ce processus d’estimation des paramètres est appelé calibration. Cette tâche est complexe et présente beaucoup de difficultés à cause des incertitudes liées à la structure du modèle, aux intrants du modèle et aux données historiques de débits. La calibration du modèle impacte sa fiabilité, sa précision et sa performance à reproduire les mécanismes du système étudié ainsi que ses prédictions des variables hydrologiques. Étant donné ces impacts, il y a une nécessité de définir une stratégie de calibration efficace et performante. C’est dans cet esprit que s’inscrit l’objectif de cette thèse qui consiste à améliorer et proposer de nouvelles approches pour la calibration automatique des modèles hydrologiques. Les méthodes développées sont appliquées au modèle hydrologique conceptuel semi-distribué CEQUEAU et pourraient être appliquées à n’importe quel autre modèle. Trois bassins versants au Canada sont considérés à savoir le bassin du lac St-Jean situé au Québec, la rivière du Nechako en Colombie-Britannique et le ruisseau Catamaran au Nouveau-Brunswick.
Les travaux de recherches menés visent à atteindre cinq objectifs spécifiques reliés à différents axes de la calibration: 1) définir une procédure d’optimisation robuste, 2) définir une mesure de performance fiable incluant toute l’information contenue dans les données historiques, 3) comparer l’efficacité de cette mesure contre celle utilisées dans des stratégies de calibration avancées, 4) définir une stratégie de calibration pour améliorer le réalisme et la fiabilité des estimations des réponses du système (ex. les débits), 5) définir une stratégie de calibration multisite afin d’améliorer la performance du modèle à l’échelle du bassin.
Le premier objectif s’intéresse à la réduction du risque d’équifinalité et l’estimation de paramètres conceptuellement réalistes. Une procédure d’estimation de paramètres combinant des simulations Monte Carlo avec fonctions de profondeur et un algorithme d’optimisation globale appelé ‘Tabu Search’ est proposée. La simulation Monte Carlo est destinée au raffinement de l’espace des paramètres pour trouver la région d’attraction de cet espace. L’utilisation d’une fonction de profondeur avec la simulation Monte Carlo permet un échantillonnage stratégique et restreint dans la région contenant des combinaisons de paramètres performantes. Par conséquent, cette étape fournit un espace optimal qui est exploré davantage par le ‘Tabu Search’ dans le but de trouver un seul optimum global. La procédure permet une réduction importante de l’espace des paramètres en particulier les paramètres sensibles (jusqu’à 90%). L’algorithme d’optimisation globale converge vers des solutions performantes et plus réalistes après optimisation de l’espace. En effet, l’ajustement des paramètres dans l’espace borné selon des valeurs physiquement plausibles de paramètres mène à des jeux de paramètres simulant des comportements hydrologiques irréalistes (par exemple coefficient d’infiltration entre les couches de sols conceptualisés par le modèle fixé à 0 i.e. aucune infiltration) bien qu’ils soient performants (reproduisent adéquatement le débit). La méthodologie a été appliquée avec une validation croisée (‘split sample’) et une validation croisée différentielle (‘Differential split-sample’). Dans les deux cas, le modèle calibré est robuste et performant.
Le deuxième objectif a pour but de définir une méthode de calibration prenant en compte toute l’information sur la variabilité, forme et occurrence des états hydrologiques (étiage, crue, récession, etc.) plutôt que de mettre uniquement l’accent sur la crue printanière. À cet effet, l’analyse de données fonctionnelles (FDA) est intégrée dans le processus de calibration et validation du modèle hydrologique. Cet outil mathématique permet d’analyser des données observées sur un intervalle régulier (espace, temps,..) comme des fonctions continues. Dans notre cas, cet outil permet d’analyser les hydrogrammes comme une seule entité ou observation au lieu de 365 observations journalières. Dans ce contexte, la fonction objectif est une distance entre les hydrogrammes simulés et observés. La procédure de calibration développée lors de la première partie de la thèse est utilisée et deux fonctions objectives adaptées à chaque étape ont été définies. L’utilisation de la FDA fournit la même qualité d’estimation de débits de crue qu’une calibration avec le critère Nash-Sutcliffe Efficiency NSE (ex. NSE= 0.9 en période de calibration et validation au bassin du Lac St-Jean). Toutefois, elle permet d’améliorer l’estimation des débits d’étiage, l’estimation de certaines signatures hydrologiques ainsi que de considérer toute la variabilité de l’hydrogramme. Évaluer la performance du modèle à simuler les signatures hydrologiques qui caractérisent l’écoulement dans le bassin versant (distribution, fréquence et variabilité de débits de crue et d’étiages) permet de détecter la composante du modèle qui pourrait être déficiente.
Le troisième objectif explore une formulation différente de mesure de performance utilisant la FDA et compare l’efficacité de la calibration avec celle-ci avec celle produite en appliquant les autres critères conventionnellement utilisés dans la littérature (calibration avec une seule fonction objectif avec le critère NSE, calibration multiobjective avec le critère Kling Gupta Efficiency (KGE) et calibration en utilisant les signatures hydrologiques). Dans cet objectif, la fonction objectif basée sur la FDA est le ratio entre le volume intégré (aire sous la courbe de l’hydrogramme) annuel simulé et observé. La procédure combinant simulation Monte Carlo et fonction de profondeur développée lors du premier objectif est utilisée pour comparer la performance des jeux de paramètres engendrés par les différentes calibrations considérées. Les résultats montrent que la calibration basée sur la FDA permet une meilleure estimation de l’hydrogramme en entier. Elle permet une meilleure représentation des processus hydrologiques du bassin (i.e. reproduire adéquatement plusieurs ou toutes les signatures hydrologiques considérées) par rapport aux autres méthodes. Les calibrations conventionnelles assurent une bonne performance du modèle pour simuler la crue avec une très faible performance sur les débits d’étiage. Néanmoins, la calibration avec le NSE est la meilleure méthode conventionnelle pour capter l’occurrence et le volume de la crue printanière dans un bassin où la crue est dominée par la fonte de neige. Quelle que soit la méthode de calage, l’incertitude sur la pointe et le volume de la crue printanière est significative.
Le quatrième objectif vise à améliorer la qualité de la calibration du modèle pour mieux reproduire les observations du bassin versant (dans notre cas, les débits) ainsi que de mieux capturer les changements des états internes et processus hydrologiques. La stratégie de calibration développée est une procédure de calibration multicritère par étape et par processus basée sur la procédure de calibration définie lors de la première étape et la FDA. Pour reproduire le volume d’eau observé dans le bassin versant, le modèle a tendance à compenser entre les volumes d’eau provenant de ses différentes composantes simulant les processus internes (ex. fonte de neige, évaporation, apports d’eau souterraine). Pour réduire cet effet de compensation parfois erronée, les composantes du modèle régissant chaque processus hydrologique sont calibrées séparément. L’ajustement de leurs paramètres est fait selon un critère spécifique défini à partir d’une partie de l’hydrogramme qui est directement reliée au processus hydrologique en question. Cette stratégie de calibration a été appliquée uniquement au bassin versant du lac St-Jean où l’on dispose de plusieurs stations hydrométriques. L’estimation de l’hydrogramme en entier (débits de crue et d’étiage) est améliorée avec une valeur de NSE de 0.86 et un biais d’étiage hivernal de 16% comparativement à une calibration classique sur les observations de débits uniquement (NSE de 0.71 et biais d’étiage hivernal de 21%). La validation du modèle sur différentes stations a révélé la bonne performance du modèle sur des sous-bassins ayant des caractéristiques similaires aux stations utilisées pour la calibration avec une valeur de NSE supérieure à 0.7. Globalement, le NSE moyen sur toutes les stations du bassin du lac St-Jean n’ayant pas servi à la calibration est de 0.61.
Le cinquième objectif consiste à améliorer la performance du modèle à une échelle spatiale plus importante que celle d’une seule station, c’est-à-dire à l’échelle du bassin. En effet, le but d’un modèle hydrologique distribué/semi-distribué, contrairement à un modèle global, est de simuler le débit sur n’importe quel point du bassin. Généralement, les modèles hydrologiques sont calibrés à l’aide d’observations de débits à l’exutoire uniquement. Le calage du modèle en un seul point n’est pas une garantie d’un modèle performant à l’échelle d’un grand bassin versant. Dans le cadre de cette thèse, une calibration locale réfère à une calibration à l’échelle d’une station et une calibration globale réfère à une calibration à l’échelle du bassin versant. Deux procédures de calibration multisite sont proposées. La première consiste en une calibration globale du modèle sur toutes les stations simultanément. La deuxième consiste en une calibration locale par station suivie d’une calibration globale en évaluant la performance du modèle sur toutes les stations simultanément. La calibration locale permet d’explorer et analyser la variabilité spatiale des paramètres à l’échelle du bassin. Les paramètres qui présentent une variabilité spatiale négligeable sont fixés à la valeur moyenne des valeurs résultantes du calage local sur les différentes stations hydrométriques. La deuxième étape, calage global, met l’emphase sur les paramètres qui varient le plus à l’échelle du bassin. Les deux procédures sont appliquées avec une validation croisée. L’application des procédures sur deux périodes différentes permet d’explorer la variabilité temporelle des paramètres. Les résultats des calibrations locales et globales montrent que certains paramètres de la fonction de production du modèle CEQUEAU, tel que les hauteurs des réservoirs conceptualisés et le coefficient de vidange basse du réservoir Sol (CVSB), ont une variabilité spatiale et temporelle négligeable sur le bassin versant du lac St-Jean. Ces paramètres peuvent être fixés sans calage global et sans perte de performance. Les paramètres de fonte et les coefficients de vidange : haute du réservoir Nappe (CVNH),haute du réservoir Sol (CVSI) et du réservoir Lac et Marrais (CVMAR) sont variables spatialement et dépendent aussi de la période de calibration. Les deux procédures mènent à des performances globalement similaires (ex NSE de 0.86 à la station de l’exutoire du bassin du Lac St-Jean, NSE de 0.83 à la station ASHA située plus en amont dans le bassin du lac St-Jean). Globalement les travaux de cette thèse proposent une combinaison de méthodes incluant algorithmes, fonctions objectifs et stratégies de calibration qui visent à définir des paramètres d’un modèle réaliste (qui reproduit les processus hydrologiques internes avec des valeurs de paramètres conceptuellement réalistes) et performant dans l’ensemble (autant sur les débits d’étiages que la crue). De plus, les travaux ont permis une exploration de la variabilité des paramètres du modèle CEQUEAU dans le bassin du lac St-Jean où l’on dispose de plusieurs stations hydrométriques et sur lequel le modèle est utilisé pour faire de la prévision opérationnelle.
Hydrological models are important tools widely used for flow forecasting, reservoir management, or to enhance the knowledge about processes of the hydrological cycle within a watershed. These tools are an ensemble of mathematical equations to describe and represent relatively in a simple way the hydrological processes occurring within a watershed. Each model has multiple of parameters to describe the states of the considered system. Some of these parameters are conceptual and/or unavailable by direct measurement and need to be estimated using historical data before setting up the model. This process of estimating model parameters is called calibration. This task can be complex and difficult because of the uncertainty associated with the model structure, inputs of the model and the historical data. Model calibration impacts the accuracy, the precision and the performance of the model to reproduce the mechanism of the system and its response. Therefore, an efficient and performant calibration strategy must be defined carefully. In this context, the objective of this thesis is to improve and develop novel approaches for automatic calibration. The developed methods are applied to the CEQUEAU conceptual semi-distributed hydrological model and can be applied to any model. Three Canadian watersheds are considered, namely the Lac St-Jean drainage basin located in the province of Québec, Nechako River in British-Columbia and the Catamaran Brook in New-Brunswick.
The objectives of the research work conducted for this thesis are related to different themes, all related to model calibration: 1) defining a robust optimization procedure for parameter estimation, 2) defining a reliable method to asses model performance reflecting all information contained in the historical data, 3) Comparing this method to the conventional methods used with uncertainty analysis, 4) defining a calibration strategy to improve the realism and the reliability of the response system estimation, and 5) defining a multi-site calibration strategy in order to improve the model performance at the basin scale.
The first objective of the thesis is to reduce the equifinalty risk and estimate realistic conceptual model parameters. A procedure combining Monte Carlo simulations coupled with depth functions and a global optimization algorithm called ‘Tabu Search’ is proposed for estimating model parameters. The Monte Carlo simulations aim at refining the parameter space in order to find the attraction region of the space. The use of a depth function with the Monte Carlo simulations allows for a strategic sampling in the region of the space including performing sets of parameters. Consequently, this step defines an optimal parameter space that is explored deeply by the Tabu Search in order to find a global optimum. This procedure considerably reduces the parameter space particularly for the most sensitive parameters (up to 90%). The global optimization algorithm converges to a more realistic and performant solution when the space parameter is optimized first. Adjusting model parameters within a space limited to the range of feasible parameter values, leads to a performant model that does not necessarily simulate a realistic hydrological behaviour of the modelled watershed (e.g. percolation coefficient set to 0 which means there is no infiltration to supply the groundwater). The proposed procedure was applied with split sample and a differential split sample procedure and in both cases the calibrated model is robust and performant.
The second objective of the thesis aims at defining a new performance measure that allows conserving all the information about the variability, form and timing of hydrological states. To do so, functional data analysis (FDA) is integrated within the process of model calibration and validation. This mathematical tool allows analyzing observed data within a framework as continuous functions. In our case, it allows us to analyze the annual hydrograph as a single entity instead of 365 daily observations. In this context, the proposed objective function is a distance between the simulated and observed hydrographs. The calibration procedure defined in the first objective of the thesis is used and two objective functions adapted for each step are defined. Using FDA during calibration yields to similar results on high flows as using the Nash-Sutcliffe efficiency criterion (e.g. similar NSE values, around 0.9 during calibration and validation periods for the Lac St-Jean drainage basin). It improves the simulation of low flows, the simulation of some hydrological signatures and conserves the entire variability of the hydrograph. Evaluating a number of hydrological signatures, i.e. descriptive statistics reflecting different flow regime characteristics to investigate the performance of the calibrated model helps to identify which model component is the source of possible inadequacies in the simulations. These inadequacies are most likely caused by elements such as the poor performance to simulate the hydrological processes (e.g. snowmelt, evapotranspiration) not explicitly or specifically considered at this step. The third objective explores a new definition of a performance measure based on FDA and compares the efficiency of calibration with this measure versus other measures used in conventional calibrations such as using the NSE in a single criterion calibration, using a Kling Gupta Efficiency (KGE) as a multi-objective criterion and using hydrological signatures in a diagnostic approach. The objective function based on FDA is defined as a ratio between the integrated annual observed and simulated volume. The procedure developed in the first part of the thesis that combines Monte Carlo simulations with a depth function is used to compare the performance and the consistency of the parameters sets resulting from the different calibrations approaches. The results show that calibration based on FDA allows a better estimation of the entire hydrograph and can achieve high consistency levels (i.e. finding parameters sets adequately reproducing all hydrological signatures considered). The conventional calibrations showed efficiency and high performance on simulating the spring flood at the expense of low flows. However, the NSE remains the best conventional method to catch the timing and the flood volume in a snow-dominated watershed. The uncertainty analysis shows that, regardless of the calibration method used, the uncertainty is more pronounced during the spring flood than in other periods of the year.
This fourth objective aims at improving the quality of the calibration in terms of reproducing the response of the system and capturing the changes of the internal states and hydrological processes. The proposed calibration strategy is a stepwise multi-criteria and process-based calibration. This strategy uses the calibration procedure defined in the first objective and the performance measures defined are based on the same principle as for the second objective of the thesis. To reproduce the same observed flows, the model tends to compensate between the water volumes coming from the different sources (groundwater flow, interflow, and runoff). To reduce this effect, model components controlling each hydrological process are calibrated separately. For each component, a specific criterion is defined based on the part of the hydrograph directly related to the specific hydrological process. This strategy is applied to calibrate the model only at the Lac St-Jean drainage basin, where different gauging stations are available. The estimation of both low and high flows simultaneously is improved with a NSE value of 0.86 and a winter flow relative bias of 16% compared to a classical strategy using only the observed flows for calibration (NSE is 0.71 and winter flow relative bias is 21%). The validation of the calibrated model at different gauging stations confirms its good performance (NSE value above 0.7) in sub- basins showing similar hydrological characteristics as those of the sub-basin used for calibration. Overall, the mean NSE value at all stations of the Lac St-Jean drainage basin excluded for this third calibration strategy is 0.61.
The purpose of the fifth objective is to improve the performance of the model at a broader basin scale. The aim of any distributed/semi-distributed hydrological model, unlike lumped models, is to simulate the discharge at any point of the modelled watershed. Usually, the models are calibrated against flows observed from only one station. Hence, the calibrated model is performant to reproduce adequately flows at this station but not necessarily at a basin scale. Here, we propose two calibration strategies. By a global calibration, we mean a calibration at a basin scale (i.e. multiple gauging stations) and local calibration implies only one station. The first strategy is a global calibration by adjusting all model parameters at the different stations simultaneously. The second strategy is a local calibration followed by a global calibration. The local calibration aims at exploring the spatial variability of parameters. Only parameters that have high variability are considered for the global calibration. The other parameters are fixed to an average of values obtained at all stations. Both strategies are applied with a split sample test. Calibration of the model using two different data periods allows exploring the temporal variability of the parameters. The results show that only the snow parameters and the drainage coefficients except the Upper-Zone Lower drainage coefficient (CVSB) are spatially and temporally variable. All other parameters were fixed. The overall global calibration is as performant as a local calibration (e.g. NSE value is 0.86 at the outlet of the watershed and NSE is 0.83 at the ASHA station, located further upstream).
Overall the work of this thesis proposes a combination of methods for automatic calibration including algorithms, objective functions and calibration strategies to set a realistic (conceptually realistic parameters and representing the internal states adequately and hydrological processes), performant and reliable model for both low and high flows simulations simultaneously. In addition, the thesis offers an exploration of the CEQUEAU parameters values deemed adequate in the Lac St-Jean drainage basin where different hydrometric stations are available and where the model is used in operational forecasts.
Type de document: | Thèse Thèse |
---|---|
Directeur de mémoire/thèse: | St-Hilaire, André |
Co-directeurs de mémoire/thèse: | Chebana, Fatehet Latraverse, Marco |
Mots-clés libres: | analyse de données fonctionnelles; calibration; CEQUEAU; fonction de profondeur; simulation Monte Carlo;Tabu Search; depth function; functional data analysis; Monte Carlo simulation |
Centre: | Centre Eau Terre Environnement |
Date de dépôt: | 29 janv. 2018 22:15 |
Dernière modification: | 09 nov. 2021 20:47 |
URI: | https://espace.inrs.ca/id/eprint/6650 |
Gestion Actions (Identification requise)
Modifier la notice |