Thiombiano, Alida Nadège (2017). Développement de méthodes d’analyse fréquentielle non-stationnaire avec l’approche des dépassements de seuil et application avec la précipitation totale journalière dans le sud-est du Canada. Thèse. Québec, Université du Québec, Institut national de la recherche scientifique, Doctorat en sciences de l'eau, 252 p.
Prévisualisation |
PDF
Télécharger (6MB) | Prévisualisation |
Résumé
L’analyse fréquentielle (AF) est un outil statistique très utilisé en hydrologie pour la prédiction des quantiles d’évènements extrêmes. L’objectif général de la présente thèse était de proposer de nouvelles approches d’AF des extrêmes basées sur la méthode des dépassements de seuil ou peaks-over-threshold (POT) en anglais.
En effet, avec la problématique des changements climatiques (CC), les indices climatiques sont fréquemment utilisés comme covariables dans le développement de modèles d’AF non-stationnaire du fait de la présence de tendances, dépendances, cycles ou ruptures dans les séries d’observations hydroclimatiques. Le premier objectif spécifique de cette thèse visait à analyser les téléconnexions entre les oscillations climatiques à grande échelle et les processus hydrologiques locaux/régionaux, afin de développer des modèles POT avec covariables. Les précipitations étant par essence très variables dans le temps et dans l’espace, la relation de dépendance entre plusieurs indices climatiques et des séries temporelles décrivant l’intensité et la fréquence des évènements extrêmes de la précipitation totale journalière, a été examinée à l’échelle du Sud-Est du Canada. Deux méthodes d’évaluation complémentaires, à savoir l’analyse de corrélation des rangs par le calcul du tau de Kendall ainsi que l’analyse par ondelettes, ont été employées pour confirmer statistiquement les interactions existantes. Cette analyse préliminaire a permis d’identifier deux indices climatiques ayant une influence significative sur l’intensité et la fréquence des précipitations extrêmes à l’échelle de la zone d’étude choisie : l’indice de l’oscillation arctique (AO pour Arctic Oscillation) et l’indice du Pacifique-Amérique du Nord (PNA pour Pacific North American). Des modèles de Pareto Généralisée (GPD pour Generalized Pareto Distribution) non-stationnaires ont été alors développés en faisant varier le paramètre d’échelle de la GPD en fonction de l’indice AO ou PNA au moyen de l’utilisation de fonctions semi-paramétriques, les fonctions B-splines. Celles-ci permettent de capturer aussi bien les relations simples (c’est à dire linéaires) que complexes (c’est à dire non-linéaires). Les quantiles de la précipitation extrême ont été estimés à partir du modèle de la GPD stationnaire (où tous les paramètres sont constants) et de différents modèles GPD-B-splines qui ont été développés en faisant varier deux paramètres déterminants de la fonction B-spline: le degré (d) du polynôme et le nombre de noeuds internes (k). Les modèles GPD non-stationnaires ont montré une meilleure performance que le modèle GPD stationnaire à la lumière des valeurs minimales du critère d’information d’Akaïke observées surtout avec le modèle GPD-B-spline (k=2 et d=1).
La structure physique des indices climatiques comportant une phase négative et une phase positive, les modèles GPD-B-splines se sont montrés flexibles. En effet, des réponses linéaires et non-linéaires des précipitations extrêmes aux indices AO et PNA ont pu être détectées au Sud-Est du Canada. D’où des possibilités de régionalisation de ces modèles locaux pour fournir un outil robuste de prédiction des quantiles.
Toutefois, l’interprétation pratique des quantiles est généralement associée à la notion de période de retour. Pour cette raison, il y un intérêt à incorporer l’information sur le taux moyen annuel des dépassements de seuil dans la modélisation des dépassements de seuil. Pour ce faire, l’étude de la surdispersion dans l’occurrence annuelle de ces évènements est suggérée au préalable pour valider ou non l’hypothèse que la fréquence des dépassements de seuil est distribuée suivant un processus de Poisson. En effet, dans le cas échéant, les distributions Binomiale (B) et Binomiale Négative (BN) sont des alternatives à considérer. A l’échelle de la région d’étude, la distribution de Poisson (PD) a été validée à 90% des stations à l’aide du calcul de l’indice de dispersion et du test statistique du Khi-carré qui lui est associé. D’où la formulation d’un modèle couplé PD-GPD. L’incorporation additionnelle de la non-stationnarité au niveau du paramètre d’intensité de la PD a ainsi permis d’analyser son effet sur les quantiles conditionnels.
Les résultats de la modélisation effectuée pour répondre au premier objectif spécifique sont basés seulement sur l’échantillon des dépassements de seuil. Ceci implique que le seuil est fixé au préalable et qu’il n’y a pas de quantification de l’incertitude liée à sa sélection durant l’étape subséquente qu’est l’inférence statistique. D’où la formulation du second objectif spécifique qui avait pour finalité d’utiliser l’ensemble des données disponibles pour obtenir une estimation du seuil comme un paramètre à part entière. L’approche des modèles dits « mixtes » a été donc utilisée pour la réalisation de cet objectif, en développant des modèles hybrides paramétriques à deux composantes, la première décrivant les observations en-dessous du seuil, et la seconde, celles au-dessus du seuil. Les distributions Gamma et Normale ont été évaluées séparément pour l’ajustement de la première composante, tandis que la GPD a été naturellement choisie pour l’ajustement de la deuxième composante. La location du seuil est au point de jonction des deux composantes. A cet effet, les modèles hybrides Gamma-GPD sans contrainte de continuité (modèle M1) et avec contrainte de continuité (modèle M2) au point du seuil de la fonction de densité de probabilité résultante, ainsi que le modèle Normale-GPD (M3) avec la même contrainte de continuité que M2, ont été développés dans un cadre Bayésien.
La comparaison de ces modèles entre eux et avec la GPD classique (modèle M0) a été faite au moyen de simulations en comparant le biais relatif et la racine de l’erreur quadratique moyenne relative des estimations. Les modèles hybrides avec une distribution Gamma (M1 et M2) permettent d’obtenir de meilleures estimations (faibles biais) que les modèles M3 et M0. L’un des avantages avec les modèles M1, M2 et M3 est l’automatisation de la détermination du seuil comme il fait partie du vecteur des paramètres du modèle hybride à estimer. L’application des modèles M1, M2 et M3 à des données de la précipitation totale journalière à une station spécifique a permis de constater leur fonctionnement pratique. De plus, les quantiles estimés à partir des modèles M0, M1, M2 et M3 sont comparables.
Les différents développements réalisés dans le cadre de cette thèse avec l’approche des dépassements de seuil (modèles hybrides et modèles POT), ont permis de proposer des modèles qui peuvent prendre en compte le maximum de données et d’informations disponibles pour améliorer la qualité des estimations.
Frequency analysis (FA) is widely used in statistical hydrology for the analysis of extreme events. The overall objective of this thesis was to propose a number of new approaches for modeling extreme events based on the peaks-over-threshold (POT) sampling strategy.
Large scale climate indices are frequently used as covariates for the development of nonstationary FA models due to the presence of trends, dependencies, cycles or jumps in the time series of hydroclimatic variables. Hence, the first specific objective of this thesis was to analyze the teleconnection between large scale climate patterns and local/regional level hydrological processes, to develop POT models with covariates. Since precipitation is inherently characterized by strong spatial and temporal variability, the dependence between several large scale climate patterns and the time series of extreme daily precipitation amounts was examined for Southeastern Canada. Two complementary assessment methods, the Rank-based correlation analysis using the Kendall's tau and the wavelet analysis were used to statistically test the relationships between large scale climate indices and precipitation extremes. This preliminary analysis allowed identification of two climate indices that significantly influence the intensity and frequency of extreme precipitation over the study area. These indices are the Arctic Oscillation index (AO) and the Pacific North American index (PNA). Nonstationary FA approach based on the Generalized Pareto Distribution (GPD) was developed by allowing the GPD scale parameter to vary as a function of the AO or PNA index. The B-spline functions were used as semi-parametric link functions to capture both the simple (i.e. linear) and complex (i.e. nonlinear) relationships.
Estimation of extreme precipitation quantiles was carried out using the stationary GPD (by keeping all parameters constant) and different GPD-B-spline models. These models were developed by varying two key parameters of the B-spline functions, i.e. the degree (d) of the polynomial and the number of internal nodes (k). The nonstationary GPD models showed better performance than the stationary GPD model in terms of minimum values of the Akaïke Information Criterion. This feature was observed mainly for the GPD-B-spline model with k=2 and d=1. The GPD-B-spline models were found flexible regardless of the negative or positive phase of the large scale climate patterns. Indeed, both linear and nonlinear responses of extreme precipitation to the AO and PNA indices were detected in Southeastern Canada. This suggests the possibility of exploring further the developed models for estimating various quantiles at the regional scale.
The quantile estimates are generally interpreted in association with the return period concept in practical engineering. The annual average number of POT events must be considered at this end to obtain the GPD based quantiles with a T-years return period. To do so, overdispersion in the frequency of peaks needs to be assessed in order to validate the Poisson process hypothesis. If this prior assumption fails, then the Binomial (B) and Negative Binomial (BN) distributions can be considered instead. For the selected study area, the adequacy of the Poisson distribution (PD) was validated at 90% of the stations by computing the dispersion index and using the Chi-square statistical test. Hence formulation of a combined PD-GPD model and assessment of the effects of non-stationarity in the PD rate parameter on the conditional quantiles were studied.
Only the sample of peaks above a fixed threshold was used to carry out the modeling in order to achieve the first specific objective of the study. This implies that the threshold is fixed a priori with no possibility to further quantify the uncertainty associated with its subjective selection. The second specific purpose of this thesis was to use all available data for an objective estimation of the threshold as an explicit parameter. The so-called "mixture" models were used to achieve this objective, by developing two-component parametric hybrid models. The Gamma and Normal distributions were evaluated separately for fitting the first component, while the GPD was selected to fit the second component on the basis of theoretical grounds. These two components describe respectively the observations below and above the threshold to be estimated, whose location is assumed at the junction point of the two components. The hybrid models Gamma-GPD without continuity constraint (referred to model M1) and with continuity constraint (referred to model M2) of the resulting probability density function at the threshold location, as well as the Normal-GPD model (referred to model M3) with enforced continuity as with model M2, were developed in a Bayesian framework. Comparison of these models with each other and with the classical GPD (i.e. model M0) was performed through a simulation study and by computing the relative bias and relative root mean square error of the quantile estimates. The hybrid GPD models with a Gamma distribution (i.e. models M1 and M2) provided best performance for quantile estimates (low biases) than models M3 and M0.
One of the advantages of using models M1, M2 and M3 is the explicit estimation of the threshold which is included in the hybrid model where all parameters need to be estimated. A case study of models M1, M2 and M3 with a sample of observed daily precipitation amounts, revealed their practical usefulness. Moreover, the quantiles estimated from models M0, M1, M2 and M3 were found comparable.
The mixture modeling approach presented in this thesis with the POT approach allows models which can use the full range of available data to improve the quality of estimations.
Type de document: | Thèse Thèse |
---|---|
Directeur de mémoire/thèse: | St-Hilaire, André |
Co-directeurs de mémoire/thèse: | Ouarda, Taha B. M. J.et El Adlouni, Salah-Eddine |
Mots-clés libres: | modèle POT; fonctions B-splines; covariables climatiques; modèle hybride; quantiles; précipitation; Canada; POT model; B-spline functions; climatic covariates; hybrid model |
Centre: | Centre Eau Terre Environnement |
Date de dépôt: | 29 janv. 2018 22:15 |
Dernière modification: | 26 nov. 2021 13:26 |
URI: | https://espace.inrs.ca/id/eprint/6648 |
Gestion Actions (Identification requise)
Modifier la notice |