Dépôt numérique
RECHERCHER

Approches statistiques pour la prédiction de variables hydrologiques extrêmes à des sites non jaugés en l'absence d'hypothèses de linéarité et normalité.

Durocher, Martin (2015). Approches statistiques pour la prédiction de variables hydrologiques extrêmes à des sites non jaugés en l'absence d'hypothèses de linéarité et normalité. Thèse. Québec, Université du Québec, Institut national de la recherche scientifique, Doctorat en sciences de l'eau, 228 p.

[img]
Prévisualisation
PDF
Télécharger (4MB) | Prévisualisation

Résumé

L'analyse fréquentielle régionale (AFR) regroupe une panoplie de méthodes statistiques visant à prédire le comportement de variables hydrologiques extrêmes à des sites non jaugés. Les techniques de régression, les méthodes géostatistiques et la classification sont parmi les outils statistiques fréquemment rencontrés dans la littérature. Des méthodologies basées sur ces outils conduisent à des modèles régionaux qui offrent une description simple, mais très utile de la relation entre les variables hydrologiques extrêmes et les caractéristiques physiométéorologiques d'un site. Ces modèles régionaux permettent alors de prédire le comportement de variables d'intérêt à des endroits où aucune information hydrologique n'est disponible. Ces méthodes reposent généralement sur des hypothèses théoriques restrictives, dont la linéarité et la normalité. Ces dernières ne reflètent pas la réalité des phénomènes naturels. Les objectifs généraux de cette thèse sont d’identifier les méthodes affectées par ces hypothèses, évaluer leurs impacts et proposer des améliorations visant à obtenir des représentations plus réalistes et plus justes. La régression à directions révélatrices (projection pursuit regression) est une méthode non paramétrique similaire aux modèles additifs généralisés et aux réseaux de neurones artificiels qui sont considérés en AFR afin de tenir compte de la non-linéarité des processus hydrologiques. Dans une étude comparative, cette thèse montre que la régression à directions révélatrices permet d'obtenir des modèles plus parcimonieux tout en préservant le même pouvoir prédictif que les autres méthodes non paramétriques. L'analyse des corrélations canoniques (ACC) est employée afin de créer des voisinages à l'intérieur desquels un modèle (e.g. la régression multiple) sert à prédire les variables hydrologiques à des sites non jaugés. Par contre, l'ACC dépend fortement des hypothèses de normalité et de linéarité. Une nouvelle méthodologie pour délimiter des voisinages est proposée dans cette thèse et utilise la régression à directions révélatrices afin de prédire un point de référence représentant l’information hydrologique et physiométéorologique qui est pertinente à ces regroupements. Les résultats montrent que la nouvelle méthodologie généralise celle de l'ACC, améliore l'homogénéité des voisinages et conduit à de meilleures performances. En AFR, les techniques de krigeage sur des espaces transformés sont suggérées afin de prédire les variables hydrologiques extrêmes. Cependant, une transformation est requise afin que les variables hydrologiques d'intérêt proviennent approximativement d'une loi normale multidimensionnelle. Cette transformation introduit un biais et conduit à des prédictions sous-optimales. Des solutions ont été proposées, mais n'ont pas été testées en AFR. Cette thèse propose l'approche des copules spatiales et montre que cette approche apporte des solutions satisfaisantes aux problèmes rencontrés avec les techniques de krigeage. Les processus max-stables sont une formalisation théorique des extrêmes spatiaux et correspondent à une représentation plus fidèle des processus hydrologiques. Par contre, leur caractérisation de la dépendance extrême pose des problèmes techniques qui ralentissent leur adoption. Dans cette thèse, le calcul bayésien approximatif est examiné comme une solution. Les résultats d'une étude de simulations montrent que le calcul bayésien approximatif est supérieur à l'approche standard de la vraisemblance composée. De plus, cette approche s'avère plus appropriée afin de tenir compte des erreurs de spécifications.

Abstract

Regional Frequency Analysis (RFA) regroups several statistical methods in order to predict the behaviour of extreme hydrological variables at ungauged sites. Regression techniques, geostatistical methods and classification are among the most frequent tools found in the RFA literature. Methodologies based on these tools lead to simple, but very useful regional models that describe of the relation between extreme hydrological variables and physio-meteorological characteristics of sites. These regional models allow then to predict the behaviour of variables of interest to locations without actual hydrological information. Generally, these methods rely on restrictive hypothesis including: linearity and normality. The latter are not justified by natural phenomenon properties. Hence, the global objectives of this thesis are to identify these methods based on these hypotheses, to evaluate their impacts and to propose improvements with more accurate representation of the real phenomena. Projection Pursuit Regression (PPR) is a nonparametric method similar to the generalized additive models and to artificial neural networks, whose have been already considered in RFA to account for the nonlinearity and the non-normality present in hydrological processes. This thesis includes a comparative study that shows that PPR leads to more parsimonious models in comparison to the other nonparametric approaches, without sacrificing predictive performances. Canonical correlation analysis (CCA) is a technique that unveils the interrelation between two groups of random variables. In RFA, this technique is used to create neighborhoods inside which models (e.g. multiple regressions) can reasonably predict hydrological variables at ungauged locations. However, CCA strongly depends on the hypotheses of linearity and normality. A new methodology for delineating neighborhoods at ungauged sites is proposed, where PPR is used to predict new neighborhood centers that represents relevant hydrological and physio-meteorological information necessary for pooling together gauged sites. Results show that the new methodology generalizes the CCA approach, improves homogenous properties and predictive performances. Kriging techniques have been suggested in RFA to predict extreme hydrological variables in transformed spaces (not geographically continues). However, it requires the transformation of the hydrological variables of interest to meet normality requirements. This introduces a bias and produces suboptimal predictions for the kriging estimator. Solutions exist for dealing adequately with such transformations, but they have not been validated in RFA. This thesis investigates the spatial copula approach to this end and shows that the spatial copula framework provides a proper solution to the specific needs of RFA. Max-stable processes are the formal generalization of the extreme value theory in the case of spatial extremes. They provides more accurate a characterization of the hydrological processes, but the theoretical formulation of the spatial dependence between extreme events remains challenging, which has slow down the adoption of max-stable processes in practical situations. In this thesis, Approximate Bayesian Computing (ABC) is investigated as a solution to these difficulties. A simulation study suggests that ABC is superior to the standard composite likelihood approach.

Type de document: Thèse
Directeur de mémoire/thèse: Chebana, Fateh
Co-directeurs de mémoire/thèse: Ouarda, Taha B. M. J.
Mots-clés libres: hydrologie; prédiction; statistique; analyse fréquentielle régionale; AFR; sites non jaugés
Centre: Centre Eau Terre Environnement
Date de dépôt: 29 mars 2016 21:15
Dernière modification: 29 mars 2016 21:15
URI: http://espace.inrs.ca/id/eprint/3340

Actions (Identification requise)

Modifier la notice Modifier la notice