Dépôt numérique
RECHERCHER

Utilisation de la régression linéaire pour la détection de tendance dans des séries chronologiques environnementales.

Laberge, Claude (1995). Utilisation de la régression linéaire pour la détection de tendance dans des séries chronologiques environnementales. Thèse. Québec, Université du Québec, Institut national de la recherche scientifique, Doctorat en sciences de l'eau, 230 p.

[img]
Prévisualisation
PDF
Télécharger (55MB) | Prévisualisation

Résumé

Cette recherche s'attaque aux problèmes pratiques de la détection de tendance dans des séries chronologiques relativement bien échantillonnées (longues et équidistantes). Le but premier du présent travail est de fournir un document qui traite de la majorité des caractéristiques restrictives qui peuvent être rencontrées dans une étude de détection de tendance utilisant la régression linéaire. L'autocorrélation, les valeurs aberrantes et les saisonnalités sont traitées alors que la longueur et l'équidistance des séries sont supposées adéquates. On cherche alors des solutions simples et pratiques pour tenir compte des caractéristiques restrictives. Ces solutions sont validées à l'aide de simulations de Monte Carlo et les tests qui en résultent sont comparés aux tests non paramétriques généralement utilisés dans le domaine de l'eau. L'utilisation de variables avec retard dans la régression a été sélectionnée pour tenir compte de la présence d'autocorrélation. À l'exception de la présence de très forte autocorrélation, les études de simulations ont montré que le seuil de 5% est conservé et que la puissance n'est pas significativement différente de la puissance théorique. On peut donc connaître les propriétés de ce test en présence d'autocorrélation sauf pour les cas de très forte autocorrélation. Lorsque l'ordre du processus autorégressif n'est pas connu, on a montré que l'utilisation d'une surparamétrisation permet d'effectuer le test de détection de tendance sans affecter le seuil et la puissance. En présence de valeurs aberrantes seulement (pas d'autocorrélation), l'utilisation des M-Estimateurs permet une détection de tendance adéquate, puisque le seuil théorique est conservé et la puissance, bien que significativement plus faible que la puissance théorique, demeure stable pour des amplitudes et des emplacements différents des valeurs aberrantes. Les M-Estimateurs permettent donc un test beaucoup plus fiable que le test utilisant les estimateurs classiques. En présence de I0 (et d'autocorrélation), l'utilisation des M-Estimateurs permet également une détection de tendance adéquate: le seuil théorique est conservé et la puissance, encore significativement plus faible que la puissance théorique, demeure stable pour des amplitudes et des emplacements différents des valeurs aberrantes. L'introduction d'autocorrélation n'affecte donc pas la détection de tendance pourvu qu'on utilise une variable avec retard dans le modèle de régression multiple et que l'effet des valeurs aberrantes est propagé par la structure autorégressive (10). Les M-Estimateurs permettent donc un test beaucoup plus fiable que le test utilisant les estimateurs classiques. En présence de AO, les M-Estimateurs ne permettent pas une détection de tendance adéquate (le seuil est significativement plus grand que 5%). Il est nécessaire de trouver une nouvelle méthode permettant d'annuler le biais important de l'estimateur du coefficient d'autorégression si l'on veut détecter adéquatement des tendances en présence de ce type de valeurs aberrantes. En présence de saisonnalités seulement, l'utilisation des variables muettes permet d'obtenir un test de détection de tendance avec des propriétés semblables au cas théorique (régression linéaire simple sur des données N(O,1) indépendantes à l'exception de la tendance). La principale difficulté de la méthode utilisée réside dans la modélisation des saisons. En effet, on a vu que la présence d'un décalage entre les saisons réelles et les saisons estimées peut amener le test de détection de tendance à présenter des propriétés indésirables. En présence de saisonnalités et d'autocorrélation, l'utilisation des variables avec retard et muettes permet également d'obtenir un test de détection de tendance avec des propriétés semblables au cas théorique. Cependant, la présence d'un décalage entre les saisons réelles et les saisons estimées aura un effet encore plus important sur le test de détection de tendance. En présence de saisonnalités et d'autocorrélation, il faut donc être certain de la modélisation des saisons pour se fier au résultat du test de détection de tendance utilisant la régression linéaire. Les comparaisons des adaptations de la régression linéaire avec les tests non paramétriques généralement utilisés dans le domaine de l'eau ont permis les conclusions suivantes: En présence de I0 de moyenne non nulle et d'autocorrélation, le test de Spearman/Lettenmaier est fortement influencé par l'emplacement des I0 mais pas par l'amplitude de ces dernières. Le test utilisant les estimateurs robustes est beaucoup moins influencé par l'emplacement des valeurs aberrantes tout en étant également peu influencé par l'amplitude des I0. Le test utilisant les estimateurs robustes est donc préférable si on ne connaît pas l'emplacement des valeurs aberrantes. En présence de I0 de moyenne nulle et d'autocorrélation, le test de Spearman/Lettenmaier est préférable car sa puissance est plus grande que celle du test utilisant les estimateurs robustes et qu'il est peu influencé (pour la moyenne des simulations) par l'emplacement des valeurs aberrantes. En présence de AO de moyenne nulle et d'autocorrélation, l'utilisation de la régression auto régressive robuste permet un test adéquat. Le test de Spearman/Lettenmaier, utilisé dans le domaine de l'eau, présente des faiblesses évidentes à cause de l'influence de l'emplacement des valeurs aberrantes et du biais d'estimateurs non robustes pour le coefficient d'autorégression. Ce dernier test ne devrait donc pas être utilisé à moins d'obtenir une bonne estimation du coefficient d'autorégression et une bonne connaissance de l'emplacement des valeurs aberrantes. En présence de AO de moyenne non nulle et d'autocorrélation, aucun des tests étudiés ne présente des propriétés désirables, il est donc très hasardeux d'effectuer une détection de tendance dans cette situation. Il est évident que dans cette situation on a besoin de recherches complémentaires pour effectuer une détection de tendance adéquate. En présence de saisonnalités seulement, le test de régression utilisant les variables muettes présente des propriétés équivalentes à celles du test de Kendall saisonnier. Le test de Kendall sur les moyennes saisonnières est moins puissant que les deux autres dans cette situation. Les seuils des tests de régression saisonnière et de Kendall saisonnier sont affectés par la présence de décalage systématique entre les saisons estimées et réelles. Les puissances des tests de régression et de Kendall saisonnier diminuent significativement avec l'introduction de décalage systématique entre les saisons estimées et réelles. Le test de Kendall sur les moyennes saisonnières n'est pas affecté par l'introduction de décalage systématique entre les saisons estimées et réelles. En présence de saisonnalités et d'autocorrélation, le test de régression autorégressive saisonnière est plus puissant que le test de Hirsch et Slack (sur les moyennes saisonnières). L'introduction d'un décalage systématique entre les saisons estimées et réelles influence cependant très fortement le test utilisant la régression alors que le test de Hirsch et Slack sur les moyennes saisonnières reste stable devant un tel décalage. De façon générale, les comparaisons entre les tests paramétriques et non paramétriques montrent l'intérêt d'utiliser les deux approches dans des études de détection de tendance. La connaissance des forces et des faiblesses des deux approches permet alors des conclusions beaucoup plus éclairées. Les avantages de cette utilisation conjointe des méthodes paramétriques et non paramétriques sont également illustrés dans les applications sur des données réelles dans le dernier chapitre. Dans ces applications, on a montré que: Les concentrations de sulfates et le pH ont augmenté de façon significative entre 1981 et 1987, au centre du lac Laflamme et à son exutoire. Le paramètre de minéralisation (Ca+Mg+Na) a diminué significativement, en concentration et en charge dans les précipitations, entre 1981 et 1987. Les charges de nitrates à l'exutoire du lac Laflamme ont diminué significativement entre 1981 et 1987. Les conclusions précédentes sont obtenues avec les tests paramétriques et non paramétriques. Parmi les 18 séries traitées, on a cependant deux séries qui amènent une conclusion différente selon qu'on utilise les tests paramétriques ou les tests non paramétriques. En effet, pour les concentrations de nitrates au centre du lac Laflamme et à son exutoire, les tests paramétriques ne détectent pas de tendance alors que les tests non paramétriques concluent à une diminution significative entre 1981 et 1987.

Type de document: Thèse
Directeur de mémoire/thèse: Cluis, Daniel
Co-directeurs de mémoire/thèse: Rivest , Louis-Paul
Mots-clés libres: méthode paramétrique; régression linéaire; série chronologique; méthodes non paramétriques; Monte-Carlo; autocorrélation; saisonnalité; série environnementale
Centre: Centre Eau Terre Environnement
Date de dépôt: 06 févr. 2014 20:32
Dernière modification: 20 nov. 2015 20:05
URI: http://espace.inrs.ca/id/eprint/1799

Actions (Identification requise)

Modifier la notice Modifier la notice