Doctoral thesis (Dissertations and theses)
Outliers detection in mixtures of dissymmetric distributions for data sets with spatial constraints
Planchon, Viviane
2007
 

Files


Full Text
FUSAGx_Planchon_Viviane_These.pdf
Author postprint (2.95 MB)
Download

All documents in ORBi are protected by a user license.

Send to



Details



Keywords :
Weibull distribution; distribution de Weibull; clustering; classification; contiguity constraint; contrainte de contiguïté; QQplot; exponential distribution; distribution exponentielle; generalized Pareto distribution; distribution généralisée de Pareto; GPD; Pareto index; index de Pareto; Gumbel distribution; distribution de Gumbel; POT; extreme value; valeur extrême; EVT; quantile plot; graphique des quantiles; Pareto-type distribution; distribution de type-Pareto
Abstract :
[en] In the case of soil chemical analyses, frequency distributions for some elements show a dissymmetrical aspect, with a very marked spread to the right or to the left. A high frequency of extreme values is also observed and a possible mixture of several distributions, due to the presence of various soil types within a single geographical unit, is encountered. Then, for the outliers detection and the establishment of detection limits, an original outliers detection procedure has been developed; it allows estimating extreme quantiles above and under which observations are considered as outliers. The estimation of these detection limits is based on the right and the left of the distribution tails. A first estimation is realised for each elementary geographical unit to determine an appropriate truncation level. Then, a spatial classification allows creating adjoining homogeneous groups of geographical units to estimate robust limit values based on an optimal number of observations. / Dans le cas des analyses chimiques de sols, les distributions de fréquences des résultats présentent, pour certains éléments étudiés, un caractère très dissymétrique avec un étalement très marqué à droite ou à gauche. Une fréquence importante de valeurs extrêmes est également observée et un mélange éventuel de plusieurs distributions au sein d’une même entité géographique, lié à la présence de divers types de sols, peut être rencontré. Dès lors, pour la détection des valeurs aberrantes et la fixation des limites de détection, une méthode originale, permettant d’estimer des quantiles extrêmes au-dessus et en dessous desquelles les observations sont considérées comme aberrantes, a été élaborée. L’estimation des limites de détection est établie de manière distincte à partir des queues des distributions droite et gauche. Une première estimation par entité géographique élémentaire est réalisée afin de déterminer un niveau de troncature adéquat. Une classification spatiale permet ensuite de créer des groupes d’entités homogènes contiguës, de manière à estimer des valeurs limites robustes basées sur un nombre d’observations optimal.
Disciplines :
Agriculture & agronomy
Author, co-author :
Planchon, Viviane;  Université de Liège - ULiège > GX - Faculté universitaire des Sciences agronomiques de Gembloux
Language :
English
Title :
Outliers detection in mixtures of dissymmetric distributions for data sets with spatial constraints
Alternative titles :
[fr] Détection de valeurs aberrantes dans des mélanges de distributions dissymétriques pour des ensembles de données avec contraintes spatiales
Defense date :
29 May 2007
Institution :
Université de Liège
Degree :
Doctorat en Sciences agronomiques et ingénierie biologique
Promotor :
President :
Théwis, André
Jury member :
Bock, Laurent
Gouet, Jean-Paul;  Arvalis, France
Toussaint, André
Palm, Rodolphe
Lejeune, Philippe
Dautrebande, Sylvia
Charles, Catherine
Available on ORBi :
since 27 March 2024

Statistics


Number of views
10 (0 by ULiège)
Number of downloads
19 (0 by ULiège)

Bibliography


Similar publications



Contact ORBi