Abstract :
[en] Spatial interpolation of precipitation data is of great importance for hydrological modelling. Geostatistical methods (kriging) are widely applied in spatial interpolation from point measurement to continuous surfaces. The objective of this dissertation is to confront the performances of the several spatial interpolation methods, in particular the geostatistics for daily rainfall data in the nested catchments to realize a sensitivity analysis on discharges modelled at the outlets to the daily rainfall input in the modelling. The previous studies in the literature emphasized a requirement of novel investigation on the essential means to recover the rainfall data and eventually, the quality of the hydrological modelling.
This study leaned on 30-year daily rainfall data of 70 raingages in the hilly landscape of the Ourthe and Ambleve catchments in Belgium (2908 km²). Two common deterministic methods are employed here. The Thiessen Polygon (THI) assigns the value from the nearest observation to a certain grid cell. The Inverse Distance Weighting (IDW) is an advanced nearest neighbour approach that allows including more observations than only the nearest points. The value at a certain grid cell is obtained from a linear combination of the surrounding locations. In the geostatistical algorithms, the spatial variation may be better described by a stochastic function. Four versions of kriging are used. The Ordinary Kriging (ORK) is the basic form of Kriging that the prediction is also a linear combination of the measured values. But the spatial correlation between the data, as described by the variogram, determines the weights, assuming that the mean is constant but unknown. The Universal Kriging (UNK) is based on the hypothesis that this mean is a polynomial function of spatial coordinates. So, this type of kriging is not stationary with regard to the mean. The Kriging with External Drift (KED) supposes that the mean of the interest variable depends on auxiliary variables; the theory of this kriging is in fact the same as the theory of UNK, which also contains a non-constant mean. The drift is defined externally through some auxiliary variables. The Ordinary Cokriging (OCK) suggests estimating the variable of interest by weighted linear combination of its observations and the observations of the auxiliary variables. This technique requires the study of the spatial dependence between variables besides the study of the simple spatial dependences. All types of kriging use a variogram model to characterise spatial correlation. A variogram describes in terms of variances how spatial variability changes as a function of distance. Seven semi-variogram models (logarithmic, power, exponential, Gaussian, rational quadratic, spherical and penta-spherical) were fitted to daily sample semi-variogram on a daily basis. These seven variogram models were also adopted to avoid negative interpolated rainfall. The elevation, extracted from a digital elevation model, was incorporated into multivariate geostatistics. Seven validation raingages and cross validation were used to compare the interpolation performance of these algorithms applied to different densities of raingages. The areal rainfalls are calculated for the catchment area and used for analysis of extreme rainfall. The effects of the interpolation methods on the extreme rainfall are analysed. The interpolated rainfalls are also used as rainfall input of the physically-based and distributed EPIC-GRID model. The long series of model results are analysed by comparison with the observed discharges at the different outlets of the catchments. Then, the extreme discharges at the outlets are computed. All of these investigations always take into account of the raingage density and the raingage position for very sparse raingage cases.
The main results show that among the methods based on the only rainfall data, the geostatistics and IDW are the best ones. The performances change according to the density of the raingages. For the extreme rainfall and long term modelling results, no big difference is found for a high density of raingage but large difference are found for the case of the scattered raingage. For the latter case, UNK and KED are very sensitive to the position of the raingages. IDW, ORK and OCK are found to be the best performance. However for the extreme flow, KED and OCK is the best whereas IDW is not better for the high density of the raingages. For the case of the scattered raingages, the difference in extreme discharge between the interpolation methods is very large and larger than shown in the extreme rainfall and the long term modelling results. IDW, ORK and OCK always perform better. UNK and KED still are sensitive to the positions of raingages. The index of position is used to describe the form of polygon defined by the four raingages. This index is defined as the relation between the polygon perimeter and a circle perimeter having an area equivalent to that of the polygon. The best raingage position for all interpolation methods used in this research should be arround the catchment area, its index should be close to one.
[fr] La spatialisation de données de précipitation est très importante pour la modélisation hydrologique. Les méthodes Géostatistiques (Krigeage) sont largement appliquées pour la spatialisation à partir de la mesure de points aux surfaces continues. L'objectif de cette dissertation est de confronter les performances de différentes méthodes d’interpolation spatiale de la pluie journalière dans des bassins versants imbriqués en vue de réaliser une analyse de sensibilité sur les flux modélisés aux exutoires. Les études précédentes dans la littérature mettent en lumière un besoin de nouvelles recherches sur les moyens nécessaires pour améliorer la donnée de pluie et in fine, la qualité de la modélisation hydrologique.
Cette étude s’est basée sur les données de pluies journalières de 30 ans de 70 stations dans le paysage collinaire des bassins versants de l'Ourthe et de l’Amblève en Belgique (2908 km²). Deux méthodes déterministes communes sont employées ici. Le Polygone de Thiessen (THI) assigne la valeur de l'observation la plus proche à une certaine maille. La Distance Inverse Pondérée (IDW) est une approche avancée qui permet d’inclure plus d'observations que les points les plus proches seuls. La valeur à une certaine maille est obtenue à partir d'une combinaison linéaire des points environnants. Dans les algorithmes géostatistiques, la variation spatiale peut être mieux décrite par une fonction stochastique. Quatre versions de Krigeage sont utilisées. Le Krigeage Ordinaire (ORK) est la forme de base du Krigeage. La prédiction est aussi une combinaison linéaire des valeurs mesurées, mais la corrélation spatiale entre les données, décrite par le variogramme, détermine les poids en supposant que l’espérance est constante, mais inconnue. Le Krigeage Universel (UNK) est basé sur l'hypothèse que ce moyen est une fonction polynômiale de coordonnées spatiales. Ainsi, ce type de Krigeage n'est pas stationnaire en ce qui concerne l’espérance. Le Krigeage avec Dérive Externe (KED) suppose que la variable d'intérêt dépend de variables auxiliaires; la théorie de ce Krigeage est en fait la même que la théorie de UNK, qui contient aussi une moyenne non-constante. La dérive est définie extérieurement par quelques variables auxiliaires. Le Co-krigeage Ordinaire (OCK) suggère d'évaluer la variable d'intérêt par la combinaison linéaire pondérée de ses observations et les observations des variables auxiliaires. Cette technique exige l'étude de la dépendance spatiale entre des variables en plus de l'étude des dépendances spatiales simples. Tous les types de Krigeage utilisent un modèle de variogramme pour caractériser la corrélation spatiale. Un variogramme décrit en termes de variances comment la variabilité spatiale varie en fonction de distance. Sept modèles de semi-variogramme (logarithmique, puissance, exponentiel, Gaussien, quadratique rationnel, sphérique et penta-sphérique) ont été ajustés aux semi-variogrammes expérimentaux journaliers, et ce tous les jours. Ces sept modèles de variogrammes ont été aussi utilisés pour pallier les incohérences liées aux interpolations négatives de la pluie. L’altitude, extraite d'un modèle numérique de terrain, a été incorporée dans les géostatistiques multi-variées. Sept stations de validation et la validation croisée ont été utilisées pour comparer la performance des méthodes d'interpolation. Les comparaisons sont aussi appliquées aux différentes densités de station ainsi qu’à leur disposition. Les pluies moyennes sur les bassins versants sont calculées et utilisées pour l'analyse de la pluie extrême. Les effets des méthodes d'interpolation sur la pluie extrême sont analysés. Les pluies interpolées sont aussi utilisées comme données du modèle physiquement basé et distribué, EPIC-GRID. La longue série de résultats du modèle est analysée par la comparaison avec les débits observés aux exutoires de différents bassins versants. Ensuite, les débits extrêmes aux exutoires sont calculés. Tous ces travaux prennent toujours en compte de la densité et la position des stations pour la plus faible densité.
Les résultats principaux montrent que parmi les méthodes se basant sur les données de pluie seules, les géostatistiques et IDW présentent les meilleures performances. Celles-ci évoluent en fonction de la densité de stations. Pour les résultats d’analyse de la pluie extrême et de modélisation hydrologique, peu de différence ont été constatées pour une densité de station élevée mais une grande différence pour le cas de stations plus dispersées. Pour ce cas des stations dispersées, UNK et KED sont sensibles à la position de la station. IDW, ORK et OCK sont les meilleures méthodes d’interpolation. Cependant, pour le débit extrême, KED et OCK sont les meilleures tandis qu’IDW n’est pas meilleure pour la densité élevée de station. Pour le cas des stations dispersées, la différence en débits extrêmes déterminés par les méthodes d'interpolation est très importante et plus marquée que dans les résultats de l’analyse de la pluie extrême et les résultats de modélisation à long terme. IDW, ORK et OCK sont toujours meilleures. UNK et KED sont toujours sensibles aux positions des stations. L'indice de position est utilisé pour décrire la forme du polygone défini par les quatre stations. Cet indice est défini par la relation entre le périmètre du polygone et un périmètre de cercle ayant une superficie équivalente à celui du polygone. La meilleure position de la station pour toutes les méthodes d'interpolation utilisées dans cette recherche devrait être autour du bassin versant, son indice de position devrait être proche à un.