Abstract :
[en] The main objective of this thesis was to develop genomic tools to support the conservation of local and endangered breeds in the long run. Different strategies can be considered to achieve this goal. On the one hand, collaboration between breeds can be enhanced by optimizing exchanges among them while preserving their intrinsic diversity and specificities. To investigate how different red-pied cattle breeds could collaborate, their between- and within-breed diversity were first studied. The principal component analysis (PCA), the fixation index (Fst) and the phylogenic tree based on genotypes (39,967 single nucleotide polymorphisms [SNPs]) of eight red-pied cattle breeds (795 animals) from Benelux showed that the East Belgian Red and White (EBRW), the Red-Pied of the Ösling (RPO), the Meuse-Rhine-Yssel (MRY), the Deep Red (DR) and the Improved Red (IR) breeds were part of a genomic continuum, making collaborations between these breeds theoretically possible.
Moreover, Euclidean distances of animals to PCA centroids and ADMIXTURE proportions allowed to detect animals that could potentially be part of the reference population of EBRW and RPO for further genomic evaluations. For both breeds, animals from MRY, DR and IR could potentially be used for such a purpose. This is a first step for the development of an across-breed reference population necessary to build a genomic evaluation system for EBRW and RPO. Inbreeding coefficients (F) were also estimated through the study of runs of homozygosity (ROH) and were found to be relatively low, except for the Groningen White Headed (GWH) breed. To have a first insight of the gene flow between breeds, an ADMIXTURE clustering was performed. It was found that the EBRW, DR and IR breeds shared a similar pattern of ADMIXTURE. The history of these breeds can be further investigated, for example with D-statistics.
On the other hand, genomic breed assignment tools can also be used for the conservation of endangered breeds and the building of a reference population. This kind of tools can help to register animals from endangered breeds, which often lack pedigree, to their breeding book. They can also ensure the consumer’s trust by certifying the breed of origin of local breed-derived products. This is of particular interest for Dual-Purpose Blue (DPB), whose meat is marketed under a specific brand. In this case, it is important to clearly distinguish meat of DPB from this of Beef Belgian Blue (BBB) which is its mainstream sister breed.
To develop a breed assignment tool, there are three main steps to follow:
1. The selection of breed-informative markers
2. Optimization of a classification method based on a training population
3. Validation of the developed model on new animals
In this thesis, to develop a breed assignment tool, 17,773 SNPs and 557 animals from 12 breeds were used. For the selection of SNPs, five different methodologies were followed: three different kinds of PCA combined with a random forest (RF), Fst values combined with RF, and the partial least squares-discriminant analysis (PLS-DA). The whole available SNP panel was also tested. Then, the different SNP panels were used in four different classification methods: PLS-DA, nearest shrunken centroids (NSC), RF and linear support vector machine (SVM). Best models, with more than 90% of global accuracy in cross-validation, were finally evaluated on new animals. Results showed that the PLS-DA for selection of SNPs followed by the NSC for classification of animals provided the best results in validation (99% or 98% of correct assignment depending on the threshold used for SNP selection). The developed tool was also applied on meat samples of DPB, BBB and Holstein (HOL) to determine the feasibility to distinguish DPB from BBB meat. It was possible to assign each meat sample to its breed with a probability of one, making the development of a certification tool plausible.
Finally, a model based on a genomic relationship matrix (GRM) as an input of a linear SVM was compared to the previously developed model. The objective was to get rid of the step of selection of SNPs. This model based on all SNPs gave a similar level of global accuracy in validation compared to the model based on a SNP subset (97.97% vs. 97.86%). It was also faster to compute.
Further developments of breed assignment tools involve their adaptation for the detection of crossbreds. Another perspective is the simulation of exchanges between local sister breeds to optimize them in real conditions. A final suggestion is to include explicitly genotypes in guidelines to define endangered breeds, for the creation of breeding programs and herd books and for the optimization of exchanges between sister breeds.
[fr] L’objectif principal de cette thèse est le développement d’outils génomiques permettant le soutien et la conservation sur le long terme de races locales et/ou menacées. Pour atteindre cet objectif, plusieurs stratégies peuvent être élaborées. D’une part, la collaboration entre les différentes races locales peut être améliorée en optimisant les échanges d’animaux et/ou de semence. Ces échanges doivent simultanément préserver la diversité et les spécificités intrinsèques des différentes races locales. Pour déterminer comment différentes races locales pie-rouges pourraient collaborer, leur diversité inter- et intra-raciale a premièrement été étudiée. L’analyse en composante principale, l’index de fixation (Fst) et l’arbre phylogénétique basés sur les génotypes (39,967 polymorphismes d’un seul nucléotide [SNPs]) de huit races bovines locales (795 animaux) du Benelux ont démontré que la Rouge-Pie de l’Est de la Belgique, la Pie-Rouge de l’Ösling, la Meuse-Rhin-Yssel, la « Brandrode rund » et la Rouge améliorée font partie d’un continuum génomique. La collaboration entre ces différentes races semble donc possible.
De plus, les distances euclidiennes des animaux par rapport aux centroïdes de l’analyse en composantes principales et aux proportions du clustering « ADMIXTURE » ont permis de détecter les animaux qui pourraient faire partie des populations de référence des races Rouge-Pie de l’Est de la Belgique et Pie-Rouge de l’Ösling pour de futures évaluations génomiques. Pour les deux races, des animaux appartenant aux races Meuse-Rhin-Yssel, « Brandrode rund » et Rouge améliorée peuvent potentiellement être utilisés dans ce but. Il s’agit d’une première étape pour le développement d’une population de référence conjointe, nécessaire pour le développement d’un système d’évaluations génomiques. Les coefficients de consanguinité (F) ont aussi été estimés grâce à l’étude des segments en homozygotie. Ils étaient relativement bas, sauf pour la race « Groningen White Headed». Pour avoir un aperçu des flux génétiques entre races, un clustering a été réalisé. Il a permis de démontrer que les races Rouge-Pie de l’Est de la Belgique, « Brandrode rund » et Rouge améliorée partagent un motif similaire de clustering. L’histoire de ces races peut être étudiée de façon plus approfondie, par exemple à l’aide des statistiques D.
D’autre part, un autre outil génomique peut être utilisé pour aider à la conservation des races menacées et construire une population de référence: l’outil génomique d’assignation à la race. Ce type d’outil peut aider à l’enregistrement des animaux de races menacées, pour lesquels le pedigree est souvent manquant, dans leur livre généalogique. Il peut aussi assurer la confiance du consommateur en certifiant la race d’origine de produits dérivés de races locales. Cette application trouve un intérêt particulier pour la race Bleue mixte, dont la viande est vendue sous une marque spécifique. Dans ce cas, il est important de clairement distinguer la viande de Bleue mixte de celle de sa race sœur, la Blanc Bleu Belge, qui est une race à grands effectifs.
Pour développer un outil d’assignation à la race, trois étapes principales doivent être suivies :
1. La sélection de marqueurs informatifs
2. L’optimisation d’une méthode de classification en utilisant une population d’entraînement
3. La validation du modèle développé sur de nouveaux animaux
Dans cette thèse, pour développer un outil d’assignation à la race, 17 773 SNPs et 557 animaux appartenant à 12 races ont été utilisés. Pour la sélection des SNPs, cinq méthodologies différentes ont été suivies : trois différents types d’analyse en composantes principales combinée avec une forêt aléatoire, l’index de fixation également combiné avec la forêt aléatoire, et l’analyse discriminante dite « PLS-DA ». En plus de ces panels sélectionnés, la classification a également été développée sur l’ensemble des SNPs disponibles. Quatre méthodes de classification ont ensuite été testées : la PLS-DA, la méthode du plus proche centroïde corrigé, la forêt aléatoire et la machine à vecteurs de support linéaire. Les meilleurs modèles, avec plus de 90% d’assignation correcte en validation croisée, ont finalement été évalués sur de nouveaux animaux. Les résultats ont démontré que l’utilisation de la PLS-DA pour la sélection des SNPs suivie de la classification basée sur la méthode du plus proche centroïde corrigé donnait les meilleurs résultats en validation (99% ou 98% d’assignation correcte en fonction du seuil choisi pour la sélection des SNPs). L’outil développé a aussi été utilisé sur des morceaux de viande de Bleue mixte, de Blanc Bleue Belge et de Holstein pour déterminer la faisabilité de distinguer la viande de Bleue mixte de celle de la Blanc Bleu Belge. Il a été possible d’assigner chaque morceau de viande à sa race avec une probabilité de un. Le développement d’un outil de certification semble donc faisable.
Finalement, un modèle utilisant différentes variables basées sur la matrice de relation génomique comme entrées pour une machine à vecteurs de support linéaire a été comparée au modèle précédemment développé. L’objectif était de passer outre l’étape de sélection des SNPs. Le modèle basé sur tous les SNPs a donné un pourcentage d’assignation correcte en validation similaire à celui du modèle basé sur un sous-jeu de SNPs (97,97% vs. 97,86%). Il était aussi plus rapide pour effectuer l’assignation.
Les prochains développements pour l’outil d’assignation à la race comprennent leur adaptation pour la détection d’animaux croisés. Une autre perspective de ce travail est la simulation d’échanges d’animaux et/ou de semence entre animaux de races locales afin de les optimiser en conditions réelles. Une suggestion finale est l’inclusion explicite des génotypes dans les lignes directrices permettant de définir les races menacées, la création de programmes d’élevage, de livres généalogiques et l’optimisation d’échanges d’animaux et/ou de semence entre races locales.