Abstract :
[fr] Cette thèse de doctorat, fruit de la collaboration entre les universités de Mons et de
Liège (Belgique), traite de la conceptualisation et le développement d’une architecture
cloud distribuée polyvalente destinée à la gestion des données dans le domaine du
Smart Farming. Cette architecture est suffisamment générique pour être utilisée dans
d’autres domaines.
Les chercheurs sont poussés par les bailleurs de fonds à conserver et échanger
leurs bases de données expérimentales et de tests en vue de les valoriser dans le cadre
d’autres projets. La réutilisation des données est motivée par la possibilité d’investir
dans une plus vaste gamme de projets en évitant les redondances liées notamment aux
données. Notre approche s’inscrit dans le cadre de l’Open Data et de l’Open Science où
des architectures distribuées sont utilisées pour le stockage massif de données.
De nombreuses architectures et plateformes IoT génériques existent sur le marché
répondant à des besoins variés. Mais, il y a un manque d’outils spécialisés pour
la recherche et leur valorisation d’une part et adressant les besoins spécifiques de
communautés de chercheurs d’autre part. De plus, les plateformes existantes restent
tributaires de la maintenance et de la volonté de pérennisation de la société et/ou de
la communauté qui les développent. En matière de recherche scientifique, des plateformes
existent sous forme d’écosystèmes cloisonnés la plupart du temps ce qui ne
permet pas une valorisation industrielle praticable des recherches menées.
Fort de ces constats, nous proposons dans cette thèse de doctorat, de concevoir une
architecture Cloud spécifique au Smart Farming, durable, améliorable et adaptable en
fonction des cas d’utilisation sans remettre en cause l’ensemble de l’architecture. Nous
proposons également la mise en place d’une chaîne de valeur partant de l’acquisition
des données, leur traitement et stockage, l’hébergement d’applicatifs permettant leur
exploitation jusqu’à la valorisation et leur exploitation par l’utilisateur final.
Nos recherches s’appuient sur un cas d’utilisation concret permettant de mettre
en relief les limites d’utilisation que l’architecture cloud doit pouvoir adresser. Ce cas
d’utilisation est l’analyse comportementale des animaux de ferme au pâturage.Les chercheurs sont incités de plus en plus à conserver et échanger leurs données ce
qui se traduit par des besoins en matière de pérennisation de leur infrastructure, de traçabilité
et de documentation de leurs données, et de standardisation de leurs outils. Ils
sont également amenés à développer des chaînes de traitement en temps réels ou par
lots pour traiter des données provenant de sources multiples et dans des formats variés.
Notre architecture se veut innovante, modulable, adaptable à un large panel de cas
d’utilisation sans avoir à remettre en question sa structure ni ses briques logicielles
constitutives. L’utilisation de composants logiciels interchangeables, rendent durable
l’architecture et l’immunise vis-à-vis de la disparition de l’un de ses composants logiciels.
A contrario, une brique logicielle peut être remplacée par une autre plus adaptée
ou plus performante. De plus, elle offre la possibilité d’héberger et par la suite de monétiser
les applicatifs développés par les chercheurs. Sa composante Edge Computing
(capacité de traitement située en périphérie du réseau) permet de déployer grâce aux
techniques de conteneurisation des micro-services et des algorithmes d’Intelligence
Artificielle (IA) adaptés au plus près des capteurs.
[en] This PhD thesis, a collaboration between the Universities of Mons and Liege (Belgium),
deals with the conceptualization and development of a versatile distributed
cloud architecture for data management in the Smart Farming domain. This architecture
is generic enough to be used in other domains.
Researchers are pressured by funders to maintain and share their experimental and
test databases for use in other projects. Data reuse is motivated by the possibility of
investing in a wider range of projects while avoiding data-related redundancies. Our
approach is in line with the Open Data and Open Science framework where distributed
architectures are used for massive data storage.
Many generic IoT architectures and platforms exist on the market to meet various
needs. However, there is a lack of specialized tools for research and their valorization
on the one hand and addressing the specific needs of communities of researchers on the
other hand. Moreover, the existing platforms remain dependent on the maintenance
and the will of the company and/or the community that develops them. In terms of
scientific research, platforms exist in the form of ecosystems that are mostly compartmentalized,
which does not allow for a practical industrial valorization of the research
conducted.
Based on these findings, we propose in this PhD thesis to design a Cloud architecture
specific to Smart Farming, sustainable, improvable and adaptable according to
the use cases without calling into question the whole architecture. We also propose the
implementation of a value chain starting from the acquisition of data, their processing
and storage, the hosting of applications allowing their exploitation until the valorization
and their exploitation by the final user.
Our research is based on a concrete use case that highlights the limitations that the
cloud architecture must be able to address. This use case is the behavioral analysis of
farm animals at pasture.
Researchers are increasingly encouraged to preserve and exchange their data, which translates into needs for the durability of their infrastructure, traceability and documentation
of their data, and standardization of their tools. They also need to develop
real-time or batch processing chains to handle data from multiple sources and in various
formats.
Our architecture is innovative, modular and adaptable to a wide range of use cases
without having to question its structure or its constituent software bricks. The use of
interchangeable software components makes the architecture durable and makes it
immune to the disappearance of one of its software components. On the other hand,
a software brick can be replaced by another one that is more adapted or more efficient.
In addition, it offers the possibility of hosting and subsequently monetizing the
applications developed by researchers. Its Edge Computing component (processing
capacity located at the edge of the network) enables the deployment of micro-services
and Artificial Intelligence (AI) algorithms adapted as close as possible to the sensors,
using containerization techniques.
Institution :
UMONS - Université de Mons [Polytechnique], Mons, Belgium
ULiège. GxABT - Liège Université. Gembloux Agro-Bio Tech [GxABT], Gembloux, Belgium