Apports de la fouille de données à la modélisation des communautés écologiques

Titre alternatif
Producteur
Contributeur(s)
Éditeur(s)
Identifiant documentaire 17-4083426
Identifiant OAI 4083426
Auteur(s): Si-Moussi Sara
Mots clés Inférence de réseaux Interprétabilité des modèles Réseau de neurones multi-Tâche Réseau d'interaction Niche écologique Modèle de distribution multi-Espèces
Date de publication 18/12/2020
Date de création
Date de modification
Date d'acceptation du document
Date de dépôt légal
Langue
Thème
Type de ressource
Source
Droits de réutilisation

Région

Département

Commune

Description
Pour anticiper l'impact potentiel des changements environnementaux sur les communautés écologiques, il est essentiel de comprendre les facteurs contrôlant la répartition géographique des organismes vivants et leurs interactions. En biogéographie, ce problème est abordé en analysant les observations des espèces dans diverses conditions environnementales. Au cours des dernières décennies, de grandes quantités de données sur la présence d'espèces ont été mises à disposition dans des bases de données ouvertes (par exemple GBIF), ainsi que des données environnementales décrivant le climat, l'occupation du sol, etc. Tout cela constitue un cadre propice au développement de méthodes de fouille de données de la biodiversité afin de (1) comprendre les facteurs qui déterminent la répartition observée des organismes vivants ; (2) prédire leur réponse aux conditions environnementales changeantes. Cette thèse s'inscrit dans ce contexte interdisciplinaire.En adoptant les théories de l'assemblage des communautés et des niches écologiques comme cadre conceptuel, nous présentons un cadre méthodologique pour l'analyse des données d'occurrence multi-espèces. Ensuite, nous illustrons son utilité par le biais de trois applications concrètes. Tout d'abord, nous abordons le problème de la recommandation des espèces en fonction de leur localisation géographique, appliqué aux données de végétation de l'application mobile Pl@ntNet. Nous avons évalué deux architectures alternatives rendues possibles par notre cadre méthodologique pour cette tâche : un réseau neuronal convolutif appliqué aux rasters environnementaux uniquement, et une architecture à base d'embeddings appliquée aux occurrences animales. Ensuite, nous présentons un nouveau cadre pour l'inférence d'associations asymétriques et bidirectionnelles à partir de co-abondances via une décomposition réponse-effet des réseaux de dépendance. Nous avons évalué notre proposition par rapport aux méthodes d'inférence de réseau les plus récentes dans le cadre d'une expérience de simulation, puis nous avons appliqué l'approche à l'analyse des comptages de plantes alpines sur un gradient méso-topographique. Troisièmement, nous avons étendu les modèles joints de distribution d'espèces afin de prendre en charge des descripteurs environnementaux riches et des réponses non linéaires à l'aide de réseaux neuronaux multitâches. Nous avons utilisé des variables latentes pour modéliser les associations d'espèces. Le modèle a été appliqué à l'étude des vers de terre de France et leurs associations, puis à la prédiction de la répartition géographique de leur diversité. Enfin, nous avons illustré sur le même cas d'étude l'utilisation d'outils d'interprétabilité pour démêler les préférences abiotiques capturées par le modèle joint.

0

Consultations

0

Téléchargements