Détail de l'archive

Moins d’expérimentations animales grâce à l’apprentissage automatique

26 avril 2022 | Barbara Vonarburg

Des chercheuses et chercheurs de l’Eawag utilisent les algorithmes informatiques pour prédire la toxicité de substances chimiques sur les poissons. L’apprentissage automatique permet de définir les priorités pour les expérimentations prévues et de fortement réduire les expérimentations animales à terme.

D’innombrables substances chimiques, dont les engrais et les pesticides, mais aussi des substances pharmaceutiques et des produits chimiques industriels, se déversent dans les eaux souterraines, les lacs et les rivières. «Nous cherchons à savoir quel impact ont les produits chimiques sur les animaux aquatiques, s’ils sont toxiques ou pas», explique Marco Baity-Jesi, responsable du groupe Sciences des données de l’Eawag. Pour cela, on expose dans des bassins des poissons à une substance à différents degrés de concentration. Ces expérimentations animales, mortelles pour les poissons, sont controversées d’un point de vue éthique et, par ailleurs, dispendieuses. «Au lieu de mener ce type d’expérimentations, nous voulons prédire les effets des produits chimiques sur les poissons avec les méthodes de l’apprentissage automatique», explique le physicien. Pour ce projet, son équipe travaille avec le groupe de Kristin Schirmer, qui développe des alternatives expérimentales aux expérimentations sur les poissons à l’aide de lignées cellulaires de poissons.

Pour leur matériau de base, les scientifiques utilisent la banque de données des autorités américaines de protection de l’environnement. Elle contient les résultats d’expérimentations réalisées avec près de 2’200 produits chimiques testés sur 345 espèces de poissons. Au total, les chercheuses et chercheurs ont pu utiliser près de 20’000 entrées. «Ce n’est pas un jeu de données immense, mais cela suffit pour notre projet», déclare le physicien. Après l’analyse et le traitement des données, son équipe a écrit le logiciel pour différents modèles d’apprentissage automatique adaptés à l’objectif recherché. Les scientifiques ont exploité la plupart des données comme matériel d’entraînement et les ont utilisées pour alimenter leurs modèles d’apprentissage automatique. Les chercheuses et chercheurs ont alors réservé une petite partie comme jeu de données test afin d’analyser le niveau de concordance entre les prévisions calculées par la machine et les résultats expérimentaux.

Des prévisions précises

Les chercheuses et chercheurs ont à présent publié leurs résultats dans une première étude. Sur la base des échantillons appris, les modèles peuvent prédire à une vitesse éclair si les produits chimiques sont plus ou moins toxiques pour une espèce de poissons. Les prévisions de l’ordinateur sont juste à plus de 90%. «Les prévisions modélisées ne peuvent pas être tout à fait parfaites, explique Marco Baity-Jesi, car les expérimentations ne le sont pas non plus.» On trouve donc souvent des informations contradictoires sur les expérimentations avec une substance et une espèce de poisson déterminées. «Lorsque l’on procède deux fois à une expérimentation avec la même substance chimique, elle peut être classée dans deux catégories différentes de toxicité», précise le chercheur. «Les modèles ne peuvent pas être meilleurs que les données dont ils apprennent.»

Les autrices et auteurs de l’étude ont été surpris de constater qu’un nouveau modèle, qui donne des résultats probants en toxicologie humaine, ne fournit pas de résultats plus précis que les modèles standards utilisés. «Globalement, nos résultats sont très satisfaisants», estime Marco Baity-Jesi. «Mais bien que nos modèles puissent être utilisés par tout le monde en ligne, de nombreux autres tests sont nécessaires avant que la machine puisse remplacer les expérimentations animales et soit utilisée dans le cadre de la réglementation.»

Des poissons aux invertébrés et aux algues

Les résultats actuels ne représentent qu’une infime partie des produits chimiques et des organismes que nous souhaitons tester. Pour élargir le champ d’application des modèles, il faut un large éventail de données, tant pour l’entraînement des algorithmes que pour leurs tests. Dans l’étape suivante, le groupe de scientifiques veut intégrer à son travail d’autres poissons, mais aussi des invertébrés et des algues. De plus, les données des expérimentations sur les lignées cellulaires de poissons soutiendront les modèles à l’avenir. Le succès des travaux du groupe de Kristin Schirmer a été démontré lorsque l’OCDE a reconnu l’année dernière le test des lignées cellulaires de poissons développé à l’Eawag comme nouvelle directive pour l’agrément de produits chimiques.

«Plus on présente de données aux modèles, meilleurs ils deviennent», explique Marco Baity-Jesi. Il faut également veiller à entraîner les modèles dans le domaine où on veut les utiliser. Si les produits chimiques ou les organismes sont trop différents de ceux testés lors des expérimentations, la précision de l’apprentissage automatique diminue également. Il convient donc d’avoir conscience des limites de sa fiabilité.

Dans certains cas, les prévisions informatiques devront être confirmées par des tests. «Il est donc improbable que l’apprentissage automatique soit à lui seul en mesure de remplacer totalement les expérimentations animales, mais il peut contribuer à fortement les réduire», écrivent les scientifiques. Et Marco Baity-Jesi voit d’ores et déjà une importante possibilité d’emploi des algorithmes informatiques: «Si on dispose par exemple de ressources pour seulement cinq expérimentations, mais des milliers de produits chimiques et d’espèces animales, nos modèles peuvent nous dire quelles substances et quels animaux tester en premier.» L’apprentissage automatique aide donc à fixer des priorités dans la recherche environnementale.

Publications

Extbase Variable Dump
array(2 items)
   publications => '24672' (5 chars)
   libraryUrl => '' (0 chars)
Extbase Variable Dump
array(1 item)
   0 => Snowflake\Publications\Domain\Model\Publicationprototypepersistent entity (uid=24672, pid=124)
      originalId => protected24672 (integer)
      authors => protected'Wu, J.; D'Ambrosi, S.; Ammann, L.; Stadnicka-Michalak, J
         .; Schirmer, K.; Baity-Jesi, M.
' (117 chars) title => protected'Predicting chemical hazard across taxa through machine learning' (63 chars) journal => protected'Environment International' (25 chars) year => protected2022 (integer) volume => protected163 (integer) issue => protected'' (0 chars) startpage => protected'107184 (15 pp.)' (15 chars) otherpage => protected'' (0 chars) categories => protected'machine learning; acute toxicity; ecotoxicology; animal testing; in vivo tes
         ting; RASAR; fish
' (93 chars) description => protected'We applied machine learning methods to predict chemical hazards focusing on
         fish acute toxicity across taxa. We analyzed the relevance of taxonomy and e
         xperimental setup, showing that taking them into account can lead to conside
         rable improvements in the classification performance. We quantified the gain
          obtained throught the introduction of taxonomic and experimental informatio
         n, compared to classification based on chemical information alone. We used o
         ur approach with standard machine learning models (K-nearest neighbors, rand
         om forests and deep neural networks), as well as the recently proposed Read-
         Across Structure Activity Relationship (RASAR) models, which were very succe
         ssful in predicting chemical hazards to mammals based on chemical similarity
         . We were able to obtain accuracies of over 93% on datasets where, due to no
         ise in the data, the maximum achievable accuracy was expected to be below 96
         %. The best performances were obtained by random forests and RASAR models. W
         e analyzed metrics to compare our results with animal test reproducibility,
         and despite most of our models "outperform animal test reproducibility" as m
         easured through recently proposed metrics, we showed that the comparison bet
         ween machine learning performance and animal test reproducibility should be
         addressed with particular care. While we focused on fish mortality, our appr
         oach, provided that the right data is available, is valid for any combinatio
         n of chemicals, effects and taxa.
' (1477 chars) serialnumber => protected'0160-4120' (9 chars) doi => protected'10.1016/j.envint.2022.107184' (28 chars) uid => protected24672 (integer) _localizedUid => protected24672 (integer)modified _languageUid => protectedNULL _versionedUid => protected24672 (integer)modified pid => protected124 (integer)
Wu, J.; D'Ambrosi, S.; Ammann, L.; Stadnicka-Michalak, J.; Schirmer, K.; Baity-Jesi, M. (2022) Predicting chemical hazard across taxa through machine learning, Environment International, 163, 107184 (15 pp.), doi:10.1016/j.envint.2022.107184, Institutional Repository

Coopération

  • Eawag
  • ETH Zürich
  • Sapienza University of Rome, Italy
  • Institut fédéral de recherches sur la forêt, la neige et le paysage WSL
  • EPFL

Financement

Ce projet a été financé par la subvention du SDSC "Enhancing Toxicological Testing through Machine Learning" (projet n° C20-04).