Meta développe un modèle d'IA pour prédire les structures des protéines et faciliter la découverte de médicaments

Meta a dévoilé un modèle d'IA capable de prédire la forme des protéines - et potentiellement d'aider à trouver de nouveaux médicaments - en utilisant la même technologie que celle qui permet à ChatGPT d'obtenir des réponses semblables à celles des humains.

Introduction

Les chercheurs de Meta ont développé un nouveau modèle d'intelligence artificielle (IA) appelé ESM-2, qui est capable de prédire avec précision la structure tridimensionnelle des protéines. Cette avancée pourrait avoir un impact considérable sur la découverte de nouveaux médicaments et la compréhension des processus biologiques. L'IA utilise la même technologie que ChatGPT pour obtenir des réponses semblables à celles des humains.

Le modèle ESM-2

ESM-2 est un modèle de langage biologique pré-entraîné qui utilise la méthode d'apprentissage profond par transfert pour prédire la structure des protéines. Il est basé sur le modèle Transformer, qui a déjà été utilisé avec succès dans des applications de traitement du langage naturel comme ChatGPT. Le modèle est capable de prédire des structures avec une précision comparable à celle d'AlphaFold2, un autre modèle de prédiction de structure de protéines très performant.

Calibration et performances du modèle

Pour évaluer les performances d'ESM-2, les chercheurs ont comparé les prédictions du modèle avec des structures protéiques expérimentalement déterminées. Ils ont constaté que le modèle était bien calibré et que la confiance accordée aux prédictions était corrélée à la précision des prédictions. ESM-2 est également plus rapide qu'AlphaFold2, ce qui permet de prédire un plus grand nombre de structures en moins de temps.

Les chercheurs de Meta AI ont produit cette représentation numérique d'un million de protéines à l'aide d'un nouvel outil d'intelligence artificielle appelé ESMFold.

Applications et impact sur la recherche

ESM-2 a été utilisé pour prédire la structure de millions de protéines issues de séquences métagénomiques. Ces prédictions ont permis de découvrir de nombreuses structures protéiques qui n'étaient pas représentées dans les bases de données existantes. De plus, le modèle a permis d'identifier des similarités structurelles entre protéines malgré l'absence de similarité au niveau des séquences.

Les chercheurs ont créé l'ESM Metagenomic Atlas, une ressource en ligne qui rend toutes les structures prédites accessibles au public. Cet outil permettra aux scientifiques d'analyser et d'étudier ces structures pour mieux comprendre la diversité naturelle des protéines et accélérer la découverte de nouvelles structures et fonctions.

Conclusion

Le modèle ESM-2 développé par Meta représente une avancée majeure dans la prédiction de la structure des protéines. Grâce à sa précision et sa rapidité, il a le potentiel d'accélérer les découvertes en biologie et en médecine, notamment dans le domaine de la découverte de médicaments. L'ESM Metagenomic Atlas, rendant les prédictions accessibles au public, est également un outil précieux pour la communauté scientifique.

Source : science.org