L'IA en chimie : une révolution en attente de données
L'intelligence artificielle (IA) a fait des progrès remarquables dans de nombreux domaines, mais en chimie, la révolution promise par l'IA est encore en attente. La raison principale de ce retard est le manque de données disponibles pour alimenter les systèmes d'IA affamés.
L'importance des données pour l'IA en chimie
Tout système d'IA n'est aussi bon que les données sur lesquelles il est formé. Ces systèmes s'appuient sur ce que l'on appelle des réseaux neuronaux, que leurs développeurs enseignent à l'aide de jeux de données d'entraînement qui doivent être grands, fiables et exempts de biais. Si les chimistes veulent exploiter tout le potentiel des outils génératifs d'IA, ils doivent aider à établir de tels jeux de données d'entraînement. Plus de données sont nécessaires - à la fois expérimentales et simulées - y compris des données historiques et des connaissances autrement obscures, comme celles issues d'expériences infructueuses. Et les chercheurs doivent s'assurer que les informations résultantes sont accessibles. Cette tâche est encore très largement en cours.
Les défis de l'IA en chimie
Prenons, par exemple, les outils d'IA qui effectuent la rétrosynthèse. Ils commencent par une structure chimique qu'un chimiste veut fabriquer, puis travaillent à rebours pour déterminer les meilleurs matériaux de départ et la séquence d'étapes de réaction pour la fabriquer. Les systèmes d'IA qui mettent en œuvre cette approche ont attiré l'attention, mais peu de chimistes les ont encore adoptés.
Pour faire des prédictions chimiques précises, un système d'IA a besoin de connaissances suffisantes sur les structures chimiques spécifiques avec lesquelles différentes réactions fonctionnent. Les chimistes qui découvrent une nouvelle réaction publient généralement des résultats explorant cela, mais souvent ces résultats ne sont pas exhaustifs. À moins que les systèmes d'IA n'aient une connaissance complète, ils pourraient finir par suggérer des matériaux de départ avec des structures qui empêcheraient les réactions de fonctionner ou conduiraient à des produits incorrects.
L'avenir de l'IA en chimie
Il existe une solution particulièrement évidente : les outils d'IA ont besoin de données ouvertes. La façon dont les gens publient leurs articles doit évoluer pour rendre les données plus accessibles. C'est une des raisons pour lesquelles Nature demande aux auteurs de déposer leur code et leurs données dans des dépôts ouverts. C'est aussi une autre raison de se concentrer sur l'accessibilité des données, au-delà des crises scientifiques entourant la réplication des résultats et les rétractations de haut niveau.
Les applications de chimie nécessitent que les modèles informatiques soient meilleurs que le meilleur scientifique humain. Ce n'est qu'en prenant des mesures pour collecter et partager des données que l'IA pourra répondre aux attentes en chimie et éviter de devenir un cas de battage médiatique
L'IA en chimie : une révolution en attente de données
L'intelligence artificielle (IA) a fait des progrès remarquables dans de nombreux domaines, mais en chimie, la révolution promise par l'IA est encore en attente. La raison principale de ce retard est le manque de données disponibles pour alimenter les systèmes d'IA affamés.
L'importance des données pour l'IA en chimie
Tout système d'IA n'est aussi bon que les données sur lesquelles il est formé. Ces systèmes s'appuient sur ce que l'on appelle des réseaux neuronaux, que leurs développeurs enseignent à l'aide de jeux de données d'entraînement qui doivent être grands, fiables et exempts de biais. Si les chimistes veulent exploiter tout le potentiel des outils génératifs d'IA, ils doivent aider à établir de tels jeux de données d'entraînement. Plus de données sont nécessaires - à la fois expérimentales et simulées - y compris des données historiques et des connaissances autrement obscures, comme celles issues d'expériences infructueuses. Et les chercheurs doivent s'assurer que les informations résultantes sont accessibles. Cette tâche est encore très largement en cours.
Les défis de l'IA en chimie
Prenons, par exemple, les outils d'IA qui effectuent la rétrosynthèse. Ils commencent par une structure chimique qu'un chimiste veut fabriquer, puis travaillent à rebours pour déterminer les meilleurs matériaux de départ et la séquence d'étapes de réaction pour la fabriquer. Les systèmes d'IA qui mettent en œuvre cette approche ont attiré l'attention, mais peu de chimistes les ont encore adoptés.
Pour faire des prédictions chimiques précises, un système d'IA a besoin de connaissances suffisantes sur les structures chimiques spécifiques avec lesquelles différentes réactions fonctionnent. Les chimistes qui découvrent une nouvelle réaction publient généralement des résultats explorant cela, mais souvent ces résultats ne sont pas exhaustifs. À moins que les systèmes d'IA n'aient une connaissance complète, ils pourraient finir par suggérer des matériaux de départ avec des structures qui empêcheraient les réactions de fonctionner ou conduiraient à des produits incorrects.
L'avenir de l'IA en chimie
Il existe une solution particulièrement évidente : les outils d'IA ont besoin de données ouvertes. La façon dont les gens publient leurs articles doit évoluer pour rendre les données plus accessibles. C'est une des raisons pour lesquelles Nature demande aux auteurs de déposer leur code et leurs données dans des dépôts ouverts. C'est aussi une autre raison de se concentrer sur l'accessibilité des données, au-delà des crises scientifiques entourant la réplication des résultats et les rétractations de haut niveau.
Les applications de chimie nécessitent que les modèles informatiques soient meilleurs que le meilleur scientifique humain. Ce n'est qu'en prenant des mesures pour collecter et partager des données que l'IA pourra répondre aux attentes en chimie et éviter de devenir un cas de battage médiatique
L'IA en chimie : une révolution en attente de données
L'intelligence artificielle (IA) a fait des progrès remarquables dans de nombreux domaines, mais en chimie, la révolution promise par l'IA est encore en attente. La raison principale de ce retard est le manque de données disponibles pour alimenter les systèmes d'IA affamés.
L'importance des données pour l'IA en chimie
Tout système d'IA n'est aussi bon que les données sur lesquelles il est formé. Ces systèmes s'appuient sur ce que l'on appelle des réseaux neuronaux, que leurs développeurs enseignent à l'aide de jeux de données d'entraînement qui doivent être grands, fiables et exempts de biais. Si les chimistes veulent exploiter tout le potentiel des outils génératifs d'IA, ils doivent aider à établir de tels jeux de données d'entraînement. Plus de données sont nécessaires - à la fois expérimentales et simulées - y compris des données historiques et des connaissances autrement obscures, comme celles issues d'expériences infructueuses. Et les chercheurs doivent s'assurer que les informations résultantes sont accessibles. Cette tâche est encore très largement en cours.
Les défis de l'IA en chimie
Prenons, par exemple, les outils d'IA qui effectuent la rétrosynthèse. Ils commencent par une structure chimique qu'un chimiste veut fabriquer, puis travaillent à rebours pour déterminer les meilleurs matériaux de départ et la séquence d'étapes de réaction pour la fabriquer. Les systèmes d'IA qui mettent en œuvre cette approche ont attiré l'attention, mais peu de chimistes les ont encore adoptés.
Pour faire des prédictions chimiques précises, un système d'IA a besoin de connaissances suffisantes sur les structures chimiques spécifiques avec lesquelles différentes réactions fonctionnent. Les chimistes qui découvrent une nouvelle réaction publient généralement des résultats explorant cela, mais souvent ces résultats ne sont pas exhaustifs. À moins que les systèmes d'IA n'aient une connaissance complète, ils pourraient finir par suggérer des matériaux de départ avec des structures qui empêcheraient les réactions de fonctionner ou conduiraient à des produits incorrects.
L'avenir de l'IA en chimie
Il existe une solution particulièrement évidente : les outils d'IA ont besoin de données ouvertes. La façon dont les gens publient leurs articles doit évoluer pour rendre les données plus accessibles. C'est une des raisons pour lesquelles Nature demande aux auteurs de déposer leur code et leurs données dans des dépôts ouverts. C'est aussi une autre raison de se concentrer sur l'accessibilité des données, au-delà des crises scientifiques entourant la réplication des résultats et les rétractations de haut niveau.
Les applications de chimie nécessitent que les modèles informatiques soient meilleurs que le meilleur scientifique humain. Ce n'est qu'en prenant des mesures pour collecter et partager des données que l'IA pourra répondre aux attentes en chimie et éviter de devenir un cas de battage médiatique.
En conclusion, la chimie est un domaine qui a beaucoup à gagner de l'IA, mais il reste encore beaucoup à faire pour surmonter les obstacles liés aux données. Avec un engagement continu envers l'ouverture des données et l'amélioration de la qualité des données d'entraînement, l'IA a le potentiel de transformer la chimie de manière significative.
Source : Nature