En juillet 2021, les ingénieurs de DeepMind ont révolutionné la biologie en présentant une immense base de données sur la structure des protéines humaines. Ce mois-ci, ils ont réalisé un tour de force comparable dans le domaine de la science des matériaux avec GNoME. Cet outil basé sur le machine learning leur a permis d’identifier 2,2 millions de nouveaux cristaux, dont certains pourraient se retrouver au centre de technologies révolutionnaires.
Si cette contribution est importante, c’est parce qu’un nombre immense de technologies modernes dépendent directement de cristaux organiques, des puces informatiques aux panneaux solaires en passant par les batteries. Assez souvent, les progrès de ces technologies sont donc suspendus à la découverte de nouveaux cristaux aux propriétés intéressantes. Le problème, c’est que ces matériaux ne se bousculent pas au portillon.
Pourquoi est-ce difficile de trouver de nouveaux cristaux ?
Comme l’analyse de la structure des protéines que DeepMind a révolutionnée avec AlphaFold, la découverte de nouvelles structures exploitables est un processus empirique, effroyablement chronophage et éprouvant. Cela demande souvent des mois, voire des années d’expérimentation méthodique.
L’autre alternative, c’est d’essayer de forcer de puissants ordinateurs à calculer la structure d’un nouveau cristal à partir des propriétés des atomes. Mais là encore, comme pour la structure des protéines, c’est un problème tellement complexe que les méthodes basées sur la force brute ont vite atteint leurs limites.
Mais ce n’est pas tout, découvrir une nouvelle structure cristalline prometteuse ne suffit pas. Pour être exploitable dans le monde réel, il faut aussi que ce cristal soit stable, et c’est une propriété qui est très difficile à prévoir en amont. La technique la plus populaire se base sur un algorithme baptisé DFT (Density Functional Theory). Elle fonctionne globalement très bien, mais elle nécessite d’avoir déjà accès à une structure bien définie pour la tester. La plupart du temps, les chercheurs sont donc forcés d’avancer à tâtons, sans la moindre garantie d’obtenir des résultats exploitables.
Comment fonctionne GNoME ?
C’est là qu’intervient GNoME (Graph Networks for Material Exploration). En pratique, il s’agit d’un réseau de neurones un peu particulier, avec une structure dite « en graphe » (Graph Neural Network). Ce modèle est particulièrement pertinent dans la recherche de nouveaux cristaux, car fonctionnellement parlant, chaque nœud de ce graphe peut être assimilé à un atome qui partage des connexions avec ses voisins.
À partir de là, les chercheurs ont dû trouver des ressources pour l’entraînement du modèle. Ils ont opté pour le Materials Project, la plus grande base de données de matériaux open source au monde. Ils en ont extrait des données sur la structure et la stabilité de tous les cristaux connus.
Après chaque cycle d’entraînement, les chercheurs ont demandé à l’algorithme de générer de nouveaux cristaux candidats et d’estimer leur stabilité. Ils ont ensuite estimé la précision de ses prédictions en utilisant la DTF. Les résultats les plus cohérents ont ensuite été réinjectés dans le modèle.
Ce processus itératif original, baptisé « apprentissage actif », a permis d’augmenter drastiquement l’efficacité du processus de découverte. D’après les chercheurs, les méthodes traditionnelles génèrent un résultat exploitable dans moins de 10 % des cas ; GNoME, en revanche, a trouvé une structure cristalline cohérente dans plus de 80 % des cas.
Qu’a-t-il apporté ?
Avec ces beaux résultats en poche, les ingénieurs de DeepMind ont enfin pu mettre GNoME au travail — et le résultat s’est avéré bluffant. En l’espace de quelques jours, l’algorithme a identifié pas moins de 2,2 millions de nouvelles structures cristallines. Les auteurs ont estimé qu’au rythme actuel, une telle collection aurait nécessité environ… 800 ans de travail avec la méthode traditionnelle.
Et il ne s’agit pas d’un grand fourre-tout numérique sans aucun lien avec la réalité. DeepMind se focalise généralement sur des sujets de recherche qui ont un vrai intérêt pratique, et GNoME ne fait pas exception. En effet, 380 000 des cristaux identifiés sont considérés comme stables. En d’autres termes, l’algorithme a identifié des centaines de milliers de candidats prometteurs pour une synthèse en laboratoire. D’ailleurs, 736 de ces matériaux ont déjà été synthétisés, et des milliers d’autres vont sans doute l’être sur les prochaines années.
Ce sont des chiffres tout simplement sidérants. Jugez par vous-même. Jusqu’à présent, les méthodes traditionnelles avaient permis d’identifier moins de 48 000 cristaux stables en plusieurs décennies de recherche ; GNoME a multiplié ce nombre par plus de huit en un clin d’œil !
L’autre point fort de l’algorithme, c’est qu’il représente un complément idéal pour les nouvelles techniques de production qui sont en train d’apparaître en ce moment. Les chercheurs de DeepMind mentionnent notamment leurs collaborateurs d’un prestigieux laboratoire de Berkeley.
Ces derniers travaillent sur des techniques de synthèse automatisées qui permettent de produire des structures cristallines complexes sans intervention humaine, en se basant uniquement sur les propriétés des atomes. Ensemble, ces deux technologies pourraient permettre d’accélérer l’exploration de nouveaux matériaux révolutionnaire de façon exponentielle.
Qu’est-ce que ça change ?
Pour les chercheurs en science des matériaux, ce « livre de recettes » représente un changement de paradigme radical. Exactement comme pour la structure des protéines avec AlphaFold, ce qui prenait autrefois des mois de travail peut désormais devenir accessible en quelques clics.
Cela ne signifie pas que nous sommes à deux pas d’une immense révolution dans le monde de la science des matériaux. Ces simulations contiennent sans doute des erreurs, et tous ces cristaux ne seront pas utilisables en pratique. Le plus important, c’est que cette approche représente un nouvel horizon de recherche, avec des retombées potentiellement énormes sur des tas d’autres niches technologiques.
Car parmi ces cristaux, on trouve certains matériaux qui présentent un potentiel considérable pour le développement de technologies transformatrices. On peut citer les supraconducteurs, les supercalculateurs, des batteries de nouvelle génération pour les véhicules électriques, et ainsi de suite. Il faudra bien entendu les étudier au cas par cas, et les déceptions seront nombreuses. Mais il sera très intéressant de suivre les retombées de ces travaux qui, à terme, pourraient déboucher sur des progrès plus que conséquents.
Le communiqué de DeepMind est disponible ici.
Le papier de recherche DeepMind est disponible ici.
Le papier de recherche Berkeley est disponible ici.
L’ensemble de données est disponible sur le site du Materials Project, ici.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
Article passionnant, merci pour ce partage !