Depuis quelques semaines, la toile n’a d’yeux que pour ChatGPT. L’incroyable chatbot dopé au machine learning conçu par OpenAI a déjà montré qu’il était capable de tenir des conversations, de rédiger des textes de fiction, d’aider des étudiants à tricher… et un jour, il pourra peut-être participer à la lutte contre la maladie d’Alzheimer.
Il s’agit d’une maladie neurodégénérative aux conséquences terribles pour les patients et leurs entourages. Elle se traduit typiquement par des pertes de mémoire et de lucidité qui peuvent prendre des proportions catastrophiques avec le temps. Les patients ont alors tendance à s’exprimer de façon décousue, incohérente, voire à peine intelligible.
Le problème, c’est que malgré des pistes prometteuses, il n’existe toujours aucun traitement à proprement parler. Certes, il existe bien des protocoles qui permettent de combattre les symptômes, mais nous sommes encore incapables de guérir complètement ce fléau.
Tout l’enjeu est donc de parvenir à poser ce diagnostic lourd de conséquences le plus tôt possible. En effet, l’efficacité du traitement dépend beaucoup du moment de la prise en charge. Si la maladie est repérée lors de la phase précoce, il est possible d’en ralentir considérablement la progression.
Mais on se retrouve alors face à un autre problème. Car même lorsqu’on se montre particulièrement vigilant, il n’est pas toujours évident d’identifier la maladie d’Alzheimer lors de la phase précoce. En effet, les symptômes ont tendance à apparaître relativement tard. « Des études ont montré qu’au moment où le diagnostic est posé, jusqu’à 90 % des cellules cérébrales peuvent déjà être mortes », expliquait Valerie Daggett, professeure de bio-ingénierie à l’Université de Washington qui a développé un test sanguin pour diagnostiquer la maladie.
Des outils statistiques pour traquer la maladie
Pour contourner ce problème, la solution la plus évidente serait de mettre en place un suivi systématique de la population, en particulier chez les patients à risque. Car pour se donner toutes les chances de parvenir au bon diagnostic, il faut typiquement passer par des sessions d’imagerie cérébrale et des évaluations cognitives poussées. Il s’agirait donc d’un protocole de suivi cher, chronophage, et par conséquent difficile à appliquer à grande échelle.
Une équipe de chercheurs de l’Université de Drexel, aux États-Unis, a opté pour une autre approche afin de réaliser ce travail de prévention. Au lieu de chercher des marqueurs physiologiques de la maladie, comme les fameuses plaques amyloïdes, ils comptent passer par l’analyse statistique du langage.
L’idée est de décortiquer le discours de la personne à l’aide d’outils informatiques pour repérer des signes avant-coureurs extrêmement discrets. Généralement, cela passe par la recherche de quelques indices strictement acoustiques ; en d’autres termes, on s’intéresse à la manière dont l’individu s’exprime plutôt qu’au sens profond de ses propos. Cette approche fonctionne plutôt bien. Dans environ 75 % des cas, cela permet de parvenir à un diagnostic avant l’apparition des symptômes, ce qui améliore considérablement la prise en charge.
Or, il se trouve que les réseaux de neurones artificiels sont particulièrement doués pour mettre en évidence ces déviations statistiques discrètes. Et en parallèle, depuis quelques années, des outils IA appliqués au langage montent en puissance à une vitesse sidérante. Cela offre une nouvelle possibilité aux chercheurs : au lieu de s’intéresser uniquement à la dimension acoustique, il est désormais possible de se pencher directement sur le sens des propos.
L’IA générative à la rescousse
Les chercheurs de Drexel se sont donc posé une question dans l’air du temps : un programme comme ChatGPT pourrait-il déceler les premiers signes de la maladie d’Alzheimer, bien avant les spécialistes humains ?
« Ces modèles de langage comme GPT3 sont si puissants qu’ils peuvent repérer ce genre de différences subtiles », explique Hualou Liang, auteur principal de l’étude. « Si le sujet est atteint de la maladie d’Alzheimer et que cela se ressent déjà dans le langage, nous espérons pouvoir utiliser le machine learning pour proposer un diagnostic précoce », précise-t-il.
Pour tester cette hypothèse, ils ont commencé par collecter 237 enregistrements audio. Ils provenaient de deux groupes de patients, soit sains, soit atteints de la maladie d’Alzheimer. D’après IEEE Spectrum, pour les analyser, ils se sont appuyés sur une fonctionnalité méconnue de ChatGPT.
En effet, le programme n’est pas seulement capable de proposer une réponse textuelle. Il peut aussi produire un « embedding ». En substance, c’est une représentation mathématique très riche d’un morceau de texte. En temps normal, cela permet à l’algorithme de comparer le sens de deux extraits. Ici, les chercheurs l’ont détourné pour analyser la cohérence des propos.
Et les résultats se sont révélés assez remarquables. Dans 80,3 % des cas, en se basant uniquement sur l’embedding, l’équipe a réussi à déterminer si le patient ciblé appartenait ou pas au groupe Alzheimer. Une augmentation pas encore révolutionnaire, mais tout à fait significative par rapport à ce que proposent les méthodes analytiques acoustiques traditionnelles.
Vers de nouveaux outils diagnostiques basés sur l’IA
Il y a deux conclusions à tirer de cette étude. La première, c’est qu’elle confirme le potentiel des IA appliquées au langage dans la prise en charge d’Alzheimer. C’est une excellente nouvelle, car les chercheurs ont ainsi ouvert la voie au développement de nouveaux outils diagnostics non seulement très puissants, mais aussi beaucoup moins lourds que les protocoles habituels.
La seconde conclusion, c’est qu’il va probablement falloir se montrer très prudent avant d’avoir développé des solutions spécialisées de ce genre. Car il faut aussi rappeler que ChatGPT est un logiciel commercial développé par une entreprise privée. Et d’après Frank Rudzicz, un spécialiste aussi interviewé par IEEE Spectrum, cela pose un gros problème de transparence et d’accessibilité.
« Ces API fermées sont limitées, parce qu’on ne peut pas inspecter le code ou y effectuer des modifications profondes », explique-t-il. « Ça veut dire qu’on ne peut pas réaliser de séries d’expériences plus poussées qui permettent de trouver la source de potentielles erreurs qu’il faudra forcément corriger ou éviter », regrette-t-il.
Liang est d’ailleurs tout à fait transparent sur les limites de ces travaux. Il insiste sur le fait que pour toutes ces raisons, il ne s’agit pas encore d’un outil adapté aux enjeux cliniques ; ce n’est pas demain la veille que les spécialistes des maladies neurodégénératives vont passer le relais à ChatGPT.
Mais le plus important, et ce qu’il faut retenir de ces travaux, c’est bien le potentiel de cette approche. Une fois que des outils spécialisés apparaîtront et qu’ils arriveront à maturité, l’humanité aura accès à un outil formidablement puissant pour mener une guerre sans précédent contre Alzheimer. Connaissant les enjeux humains et médicaux de ce fléau de santé publique, c’est un progrès qu’il convient d’applaudir sans retenue. Et ce n’est probablement qu’un début, connaissant le potentiel incroyable de l’intelligence artificielle dans de nombreuses branches de la médecine.
Le texte de l’étude est disponible ici.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.