Passer au contenu

Un nouveau modèle IA peut prédire quand un humain va mourir

Le machine learning va-t-il devenir une sorte de boule de cristal ?

Les modèles IA modernes sont devenus extrêmement doués pour organiser des données et prédire l’élément suivant d’une séquence. C’est par exemple de cette façon que fonctionnent les grands modèles de langage (LLM) comme GPT. Techniquement parant, ces IA génératives sont basées sur des modèles dits prédictifs, car elles construisent leur réponse en prédisant les mots qu’un humain serait susceptible d’ajouter au bout d’une phrase à partir de nombreux éléments de contexte.

En partant de ce constat, des chercheurs danois se sont demandé s’il serait possible d’utiliser ces modèles prédictifs comme des boules de cristal numériques afin de prédire l’avenir. Et la réponse est aussi fascinante que terrifiante. Même s’il convient d’être très prudent par rapport à l’interprétation de ces résultats, il se trouve que ces systèmes sont plutôt doués pour deviner ce qui va se passer dans la vie d’une personne… et notamment pour deviner quand elle est susceptible de mourir.

Une IA pour prédire la date de la mort

C’est en tout cas la conclusion à laquelle est arrivée une équipe internationale de chercheurs danois et américains. Ensemble, ils ont entraîné un modèle baptisé life2vec avec des données médicales et professionnelles de 6 millions de citoyens danois. À partir de ces ressources, toutes anonymisées au préalable, le système a pu apprendre à identifier des relations claires entre l’activité professionnelle d’une personne, son dossier médical, et son espérance de vie.

Évidemment, il est impossible de vérifier rigoureusement la précision de ces pronostics. Il faudrait être capable de voyager dans le temps. Mais les chercheurs ont tout de même développé une méthodologie pour estimer la pertinence des prophéties de l’algorithme. Ils ont épluché une montagne d’études sociologiques et médicales qui explorent l’influence de nombreux paramètres (situation professionnelle, éducation, antécédents médicaux…) sur l’espérance de vie. Et après cette grande analyse croisée, ils ont constaté que les prédictions de life2vec étaient assez cohérentes avec les conclusions de toutes ces études.

Par exemple, l’algorithme accorde généralement une espérance de vie nettement plus importante aux personnes qui affichent des revenus élevés. Une conclusion qui va dans le sens de nombreuses autres études, comme celle-ci. En revanche, il est bien plus pessimiste dans le cas des individus de sexe masculin ou des personnes qui souffrent de troubles psychologiques modérés à sévères. Là encore, d’un point de vue statistique, le verdict de life2vec était généralement très cohérent avec les conclusions d’autres études sur le sujet (voir ces deux papiers ici et ).

Une nouvelle manière d’étudier la vie des humains

Il est important de noter que ces résultats doivent être interprétés avec la plus grande prudence. Non seulement parce ces pronostics sont pratiquement invérifiables, mais aussi et surtout parce qu’il s’agit d’une technique balbutiante, et certainement pas mature. Elle est très loin de prrendre en compte tous les facteurs physiques, psychologiques et sociologiques qui peuvent influencer l’espérance de vie. À l’heure actuelle, il serait encore très déraisonnable de faire aveuglément confiance à un système comme life2vec. Surtout au moment de prendre des décisions qui pourraient impacter profondément le reste de la vie d’une personne.

Mais ce n’était de toute façon pas l’objectif de ces travaux. Les scientifiques ne cherchaient pas à concevoir une sorte de Nostradamus numérique car ils sont bien conscients des nombreuses limites d’un tel système. Leur véritable but, c’était d’explorer une nouvelle approche analytique pour étudier le parcours de vie des humains sous un nouvel angle.

On peut considérer la vie humaine comme une longue séquence d’événements, de la même façon qu’une phrase est une séquence de mots », résume Sune Lehmann, professeur à l’Université Technique du Danemark et auteur principal de l’étude. «  Généralement, on utilise ces modèles prédictifs pour prédire des séquences de mots. Mais dans notre expérience, nous les utilisons pour analyser ce qu’on appelle des séquences de vie, des événements qui se sont déroulés dans une vie humaine », précise-t-il.

L’intérêt de ce concept va bien au-delà des prédictions sur la date de la mort. En théorie, cette façon de procéder pourrait faire émerger des tas de tendances statistiques très intéressantes sur le mode de vie des gens. Ces informations pourraient ensuite permettre aux chercheurs de se focaliser sur des phénomènes sociologiques ou de santé publique qui étaient sous-estimés, voire complètement passés inaperçus jusqu’à présent.

Des tas de questions éthiques

L’idée est effectivement séduisante, mais les chercheurs insistent lourdement sur les limites de ces travaux. Ils discutent notamment du fait que leur modèle soulève un tas de questions éthiques importantes. On peut notamment citer l’importance des biais statistiques dans ces grands ensembles de données. Selon les auteurs, ils « devront être mieux compris avant qu’un tel modèle ne puisse être utilisé, par exemple, pour évaluer le risque qu’un individu contracte une maladie ».

C’est particulièrement important lorsqu’on commence à aborder les implications de cette approche en termes de confidentialité et de protection des données personnelles. En effet, ces données pourraient constituer une ressource incroyablement alléchante pour de nombreuses entités capables de les exploiter dans un contexte commercial. Notamment dans des domaines comme l’assurance ou la publicité.

« Des technologies comparables, qui cherchent à prédire les événements de la vie et le comportement humain, sont déjà utilisées aujourd’hui par des entreprises du monde de la tech. Par exemple, celles qui pistent notre comportement sur les réseaux sociaux peuvent dresser des profils extrêmement précis, et les utiliser pour prédire notre comportement et l’influencer », avertit Lehmann.

Certes, ces travaux sont très intéressants d’un point de vue conceptuel et académique. Mais il conviendra donc de lancer un grand débat sur les retombées potentielles de cette nouvelle approche analytique avant de foncer tête baissée. « Cette discussion doit faire partie de la conversation démocratique, pour que l’on puisse déterminer où cette technologie va nous mener et si c’est un développement qui serait souhaitable ou non », insiste Lehmann.

Le texte de l’étude est disponible ici.

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Mode