D’après The Information, Google serait en train de développer un nouvel assistant IA capable d’utiliser un navigateur web afin d’accomplir des tâches diverses pour le compte de l’utilisateur.
Pour l’instant, peu de détails ont filtré sur le fonctionnement de ce système, désigné par le nom de code Jarvis — sans doute une référence à l’assistant virtuel de Tony Stark dans l’univers Marvel). On sait seulement qu’il est conçu pour s’appuyer sur un browser web — sans doute Chrome, le navigateur de Google. Ce dernier étant disponible sur toutes les plateformes, de (Windows à Android en passant par iOS ou encore Linux, cela suggère que Jarvis sera disponible aussi bien sur un ordinateur standard que sur smartphone. On sait aussi qu’il sera basé sur la nouvelle version du modèle Gemini que Google s’apprête à dévoiler.
En pratique, il se comportera comme un assistant, conçu pour simplifier la vie numérique de l’utilisateur. Selon les sources proches du dossier citées par The Information, Jarvis pourra effectuer des recherches directement sur Internet, par exemple pour répondre à une question sur un sujet d’actualité. Il pourra aussi s’acquitter de tâches mondaines comme commander un produit sur une plateforme d’e-commerce, réserver un vol ou une chambre d’hôtel.
Assistant fidèle ou mouchard ?
Sur le papier, il pourrait s’agir d’un outil intéressant. Mais certains points sont un tantinet préoccupants, notamment au niveau de la manière dont Jarvis va apprendre à répondre aux attentes de son humain. En effet, pour alimenter ce modèle IA, Google aurait opté pour une approche qui rappelle vaguement Recall, la fonctionnalité controversée que Microsoft est en train de préparer sur Windows.
Toujours selon The Information, le système répond aux commandes d’une personne « en capturant des captures d’écran fréquentes de ce qui se trouve sur l’écran et en interprétant les photos avant d’entreprendre des actions comme cliquer sur un bouton ou taper dans un champ de texte. »
Toute la question sera donc de savoir comment ce processus d’entraînement secondaire va se dérouler. Il existe deux possibilités. La première, c’est que lesdites images soient traitées localement, directement sur l’appareil de l’utilisateur. Le cas échéant, Jarvis s’appuiera peut-être sur une NPU — ces nouvelles puces exclusivement dédiées aux tâches IA que la majorité des constructeurs sont en train d’intégrer à leurs CPU et SoC.
Alternativement, ces images pourraient aussi être décortiquées par un système plus puissant après avoir été envoyées sur un serveur tiers. Le cas échéant, cela pourrait poser un sérieux problème de confidentialité ; personne ne souhaite que son appareil envoie régulièrement des captures d’écran à un géant de la tech pas franchement réputé pour être scrupuleux. Microsoft, qui comptait initialement procéder de cette façon avec Recall, a d’ailleurs décidé de faire machine arrière face à l’indignation du public. Cet été, l’entreprise a annoncé son intention de passer à un traitement entièrement local des données ainsi enregistrées.
Donner les clés du camion à l’IA
Plus largement, Jarvis est une nouvelle manifestation d’une nouvelle tendance très en vogue dans le domaine de l’IA grand public. Il y a quelques jours à peine, Anthropic a dévoilé un projet repéré par Engadget qui permettra à son agent IA Claude d’« utiliser une large gamme d’outils et de logiciels standards conçus pour les humains ». Selon The Verge, OpenAI aurait aussi un projet similaire dans sa manche.
Il conviendra donc de garder un œil sur cette nouvelle mode qui promet d’intégrer le machine learning encor plus profondément dans nos vies – pour le meilleur et pour le pire. D’ici-là, nous vous donnons rendez-vous en décembre pour commencer à découvrir Jarvis.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
C’est la fête des parenthèses placées n’importe comment cet article