Passer au contenu

Google a la solution ultime pour détecter les textes générés par IA

L’entreprise vient de déployer sa technologie de filigrane textuel pour le grand public.

C’est un petit pas pour Google, mais un grand pas pour l’IA. Cette semaine, l’entreprise américaine a annoncé l’arrivée de sa technologie SynthID Text pour le grand public. Objectif : détecter plus facilement les textes générés par intelligence artificielle, et faciliter les contrôles dans le cadre de litiges pour violation de propriété intellectuelle. C’est à l’occasion d’un simple tweet partagé sur X que l’entreprise a annoncé la mise en ligne “gratuite pour les développeurs et les entreprises” de son outil de marqueur de texte, annoncé depuis plus d’un an.

SynthID, c’est quoi ?

À la manière d’un filigrane sur une photo, SynthID a pour objectif d’insérer des informations de marquage sur les textes générés par IA. Une fois ce dernier obtenu, l’outil mesure ensuite “la probabilité que des jetons soient générés” en fonction du nombre de jetons présents dans les métadonnées finales. “Ce modèle final de score, qui combine les choix de mots utilisés aux scores de probabilité ajustés est considéré comme un filigrane”. De quoi théoriquement permettre au SynthID de “détecter si un outil d’IA a généré le texte ou s’il pourrait provenir d’autres sources”.

Des limites bien réelles

Déployé depuis le printemps dernier sur les modèles Gemini, le système de filigrane de Google assure qu’il ne compromet ni la qualité du texte généré, ni la vitesse d’exécution. L’entreprise indique également que l’outil est capable de fonctionner même lorsque le texte a été modifié, paraphrasé ou coupé. L’entreprise admet également que son approche présente des limites. Par exemple, SynthID Text n’est pas très performant avec un texte court, avec un texte réécrit ou traduit d’une autre langue, ou avec des réponses à des questions factuelles. Il fonctionne en revanche plutôt bien sur les textes longs et à fort potentiel créatif.

Chez la concurrence aussi, l’idée d’un filigrane fait son chemin. OpenAI sait déjà comment déployer son propre outil de détection automatique, mais rechigne encore à le déployer pour des raisons commerciales et techniques. Reste que l’enjeu est de taille : certains pays commencent déjà à instaurer le marquage obligatoire des contenus générés par l’IA. C’est le cas de la Chine, et des États-Unis, qui envisagent d’appliquer les mêmes restrictions en Californie. L’enjeu est d’autant plus important qu’il devient urgent d’agir, estime l’European Union Law Enforcement Agency. 90 % du contenu en ligne pourrait être généré par intelligence artificielle d’ici 2026. À l’heure actuelle, les estimations les plus pessimistes estiment ce chiffre à 60%.

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Mode