Passer au contenu

Samsung veut cloner votre voix pour répondre aux appels

Grâce à une intelligence artificielle, Samsung va permettre à ses utilisateurs de cloner leurs voix pour répondre aux appels. La fonctionnalité vise à rendre les échanges plus humains.

Parce qu’il n’est pas toujours possible de répondre au téléphone, le texte s’avère une solution bien pratique. Il permet d’échanger facilement dans de nombreuses circonstances, comme lorsqu’on est dans les transports ou pendant qu’une réunion s’éternise. Dans certains cas, il est même déjà possible d’utiliser un outil de prédiction alimenté par une intelligence artificielle. Samsung souhaiterait désormais aller encore plus loin en clonant votre voix pour répondre aux appels.

Avec la fonction « Bixby Text Call », le géant sud-coréen vous propose d’écrire votre réponse au clavier. Une fois que votre message est prêt, une intelligence artificielle sera en mesure de le transmettre en vocal. Dans les faits, la technique n’est pas inédite et il est déjà possible d’utiliser une IA pour lire un texte à voix haute. Samsung promet de se distinguer en proposant aux utilisateurs d’enregistrer différentes phrases que Bixby peut analyser. Il créera une copie de la voix et du ton de l’utilisateur grâce aux outils d’IA. L’interlocuteur aura alors l’impression d’échanger avec la bonne personne.

Une fonction encore très limitée

Le projet de Samsung pourrait bousculer nos usages, mais la fonction fait l’objet de nombreuses limitations. Tout d’abord, la fonctionnalité n’est disponible qu’en coréen dans l’application Bixby Custom Voice Creator. De plus, elle ne fonctionne qu’avec les derniers smartphones de la marque, les nouveaux Galaxy S23, S23+ et le Galaxy S23 Ultra. Il est encore difficile de se faire une idée de la qualité de cette fonctionnalité.

Cependant, son déploiement confirme que les assistants vocaux sont loin d’avoir dit leur dernier mot. Le clonage des voix s’utilise déjà pour les podcasts ou dans les jeux vidéo, mais il reste peu utilisé par le grand public. La technique reste néanmoins à la portée de la technologie actuelle et nos appareils sont suffisamment puissants pour cet usage. Samsung étend d’ailleurs la possibilité de transformer les appels vocaux en texte dans la version anglaise de Text Call. Une option comparable à la fonction Screen Call (filtrage d’appels) de Google.

Dans un avenir proche, ces fonctionnalités devraient se démocratiser. On peut déjà rapprocher un outil de clonage vocal de ChatGPT et confier certaines tâches à un assistant vocal. Il y a quelques années, Google avait fait forte impression en présentant Duplex. Associé à Google Assistant, l’outil était en mesure de passer des appels téléphoniques à votre place, pour réserver une table dans un restaurant ou chez le coiffeur. L’avenir de cette fonctionnalité, qui a suscité la polémique, est flou depuis que Google a arrêté la version Web de Duplex.

Comme souvent, le côté obscur n’est jamais très loin et il existe de nombreux cas d’utilisation malveillants. Le fait de cloner une voix avec l’IA peut aider à créer de faux discours, des contenus haineux ou favoriser le harcèlement.

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Mode