Passer au contenu

ChatGPT se dote d’une fonction vocale révolutionnaire

OpenAI déploie la version alpha de la fonction vocale avancée de ChatGPT. La fonction promet des conversations plus naturelles.

Les équipes d’OpenAI entament le déploiement de la version alpha de la fonction vocale de ChatGPT. Une nouvelle étape importante pour le spécialiste de l’IA qui avance petit à petit sur le sujet. La firme a d’ailleurs un léger retard au démarrage en raison de préoccupations sécuritaires.

La fonction vocale avancée de l’agent conversationnel permet des conversations plus naturelles et en temps réel, pouvant même être interrompues. Elle est aussi capable de détecter et de répondre aux émotions. L’ambition est de proposer une IA plus humaine et de pouvoir échanger avec ChatGPT comme avec une véritable personne. À ce titre, OpenAI évoque une latence minimale et cela aura son importance. Les utilisateurs de Google Assistant ou Alexa ne savent que trop bien que ces assistants mettent parfois du temps avant de répondre. De plus, il faut attendre que ces derniers finissent de parler avant de pouvoir poursuivre.

Un déploiement progressif

Cette nouveauté est d’abord proposée à un panel d’utilisateurs de ChatGPT Plus, mais OpenAI a déjà de la suite dans les idées. Le groupe américain assure que l’accès sera étendu progressivement au cours des prochaines semaines. L’ambition est de rendre la fonctionnalité disponible pour tous les utilisateurs de ChatGPT Plus à l’automne prochain.

Les abonnés recevront une notification dans l’application ChatGPT et un mail contenant des instructions. Ils pourront alors découvrir la voix de GPT-4o en version alpha, quelques semaines après le premier aperçu présenté en mai. Pour l’heure, OpenAI se concentre sur la qualité et la sécurité des conversations vocales. Les fonctionnalités vidéo et le partage d’écran arriveront plus tard, précise le père de ChatGPT.

En attendant, la capacité du modèle à supporter des millions de conversations vocales simultanées et en temps réel a été renforcé. Une faible latence est promise, ainsi que de nouveaux efforts en matière de sécurité. La fonction vocale avancée utilisera quatre voix préconfigurées qu’OpenAI a créées en collaboration avec des acteurs vocaux. Après la polémique concernant Scarlett Johansson, ChatGPT ne pourra pas imiter les voix d’autres personnes. Une mesure qui concerne aussi bien les individus que les personnalités publiques. De plus, les sorties qui diffèrent de ces voix préconfigurées seront bloqués.

OpenAI s’attaque également à la question des droits d’auteurs et introduit de nouveaux filtres. Ces derniers seront en mesure de reconnaître et bloquer toutes les demandes de génération de contenus musicaux et audio protégés par des droits d’auteur.

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Mode