Depuis les débuts de l’informatique, de nombreuses Interfaces homme-machine ont été créées. Le clavier, la souris, le joystick, la tablette graphique, le capteur de mouvement… Mais récemment un vieux rêve de tous les geeks est en passe de devenir réalité. Qui n’a jamais voulu parler et se faire comprendre par sa machine ? C’est ce que l’on appelle la reconnaissance vocale. Depuis de nombreuses années, des solutions sont proposées, mais rien n’était vraiment concluant. Apple en ayant acquis la technologie SIRI et en l’implémentant dans ses téléphones a franchi un cap. En effet quand on voit les différents avis sur cette technologie la majorité s’accorde à dire que c’est bluffant. Il est presque possible de tenir une conversation avec SIRI et même de blaguer avec. Si vous posez une question et qu’elle n’est pas assez précise, il vous demandera des informations supplémentaires. De même, il est possible de formuler des demandes de différentes façons ce qui n’était pas possible auparavant. Il fallait utiliser des termes précis pour se faire comprendre. Mais SIRI n’est pas encore parfait, le service est plus étoffé aux États-Unis qu’en France par exemple, mais comme l’a dit Apple, ce n’est qu’une bêta. La question que l’on peut se poser est de savoir si la reconnaissance vocale est l’interface homme-machine que nous utiliserons tous et tout le temps dans le futur ?
À vrai dire tout dépend du contexte et de l’objet. Prenons le cas de l’iPhone 4S puisque c’est le premier objet à proposer une solution réellement séduisante. Vous êtes à une soirée, mais votre copine n’est pas là. Elle vous envoie un texto « J’ai envie de toi mon chéri ». Allez-vous utiliser SIRI pour lui répondre devant tous vos amis ? Il n’y a donc pas d’IHM idéale, mais celles-ci doivent être adaptées aux situations. Sur un téléphone il est donc essentiel de disposer d’une IHM pouvant être utilisée les mains libres, la reconnaissance vocale, mais aussi d’une interface plus discrète comme un clavier ou un écran tactile pour pouvoir faire des choses que notre entourage n’a pas besoin de savoir.
Quand je vois ce qu’il est possible de faire avec la reconnaissance vocale je me dis que l’intégration dans une télévision serait parfaite. En effet, la télévision est un objet qui est observé par plusieurs, on n’a donc pas besoin « d’intimité » dans son utilisation. Vous êtes en train de faire la cuisine et vous pouvez demander à votre téléviseur de changer de chaîne ou de diminuer le volume ce qui évite de toucher la télécommande avec les mains qui sont en train de préparer le repas… Je ne pense pas que la reconnaissance vocale soit judicieuse sur un ordinateur par exemple. Un ordinateur est utilisé et visionné par un utilisateur unique en général, c’est donc un objet plus intimiste.
La reconnaissance vocale on l’a vu, n’est donc pas l’interface homme-machine ultime, mais en complément d’autres ou selon le contexte, l’utilisation de celle-ci peut être réellement appréciable. En tout cas, maintenant que nous avons presque atteint l’objectif de se faire comprendre et de parler avec une machine prenons-nous à rêver d’une interface neuronale qui nous permettrait de contrôler une machine par la pensée ou peut-être même de recevoir des informations directement dans notre cerveau qui sait…
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
moi j’aimerai bien d’une reconnaissance vocale avec une voix feminine sur mon pc ! **
Merci pour cet article 🙂
Je tiens à ajouter un équipement supplémentaire à la reconnaissance vocale : Kinect ! Cela rejoint surement ce que tu évoques par rapport à la télévision, mais je pense que cet outil mérite d’être cité pour les capacités qu’il apporte dans le domaine de la reconnaissance vocale.
Très interressant ce sujet, proie à de futurs grands débats… Personnellement je pense que même le contrôle par la pensé aurait des défauts : prenons pour exemple une salle de classe; tout le monde pourrait envoyer des messages sans que le professeur ne s’en rende compte…
@ Lighty:
Kinect + reconnaissance vocale?
kit à faire çà autant demander la personne devant toi de changer de chaine 😳
Regardee ce qui peux arriver plus tard c’est vraiment fun mais il y’a du vrais 🙂
http://www.youtube.com/watch?v=Ok0GL7gN9MU
SIRI = HAL9000 junior
On va finir par arriver à un delire proche de Skynet si ca continu !
Je c pas pour vous mais ça me rappel le “hello computer” de Scotty dans star trek IV 😀
Totalement off topic mais quelqu’un saura surement me répondre :
Aurais je loupé un épisode ? Pourquoi la chronique du weekend n’est plus qu’aléatoire ? C’était une des grosses plus-valu du JDG 🙁
Lam n’est pas disponible en ce moment, il reviendra avec la Chronique la semaine prochaine tout simplement 🙂
Ca arrive, ce n’est pas grave.
C’est clair que l’utilisation de la reconnaissance vocale ne va faire que prendre de plus en plus d’ampleur, je me vois déjà avec une télé qu’on pourrait diriger à la voix… Sortez vite ce petit bijou messieurs les constructeurs!!! 😛
Merci pour l’article, très interessant. ça fait bouilloner mon cerveau ! 😀
Je pense que la reconnaissance vocale sur pc peut être un gros plus pour certains handicapés. Pour ce qui est de la reconnaissance neuronal, des travaux sont déjà en cours mais je n’est plus le lien 😳
“Prenons le cas de l’iPhone 4S puisque c’est le premier objet à proposer une solution réellement séduisante.” <= C'est une énorme blague que tu dis là.
Oui Apple à réussit à faire avancer les choses, les concurrents vont forcément suivre le concept désormais, comme Nintendo l’a fait avec l’écran tactile de la DS.
mettons nous d’accord l’article parle bien d’interface en général à la rigueur apple a fait avancer les choses sur mobile là oui pourquoi pas mais des logiciels existent déjà depuis longtemps en comparaison de la toute nouveauté de cette technologie sur smartphone …
@ techfan : on a bien compris que tu détestes Apple, mais tu ferais bien de te passer de commentaires aussi inutiles.
Un autre domaine où la reconnaissance vocale (et l’IHM en général) serait certainement utile est la domotique !
“Fais la vaisselle”, “Allume la tv”, “On a sonné, ouvre la porte”.
*dream*
@tilho : En même temps il n’a pas tout à fait tord, des solutions à commandes vocales existent depuis pas mal de temps. Après SIRI, qui a été conçue par une boite racheté par Apple, est une nouvelle approche très grand public, et crée un nouveau rapport homme/machine proche à un dialogue avec un ciborg, mais il faudra encore attendre quelques améliorations pour que cela soit parfait, surtout en Français (qui je le rappel est encore en beta).
Donc dire que l’iPhone 4S est le premier objet à offrire une solution séduisante est bel et bien une blague, ou c’est tout simplement un avis très personel et subjectif (comme beaucoup d’articles se trouvant sur des blogs), car d’autres solutions (comme il y avait déjà sur Windows XP et MacOS X par exemple ou sur Android) étaient déjà très impressionnantes et séduisantes.
Dans le cas de l’article je sais que c’est le second cas, vu que Thomas est fan de la marque à la pomme croquée :-p
Ohohoh tu t’avances vite, j’aime la marque certes mais je n’en suis pas fan 😀 Et je confirme le fait que pour moi c’est la premier objet à offrir une solution séduisante en matière de reconnaissance vocale car elle est directement intégrée, ce n’est pas une app téléchargeable, elle permet de contrôler certaines fonctionnalités de l’appareil et possède en quelques sortes une “âme”. Je n’ai jamais dit que c’était la première ni qu’elle avait été conçue par Apple d’ailleurs 😉
Sinon limiter l’utilisation uniquement à la TV est un peu réducteur. Car je pense que comme on le retrouve dans les films, c’est une fonction qui fera parti de la domotique, et qu’on pourra donc commander tout et n’importe quoi, en aillant la possibilité de restreindre les action suivant l’utilisateur, à la manière des OS à base UNIX 🙂
Yep, j’aurai pu donner quelques exemples supplémentaires mais bon je voulais faire travailler votre imagination 😛
@thomaslemee : Oui, mais je ne faisais qu’éclaircir se que voulait dire techfan, par rapport à ta phrase qui prête à confusion. Sinon le reste de l’article est très pertinent 😉
ça marche depuis un moment sur les galaxy S2 et aussi avec google navigation (je tape plus jamais mes adresses de destination!) et même la dictée de sms marche bien, ou les recherches google aussi.
De là à dicter au lieu de taper une une icône ??? je vois pas trop le gain ?
@newworld666 : Pour les mal voyants, ou pour utiliser complètement ton smartphone lorsque tu conduis… Mais SIRI ne permet pas d’ouvrir toutes les app, seuls les apps par défauts sont consultables.
La reconnaissance vocale est bien la télécommande ultime de nos futurs Tv. Pour autant, il faudra ajouter le Noise Cancel et l’authentification
À lire sur le sujet http://goopple.fr/2011/apple/que-manque-t-il-a-siri-pour-telecommander-une-itv/
@newworld666 : Par contre le mode voiture sur Android me semble déjà amplement suffisant, est-ce-qu’on a vraiment besoin d’avoir accès à tout nos app via la voie ? Je demande à voir, mais pourquoi pas…
PS : Normale que mon pseudo, mail, et url ne soit pas sauvegardé comme sur les autres site WordPress ?
Ouais une interface neuronale … Et comme dans Bugs (la série) et son intelligence artificiel, le “Virus” peut aussi être transféré dans notre cerveau!
Mais j’avoue que je serais super ravi si c’était faisable ^^
“J’ai changé ça aussi… Illuminé ! Désilluminé ! ” (Demolition Man)
Hè les fan boys, vous connaissez Dragon Naturally Speaking qui en est quand même à sa version 11.0 ?
Vous pouvez contrôler votre pc à la voix depuis au moins la version 9 soit plus de 5 ans.
Faut arrêter avec les fausses révolutions!
Tiens moi aussi j’ai créé un clavier révolutionnaire!
Hmm l’interface ultime c’est pas censé être la pensée sans connection filaire ?
Non puis même pour l’intégrer à la domotique ça me parait limité dans le sens ou si tu es en train de parler avec quelqu’un et que tu balances les mots clés qui font quelque chose ça va ouvrir ta porte, fermer tes volets, allumer ta télé…etc ou alors faut définir un mot clé que tu dis jamais pour que l’IA se déclenche. A mon avis la commande vocale peut avoir ses utilités pour un cadre handicap, à la limite utilisation en voiture et encore c’est un gadget c’est pas non plus indispensable, et reste au fond un rêve de geek qui dans la vie de tous les jours n’a pas forcement sa place.
La reconnaissance vocale va fortement appauvrir notre vocabulaire et notre grammaire. Etant donné que les logiciels du moment ont même pas l’intelligence d’un enfant de 2 ans, on va s’habituer a reformuler toutes nos phrases pour qu’elles soient comprises par cette IA.
Suis je le seul à penser que justement là ou on n’a pas besoin d’IHM vocale c’est justement sur un téléphone portable? On cite ensuite le cas du pc en disant que dessus on a pas besoin d’IHM de ce type car utilisateur unique et ce qu’on y fait on veut le garder pour nous… Je me pose alors cette question suis je normal ou pas? Car c’est exactement la même utilisation du téléphone que je fais.
Pour moi le seul moment ou j’ai besoin de cette interface c’est en voiture pour des sms, or cette utilisation sera interdite un jour ou l’autre si elle ne l’est déjà car équivalent au kit mains libre. Le reste du temps je me vois mal parler à mon téléphone surtout s’il y a du monde autour… :s
Non pour moi l’IHM vocale est intéressante si elle intégrée dans nos appareils ménagers voir dans toute une maison. Et la je vois une correspondance avec le téléphone je m’explique.
Je rentre du travail je dois faire des courses, par mon téléphone je contacte dans ma voiture mon frigo et qui me dis ce qu’il reste dedans…
ou alors c’est l’hiver “Mets le chauffage à 21 et ferme les volets, met le four à préchauffer j’ai acheter des lasagnes surgelées”
Je suis entrain de faire à manger “Je veux écouter le dernier album des pupinni sisters dans la cuisine volume 18”
Je suis toujours entrain de faire à manger “fais moi couler un bain température 38 degrés lumière tamisée et du marvin gaye – sexual healing, je reçois une amie”
Bref pour moi là il y a un intérêt, en couplage sur le téléphone avec la maison ou sur le téléphone en voiture, mais c’est tout.
Enfin je sais pas mais à part pour faire joujou ou alors en voiture je vois mal quelqu’un utilisé Siri ou tout autre interface vocale. C’est un avis personnel mais le jour ou je verrais des gens utiliser siri dans un centre commercial ou alors qu’il y a du monde autour d’eux je me dirais qu’ils sont vraiment stupides.
Mais dans tout ça le mieux ce sera les blagues à faire à tous les possesseurs d’i4S genre en soirée le mec un peu con qui veut envoyer un sms à sa copine pour lui dire: “je vais rentrer tard la réunion s’éternise”, moi je m’imagine bien arriver en gueulant comme tout bon mecs bourrés en soirée par dessus son épaule “Chérie je rentre pas j’suis déchiré y a trop de bombasses!!!! bisous.”
@bainos: cette interface existe déjà ça s’appelle une femme!! lol bon ok je sors.
Qui connait le projet Jarvis d’un jaune étudiant qui via un mac mini gère l’allumage des lampes de sa chambre pas reconnaissance vocale avec un micro bluetooth autour du coup.
De plus, Jarvis est connecté à des sites d’actualités et peu synthétiser les news de la météo et autres.
On parle là d’un étudiant dans sa chambre alors ce qu’à fais Apple est plutôt bon mais ce n’est que le début.
Quand on voit que la reconnaissance vocale intégré en natif dans windows 7 fonctionne pas mal à condition d’avoir peu de bruit de fond :S.
Sur ceux voici le lien du projet Jarvis
http://projectjarvis.com/
le contrôle par la pensé existe,l’envoi d’information directement dans le cerveau aussi,on envoi des image au cerveau ou encore des sons aux personnes sourde ou aveugle. Pour le contrôle cela a était expérimenté sur des tétraplégique.