Cet API (application program interface) permet de retranscrire les paroles en texte.
Jusqu’ici, les développeurs d’applications ont surtout utilisé les logiciels de la compagnie Nuance. Google vient donc de faucher l’herbe sous le pied à cette dernière.
L’API de Google est l’une des plus développées qui soit accessible aujourd’hui. Elle reconnaît plus de 80 langues, dialectes compris. Un bon service rendu aux développeurs régionaux.
De plus, son moteur speech-to-text est relativement efficace et précis. L’API est d’autant plus efficace grâce au machine learning et aux réseaux neuronaux. Ainsi, le service devrait marcher même dans les environnements bruyants.
L’accès à ce service serait gratuit pour le moment, ce qui réduit quasiment à néant la compétition. La compagnie finira sans aucun doute par facturer son service mais entend pour l’instant laisser les utilisateurs s’habituer à son interface. Le marketing dans toute sa splendeur.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
Je pense que les développeurs devraient s’organiser pour mettre au point une solution open-source. Il y a déjà plusieurs prototypes de reconnaissance vocale basé sur le machine learning/neural network, suffit d’apporter la finalité !