Même les spécialistes du comportement qui sont particulièrement doués pour interpréter les vocalisations des chiens sont incapables d’en comprendre toutes les nuances – mais cela pourrait changer grâce au machine learning. Une équipe de chercheurs développe en ce moment des outils à base d’intelligence artificielle qui pourraient nous aider à mieux comprendre ce que le meilleur ami de l’Homme essaie de nous dire.
Ce n’est pas la première fois que des chercheurs explorent ce concept. Mais jusqu’à présent, ils se sont tous heurtés au même problème : le manque de données. En effet, tous les modèles de traitement du langage doivent être entraînés à partir d’exemples issus du monde réel. Un algorithme ne peut en aucun cas déterminer la signification d’une suite de sons à partir de rien ; il faut impérativement lui fournir des références.
Or, s’il est très facile de se procurer ce genre de ressources dans le cas des humains, c’est beaucoup plus compliqué pour les animaux. « D’un point de vue logistique, les vocalisations des animaux sont beaucoup plus difficiles à solliciter et à enregistrer », explique Artem Abzaliev, auteur principal de l’étude.
Un modèle conçu pour les humains
Pour surmonter cet obstacle, une équipe de l’Université du Michigan a misé sur une autre approche assez originale : recycler un modèle initialement développé pour la parole humaine. « En utilisant des modèles de traitement du langage initialement entraînés sur la parole humaine, nous avons ouvert une fenêtre sur les nuances des aboiements des chiens », explique sa co-autrice Rada Mihalcea.
Grâce à cette approche, l’équipe a pu commencer à construire son projet sur des bases déjà solides, puisque ces systèmes sont devenus relativement sophistiqués ces dernières années. Il existe déjà des tonnes de modèles capables de distinguer des nuances de timbre, d’intonation ou d’accent. Certains sont même capables de reconnaître les émotions (frustration, gratitude, dégoût…) qui transparaissent dans un enregistrement audio. « Ces modèles sont capables d’apprendre à encoder les motifs incroyablement complexes du langage humain, et nous voulions voir si nous pouvions exploiter ces capacités pour interpréter les aboiements des chiens », explique Abzaliev.
Son équipe est donc partie de Wav2Vec2, un modèle conçu pour les humains, et lui a présenté un jeu de données composé d’enregistrements de 74 chiens. Ils provenaient d’animaux de races, âges et sexes variés, et ont été collectés dans de nombreux contextes différents (jeu, détection d’un élément perturbateur comme un petit animal, réflexe de défense, interactions sociales…). Grâce à ces données, Abzaliev a pu altérer l’importance des connexions qui relient les neurones artificiels du réseau (les poids) ainsi que les biais qui les régissent.
Des résultats encourageants
Au bout du processus, l’équipe a pu générer des représentations des données acoustiques collectées chez les chiens et les interpréter. En analysant les résultats, ils ont constaté que le modèle avait classé les enregistrements dans la bonne catégorie (jeu, anxiété, recherche d’attention, douleur, frustration…) dans 70 % des cas.
Un résultat encore assez approximatif, mais bien supérieur à ce dont sont capables les modèles entraînés exclusivement sur des enregistrements d’animaux. « C’est la première fois que des techniques optimisées pour la parole humaine participent ainsi au décodage de la communication animale », se réjouit Mihalcea.
Une ressource pour les chercheurs ?
Au-delà des résultats bruts, ces résultats ont une implication très intéressante : ils prouvent que les sons et les motifs inhérents au langage humain peuvent servir de fondation pour analyser les vocalisations des chiens, et peut-être même d’autres espèces. Par conséquent, une fois mature, ce système pourrait devenir un outil très intéressant, notamment pour les éthologues.
Ces chercheurs spécialisés dans l’étude du comportement animal se reposent souvent sur les vocalisations pour étudier les interactions au sein des groupes, les particularités comportementales et même les capacités cognitives de leurs espèces de prédilection. Par conséquent, un outil de ce genre pourrait les aider à identifier des nuances qui auraient autrement pu leur échapper… ou tout simplement leur prémâcher le travail. Imaginez par exemple une équipe de spécialistes qui étudie les primates dans un environnement difficile, comme une jungle. Au lieu de passer un temps considérable à éplucher des enregistrements audio pour classifier des vocalisations et les attribuer à un certain type de comportement, ils pourraient confier cette tâche à un modèle IA pour identifier des relations et des tendances intéressantes beaucoup plus rapidement.
Les chercheurs n’abordent pas du tout cette thématique dans leur papier, mais en extrapolant, on peut aussi imaginer qu’un jour, un système d’IA générative pourrait permettre de synthétiser des sons spécifiquement calibrés pour porter un transmettre un message bien précis à un animal. Pour l’instant, cela relève encore de la science-fiction pure. Mais peut-être qu’un jour, l’intelligence artificielle nous permettra enfin de “discuter” avec nos fidèles compagnons, de comprendre le chant des baleines ou d’en apprendre davantage sur les raisons qui poussent les orques à attaquer des bateaux, par exemple.
Le texte de l’étude est disponible ici.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
A part que les chiens ne communiquent pas qu’en aboyant, sinon il le ferait toute la journée…
A force de croire que le monde qui nous entoure n’est que materiel et mathématique on passe à coté de l’essentiel, c’est pas moi qui le dit mais Mr Tesla.
L humain ne communique pas non plus que par les mots
Et je pense que les animaux ont un avantage pour être compris, peut de chance que chez les animaux il soit necessaire d interpréter le mensonge, la tromperie
Chez les animaux quand il s’ agit d une meute il faute juste tenir compte d une seule règle la loi du plus fort qui organise la meute
Enfin pour l apprentissage du langage animal, il faut avant tout se concentrer sur la phase jeunesse quand l animal est encore en apprentissage avec sa mère c’est la que va avoir lieu le plus gros de son apprentissage
Bien sûr cet apprentissage doit d abord être réalise sur des échantillons ou l environnement va être sain, (bref bien nourrir, loger, bien soigné). Seulement après tu agrandi le spectre d échantillon avec des qui se sont retrouvé dans des situations de stress et etc…
Mais ça c est valable aussi chez les humains
Comprendre les animaux sur l échelle de l humanité c est un ‘instant’
Demandé pas a du deep learning informatique de te traduire en langage humain (quelle langue d ailleurs, anglais, français, chinois…) en 2ans
A quand un décodeur MagiX