Mais alors comment cela fonctionne t-il ?
Pour développer ce Knowledge Graph Google a utilisé deux notions, la notion d’objets qui peut prendre la forme d’une personne, d’un film ou de bien d’autres choses et la notion d’informations pures avec des types de données. Par exemple Larry Page est un objet, sa date de naissance est une donnée pure. Le but est donc pour Google d’établir les différentes données nécessaires pour décrire un objet et de les collecter pour les proposer sur son moteur de recherche. Pour l’objet “personne” ou “personnalité” on peut donc penser que la date de naissance, le lieu de vie et les travaux effectués sont intéressants.
Mais il existe une multitude de possibilités d’objets et la tâche s’annonce donc ardue. Pour établir sa base de données Google a utilisé différentes sources telles que Wikipédia qu’on ne présente plus et Freebase, une base de données développée par la société Metaweb rachetée par Google en 2010. Ainsi pour l’instant Google recense plus de 500 millions d’objets et plus de 3,5 milliards d’informations associées à ces derniers.
Pourquoi opérer de cette manière ?
C’est là qu’entre en scène la recherche sémantique. En effet en créant des objets et les types de données qui vont avec le moteur de recherche sera à même de répondre à de vraies questions. Ainsi pour reprendre l’exemple précédent Google “connait” l’âge de Larry Page, du coup il va bientôt devenir possible de demander “Quel est l’âge de Larry Page?”.
Ces requêtes sont bien plus naturelles pour l’utilisateur, certes c’est plus long à taper que les mots clés “Larry Page” et “âge” mais pour un néophyte qui ne sait pas vraiment comment fonctionne un moteur de recherche c’est beaucoup plus simple de poser la question comme il le ferait dans le monde réel. Toutefois cette fonctionnalité n’est pas encore implémentée de cette manière, l’occasion de voir comment se présente les résultats de recherche du Knowledge Graph dans sa forme actuelle.
La présentation des données
Jusqu’à présent Google se contentait de renvoyer les personnes qui cherchent quelque chose vers d’autres sites web, le moteur de recherche n’était donc qu’un passage et pas une finalité en soi. Avec le Knowledge Graph cela va changer puisque certaines informations apparaîtront directement sur le site web de Google. Pour présenter son nouveau service, la société décrit les trois améliorations en ce qui concerne la recherche sur son moteur.
La première consiste à chercher à comprendre quelle information un utilisateur souhaite vraiment obtenir. Ainsi certains mots clés peuvent paraître ambigus et présenter plusieurs significations. Dans le cas de Taj Mahal par exemple on peut soit chercher des informations sur le monument soit sur le musicien. Dans cette optique Google proposera donc le choix entre ces deux possibilités pour affiner la recherche :
La deuxième qui marque sans doute le plus gros changement dans la philosophie du moteur de recherche propose de regrouper les données relatives à un objet de façon claire et résumée directement sur la page du site. Ainsi lorsque vous cherchez par exemple des informations sur Marie Curie vous aurez droit à une courte biographie, à une photo, des lieux et toutes sortes d’informations jugées importantes. Le moteur de recherche propose également des suggestions, dans le cas de Marie Curie d’autres personnalités du domaine de la recherche sont proposées.
Enfin la dernière amélioration qui est sans doute la plus difficile à intégrer consiste à répondre à la question que vous n’avez pas encore posée. Pour répondre à cet objectif Google s’appuiera sur les suggestions, ces suggestions seront proposées grâce aux requêtes qui reviennent le plus fréquemment à propos d’un mot clé. Google se basera donc sur l’historique des recherches pour proposer les suggestions aux internautes.
Pour montrer comment cette fonction est implémentée, l’auteur du billet sur le blog de Google donne l’exemple de Matt Groening, le créateur des Simpsons. Il montre comment il est possible de répondre à la question qu’aurait pu se poser l’internaute “Comment lui est venue l’idée des prénoms des personnages” en soulignant que sur la courte biographie on peut voir des similitudes avec la famille de Groening. D’ailleurs si l’on compare le résumé de Marie Curie et celui de Matt Groening on voit bien que nous n’avons pas accès aux mêmes types d’informations, signe que ce sont les plus pertinentes qui sont privilégiées.
Toutes ces améliorations permettent aux utilisateurs d’effectuer des recherches plus fines, mais aussi d’avoir des résultats plus rapidement sans passer par un site tiers. Google ne doit toutefois pas oublier que ses revenus proviennent justement de ces sites tiers et doit donc jongler entre amélioration de son moteur de recherche et préservation de son modèle économique.
Ces nouvelles fonctionnalités ne constituent pas encore vraiment de la recherche sémantique, mais le fait de créer une base de données conséquente va bien dans ce sens et il est clair que c’est l’objectif de Google. Pour l’instant elle n’est implémentée que dans les pays anglophones, gageons qu’elle le sera bientôt chez nous. Google indique également que cette fonctionnalité sera disponible sur les appareils mobiles tels que les smartphones et tablettes. Je vous propose de regarder la vidéo de présentation de ce Knowledge Graph :
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
Cette recherche sémantique pourrait s’appliquer à un siri like sur Android.
Ce qu’oublie de dire l’article c’est qu’il existe déjà un moteur de recherche sémantique : wolfram alpha (qu’utilise d’ailleurs Siri pour répondre à Alex)
ça ne va pas plaire à de nombreux sites ça. moins de visiteurs, moins d’argent, qui seront récupérés par Google
Je me demande dans quelle mesure il sera possible à Google d’utiliser ce mécanisme de recherche sémantique pour cumuler des informations sur nous… Et surtout pour les diffuser en un clin d’oeil à toute personne qui demandera à Google “qui est prénom nom ?” (genre des patrons avant de recruter par exemple…)
Avant dernier jour pour s’inscrire sur le salon marketing 3.0 du futur. Vous êtes déjà plus de 5000, venez tous et rencontrez les leaders de demain sur le WEB SEMANTIQUE qui vous aiderons à vous développer et vendre mieux. Oubliez les autres, tous les leaders sont là et la plupart sur aucun autre salon ! http://www.time2market.fr J-6 HALL 6 – PORTE DE VERSAILLES
Fabuleux outil de propagande et de pensée unique. J’aime pas du tout ça. Existera-t-il toujours a terme un moteur de recherche neutre et exhaustif ?…
@Tom
Oui c’est vraiment flippant.
Google sait à ta place ce que tu recherches.
Et évidement in fine tu trouvera toujours un truc mercantile.
Comme 90% des gens utilise google, tout le monde trouvera la même chose.
Si google tourne vraiment le potar à fond ça va devenir chiant internet, pire que le JT.
article vraiment bien rédigé, c’est un plaisir