Yahoo vient de faire un beau cadeau à la communauté de chercheurs qui s’intéressent aux algorithmes de recommandation sur Internet. Dans le cadre de son programme Webscope, la firme de Sunny Vale a en effet livré plus de 13,5 To de données anonymisées aux chercheurs, ce qui représente les interactions de plus de 20 millions d’utilisateurs de Yahoo entre les mois de février et mai 2015.
Cela équivaut environ à 110 milliards d’interactions, directement liés aux fils d’actualité de plusieurs des services de la société comme Yahoo News, Sports, Finance, Movies ou Real Estate. Le document proposé atteint les 13,5 To, soit un fichier compressé de 1,5 To.
Ces données ont beau être anonymes, elles sont suffisamment précises pour mettre en place des analyses poussées. On peut y consulter la tranche d’âge, le genre et même les données géographiques à l’origine de ses interactions.
Cette immense « bibliothèque de comportements » va laisser un champ d’action considérable aux chercheurs. Grâce à ces données, ces derniers vont pouvoir à terme améliorer les algorithmes de recommandation, et mieux comprendre les démarches des internautes quand ils surfent sur le net.
Cela permettrait également de faire des avancées dans le domaine de l’apprentissage automatique, une branche particulièrement pointue de l’intelligence artificielle, qui permet à une machine (ici algorithmique) d’évoluer par un processus systématique.
Des recherches à la fois fascinantes et terrifiantes.
🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.
Non content de monétiser nos data perso ils veulent en plus qu’on fasse nous-même les algo de tracking ? ><