Passer au contenu

Des chercheurs développent le tout premier disque dur dopé à l’IA

Un groupe d’étudiants a développé une puce IA capable d’augmenter la capacité et de réduire la latence des disques durs traditionnels. Le début d’un nouveau paradigme ?

Avec la montée en puissance fulgurante de l’informatique sur les deux dernières décennies, les besoins de supports de stockage ont explosé. Le Web d’aujourd’hui repose sur d’immenses datacenters qui abritent des volumes de données invraisemblables. Et même à l’échelle de l’individu, il est de plus important d’avoir accès à des supports performants pour conserver, exploiter et transférer des films, des jeux vidéo, des documents de travail…

Le problème, c’est que ce volume de données augmente exponentiellement. Cela force l’industrie à s’adapter en proposant des capacités et des vitesses de transfert de plus en plus importantes. Mais cela ne suffira pas éternellement. Pour tenir le rythme, tôt ou tard, il va aussi falloir repenser entièrement le mode de fonctionnement de ces supports. Et c’est ce qu’un professeur de la prestigieuse Université de Carnegie Mellon a cherché à faire avec ses élèves.

Ensemble, ils ont cherché à développer un support de stockage très performant. Pour ce faire, ils se sont appuyés sur une autre discipline très à la mode en ce moment : le machine learning. Pour ceux qui ne sont pas familiers du sujet, c’est une branche de l’intelligence artificielle qui consiste à construire des algorithmes capables d’améliorer leurs performances au fil du temps ; son objectif est d’imiter les mécanismes de l’apprentissage humain.

Cette technologie a déjà révolutionné des tas de disciplines, des data sciences à la finance en passant par la médecine, la biologie fondamentale, et bien d’autres (voir notre article ci-dessous). Et désormais, les chercheurs de Carnegie Mellon veulent s’en servir pour booster les performances des disques durs.

Le machine learning pour optimiser le stockage des données

Sur un disque dur standard, les données sont conservées sur un plateau rotatif circulaire recouvert d’un enduit magnétique. Ce dernier est composé d’un grand nombre de petits sous-éléments qui peuvent tous être magnétisés individuellement grâce à une structure que l’on appelle la tête d’écriture. Fonctionnellement, on parle alors de bits. En fonction de leur état, ils peuvent correspondre à un 0 ou à un 1 en langage binaire. C’est ensuite une seconde tête (de lecture cette fois) qui se charge d’interroger ces bits pour les traduire en données exploitables.

C’est sur ce dernier mécanisme que Jimmy Zhu, professeur à Carnegie Mellon, a joué avec ses étudiants. Pour optimiser la technologie de traitement du signal qui permet de détecter les bits, ils ont cherché à la doper grâce à un système basé sur le machine learning qui prend la forme d’une petite puce.

© GDJ – Pixabay

Cette dernière permet au disque dur de s’entraîner au fil des cycles d’écriture et de lecture. Au fil du temps, il sera capable de stocker des données avec une efficacité croissante. C’est un peu comme apprendre à jouer à Tetris ; plus on persévère, plus il devient facile d’arranger les différentes pièces de façon à limiter au maximum les espaces vides. En pratique, cela permet d’augmenter significativement la capacité de stockage du disque dur.

Cette approche réduit aussi considérablement la latence globale du système au fil de l’entraînement. En d’autres termes, il est donc possible d’accéder aux données plus rapidement.

Une solution idéale pour l’industrie ?

Malheureusement, le communiqué de Carnegie Mellon ne dévoile aucune donnée chiffrée sur ces gains de performances. Il est donc impossible de savoir à quel point le concept est efficace. Mais malgré tout, il semble extrêmement prometteur à plusieurs niveaux. Cette technologie pourrait permettre de produire une nouvelle génération de disques durs aux performances encore jamais vues — et peut-être même comparables à celles des SSD modernes.

Pour rappel, ces derniers fonctionnent sur un principe très différent ; l’ensemble des données n’est pas stocké sur un disque physique, mais sur de la mémoire flash. Les SSD sont donc nettement plus rapides que les disques durs traditionnels lorsqu’il s’agit d’en extraire les données, puisqu’il n’y a pas besoin de déplacer physiquement la tête de lecture. Ils affichent aussi une meilleure résistance et une durée de vie plus importante.

© Taylor Vick – Unsplash

Le problème, c’est qu’ils sont aussi beaucoup plus chers et qu’ils proposent une capacité moins importante. Pour cette raison, la plupart des datacenters sont encore forcés d’utiliser des disques durs traditionnels. Certes, il s’agit généralement de modèles spécialisés; mais ils fonctionnent toujours sur le modèle traditionnel, avec un disque magnétique et une tête de lecture.

Dans ce contexte, la puce de Carnegie Mellon pourrait faire une énorme différence ; elle permettrait de rassembler le meilleur des deux mondes en se rapprochant des performances des SSD sans faire exploser les coûts. Et à terme, les disques durs grand public pourraient aussi être dopés à l’aide de cette technologie.

Il sera donc très intéressant d’observer l’évolution de ce concept ; d’ici quelques années, l’intelligence artificielle pourrait bien nous mener vers une petite révolution du stockage de données. Et tout ça grâce aux prouesses d’une équipe d’étudiants !

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

Mode