Passer au contenu

20 Terabytes de Tweets !

Le chiffre, lâché par Twitter à l’occasion de ses 5 ans, aura de quoi en impressioner plus d’un. Enfin, pas vraiment, puisqu’en réalité, on a appris…

Le chiffre, lâché par Twitter à l’occasion de ses 5 ans, aura de quoi en impressioner plus d’un. Enfin, pas vraiment, puisqu’en réalité, on a appris que l’intégralité des tweets balancés à travers le réseau social depuis sa création affichent une fois réunis un poids dépassant les 20 Terabytes, seulement. Je ne sais pas pourquoi, mais je m’attendais personnellement à un chiffre bien plus conséquent. Bon, après, il est évident que malgré la “légèreté” du tout, les coûts engendrés par leur stockage est toutefois assez elevé. Où l’on se met à parler “data centers”, et j’en passe…

via pcmag

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

11 commentaires
  1. Comment ça “les coûts engendrés par leur stockage est toutefois assez elevé” ?

    A 50 € le disque dur d’1 To, et en comptant la machine dans laquelle les mettre on s’en tire sans problème pour moins de 1000 €

    Bon après je me doute que c’est stocké sur des systèmes bien plus conséquents, et avec un hébergement ad-hoc, mais bon, je veux dire par là que ça ne doit pas être hors de prix quand même.

  2. Je ne m’attendais au contraire à pas autant.

    Du texte c’est hyper léger à stocker (et ca se compresse très bien en plus, même si stocker les données compressées implique de les décompresser pour les afficher)).

  3. Les coûts ne viennent pas de la quantité de données à stocker mais de leur accès. Vu le rythme d’utilisation de twitter, il doit falloir quelques serveurs répliqués pour stocker ça et quelques uns de plus pour servir le service.

  4. Malgré ça le site est très lent… malheureusement j’en viens à utiliser presqu’exclusivement la version Android de Twitter et non plus la page web auquel je n’adhère pas (please, notifications pour MP et mentions quoi…)…

    A se demander si Twitter va pouvoir tenir le rythme et ne ferait pas mieux de faire racheter, surtout au prix auquel il est valorisé. Maintenant je comprends la position de Twitter voulant garder son indépendance.

  5. Ca vaux le coup d’ajouter une couche de pollution sur la planète avec twitter et ses serveurs pour stocker des messages qui franchement n’intéressent personnes et si il y a quelques twettes intéressants ca finira par s’oublier dans le vaste océan d’internet…?

  6. “bien pensant” : Se dit d’une personne qui raconte que “c’est dommage pour la planète” uniquement pour se faire mousser mais qui ne fait rien chez lui face à ce problème.
    Edit : Très courant sur JDG.

  7. @tatouille> Pour 5to sur une bonne baie SAN, ça coute de 20k€ à 100k€ environ selon les performances. Il y a peu de données, mais beaucoup d’accès concurrents je suppose (bcp d’utilisateur sur le site simultanément). Sans parler des réplications multisites, sauvegardes, etc…

  8. Cela correspond à environ 100 milliards de tweets stockés en UTF-8, mais il doit y avoir de l'”overhead” qui ferait baisser ce nombre.
    En tout cas 20To c’est peanuts. 12 disques durs de 2To et t’as un RAID6 de 20To, pour ~800€ HT.

    1. Oui mais pour ce prix là tu as pas le serveur qui va derrière, et un disque grand publique ne doit pas faire long feu vue la quantité d’accès au service. Après c’est sur qu’en voyant ça comme ça, on pourrait presque être tenté de lancer son propre réseau twitter-like ^^

  9. Réponse a tatouille

    Contrairement à ce que tu crois, ce ne sont pas des disques 50€ Qui valle rien. Le san qui permet les accès multiple coûte trèschere la base de qualité chez Qnap edt de 300

  10. Youhou !!!
    C’est surtout à indexer et servir que ca coûte chez mes p’tits geeks … et je suis loin du compte

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Mode