Passer au contenu

2,8 petaoctets pour la bibliothèque du Vatican

Alors qu’on sait maintenant que le nombre de Tweets autour de l’élection du nouveau Pape François 1er n’a pas dépassé celui autour de la seconde élection…

Alors qu’on sait maintenant que le nombre de Tweets autour de l’élection du nouveau Pape François 1er n’a pas dépassé celui autour de la seconde élection du Président Américain Barack Obama, on apprend aujourd’hui que le Vatican vient de décider de numériser sa bibliothèque, soit un projet énorme qui va compter pas moins de 90.000 documents, 40 millions de pages, le tout stocké dans 2,8 petaoctets, généreusement (ou pas) supportés par EMC.

Ce n’est pas la première fois qu’EMC participe à ce genre de projet puisque dans le passé, la firme avait déjà participé à la reconstruction en 3D des travaux de Leonard de Vinci. Pour en revenir aux travaux de numérisation, il va falloir compter une durée d’environ 9 ans pour arriver à bout de la Bibliothèque. Reste à savoir quel format EMC choisira pour rendre pérenne cette numérisation gigantesque.

vatican-city

🟣 Pour ne manquer aucune news sur le Journal du Geek, abonnez-vous sur Google Actualités. Et si vous nous adorez, on a une newsletter tous les matins.

24 commentaires
  1. J’ai hâte de voir ça! La bibliothèque Vaticane à portée de clic quel chercheur n’en a pas rêvé?

  2. 9 ans??? 😮
    Ça me parait un peu exagéré pas vous comme temps pour “seulement” 40 millions de pages? Ou alors ils utilisent un scanner acheté en grande surface ^^
    Comme l’a dit julo les scanners utilisés font dans les 200-250pages/min. Alors même si on prend en compte le temps pour la mise en place du livre par un humain (bien que ça se fasse bien mieux par robot et pour moins cher) on n’atteint pas du tout les 9 ans annoncées… Et si on prend en compte la possibilité d’utiliser plusieurs scanners alors là on fait ça à l’aise en quelques mois

  3. Pas mal comme idée mais sa sera pas accessible au public et je sais pas pour les chercheurs ils vont peut être la gardée pour eux
    Et pour le crack je ne sais pas sa sera peut être pas accessible pas internet sa sera sûrement un réseau fermé

  4. @jbam : Bah oui, bien sûr, comme n’importe quel gouvernement, ils gardent leurs secrets et papiers privés dans la bibliothèque nationale =)

  5. Sauf que, en toute logique, leurs ouvrages sont anciens et donc fragiles, et il est donc peu probable qu’ils utilisent des trucs qui enchaîneraient 200 pages par minutes. Les ouvrages sont, a mon avis, manipulés avec précaution.

  6. @zerospace: Admettons qu’un robot puisse charger le scanner à 250 pages minutes (sans les abîmer). Etant donné les chiffres annoncés (2.8 Po pour 40 millions de pages, soit 70Mo la page), il faudrait que le scanner envoie 290Mo/s de données en continue sur un disque dur.
    Je dis pas que c’est pas possible côté disque (en SSD ou RAID) mais côté scanner, ça me parait un peu lourd….
    M’enfin bon, je suis pas expert en scanner.

  7. http://www.emc.com/about/news/press/2013/20130307-01.htm

    Je suis ingénieur avant-vente chez EMC. Pour être plus précis, comme l’a dit Getix, ils n’utiliseront pas des scanners normaux qui font du 200 pages par minute du fait de la fragilité de leurs ouvrages. Quant à la technologie utilisée, il y en a plusieurs : Atmos (stockage basé sur l’objet) et Isilon, notre plateforme de Scale-Out NAS pour le stockage principal en cible finale. Mais en première phase (qui durera trois ans) ils utilisent du VNX Unified Storage qui est une plateforme SAN et NAS. Pour la sauvegarde de toutes ces données, ils utiliseront Data Domain, un système de sauvegarde dédupliqué.

    En plus du projet des travaux réalisés sur Leonard De Vinci, nous sommes également en train de numériser la bibliothèque de Boston (JFK Library) et la Herzogin Anna Amalia Library en Allemagne.

    Voilà !!

  8. Merci c’est vrai que j’avais pas pris en compte la fragilité des livres et le stockage ! Du coup je comprend mieux le temps annoncé 😉

  9. Un vieux livre ça ne se tourne pas à 250 pages minutes comme il est précisé.
    C’est du travail de très longue haleine.

  10. Vu la difficulté actuelle et les facteurs de sélections pour consulter les bibliothèques du Vatican, je ne crois pas que les ouvrages seront disponibles en ligne. En plus une grande partie doit être rédigé en latin et en hébreux. Quand Wikileak aura réussis à mettre la main dessus, il faudra beaucoup de temps avant d’avoir des traductions et encore plus pour avoir des analyses.

    Au moins ces ouvrages vont pouvoir être sauvegardés et copiés pour les temps futurs, peut-être qu’un jour les historiens pourront vraiment mesurer le poids de l’Église dans l’histoire.

  11. Il y a surement de tout et pas que de la théologie. Peut-être par exemple qu’ils savent qui a tué Kennedy.

  12. @zerospace : certes tu peux aller tres vite… avec des document récent et robustes… certains documents de cette bibliothèque ont des centaines d’années et ça se manipule pas comme ça faut les proteger, tu peux pas les exposer à de grandes sources de lumières etc… tu peux passer 20min pour scanner une page parfois avec toutes les précautions à prendre

Les commentaires sont fermés.

Mode