Mémoires et archives du Web : la taille compte

La course à l’affichage de la plus grande taille d’index des moteurs de recherche s’est achevée depuis quelques années. Est-ce dû à la croissance exponentielle de production de contenus numériques depuis ?
Cependant, deux questions clefs restent aujourd’hui sans réponse claire ni précise : quelle est la taille du Web ? Quelle est la taille des archives disponibles du Web ?

Un groupe de chercheurs de la Old Dominion Norfolk University aux États-Unis a publié récemment les résultats d’une étude menée fin 2012 pour estimer la taille des archives du Web. Se basant sur un traitement de données en provenance de plusieurs sources comme Archives.org, Bit.ly, DMOZ ou Delicious, les chercheurs sont arrivés aux résultats suivants : 35% à 90% du Web dispose d’au moins une copie, 17% à 49% a entre 2 et 5 copies, 1% à 8% a 6 à 10 copies, et 8% à 63% dispose de plus de 10 copies dans les archives publiques.

Si chaque source dispose de ses propres méthodes et biais, il est évident que ces résultats montrent des écarts considérables dans la réalisation de cette tâche d’archivage. La pérennité des actions entreprises dépend aussi de manière très étroite du financement accordé aux projets, mais aussi de la manière dont les données sont accessibles et exploitées.

D’autre part, la taille du Web invisible est rarement prise en compte dans ce type d’exercice, y compris les ressources disponibles via des services et applications spécifiques et notamment toute la galaxie .onion.

20130108-115033.jpg

Articles similaires:

0 Posted on 8 janvier, 2013 by Aref JDEY

Partagez cet article avec la communauté !