Mémoires et archives du Web : la taille compte
La course à l’affichage de la plus grande taille d’index des moteurs de recherche s’est achevée depuis quelques années. Est-ce dû à la croissance exponentielle de production de contenus numériques depuis ?
Cependant, deux questions clefs restent aujourd’hui sans réponse claire ni précise : quelle est la taille du Web ? Quelle est la taille des archives disponibles du Web ?
Un groupe de chercheurs de la Old Dominion Norfolk University aux États-Unis a publié récemment les résultats d’une étude menée fin 2012 pour estimer la taille des archives du Web. Se basant sur un traitement de données en provenance de plusieurs sources comme Archives.org, Bit.ly, DMOZ ou Delicious, les chercheurs sont arrivés aux résultats suivants : 35% à 90% du Web dispose d’au moins une copie, 17% à 49% a entre 2 et 5 copies, 1% à 8% a 6 à 10 copies, et 8% à 63% dispose de plus de 10 copies dans les archives publiques.
Si chaque source dispose de ses propres méthodes et biais, il est évident que ces résultats montrent des écarts considérables dans la réalisation de cette tâche d’archivage. La pérennité des actions entreprises dépend aussi de manière très étroite du financement accordé aux projets, mais aussi de la manière dont les données sont accessibles et exploitées.
D’autre part, la taille du Web invisible est rarement prise en compte dans ce type d’exercice, y compris les ressources disponibles via des services et applications spécifiques et notamment toute la galaxie .onion.
Articles similaires:
- Les jeunes font confiance au web pour l’information économique
- Connaissez-vous Bluenod, pour la cartographie de la twittosphère ?
- Les utilisateurs Facebook plus protecteurs de leurs données même s’ils partagent plus souvent
- Quelle veille pour une entreprise 2.0 ?
- Alain Juillet : « Innover est la seule chance de sortir de la crise »

La BNF a aussi de son côté lancé une initiative d’archivage du Web…