Illustration of the Internet Archive with a hacked icon in front and several corrupted files around it.
Agence web » Actualités du digital » Le piratage d'Internet Archive est un avertissement

Le piratage d'Internet Archive est un avertissement

Points clés à retenir

  • Internet Archive préserve le contenu numérique, les instantanés historiques de sites Web et les œuvres du domaine public pour protéger notre histoire numérique.
  • Les sites Web disparaissent rapidement, et jusqu’à 38 % d’entre eux disparaîtront d’ici 2024, ce qui nécessitera des archives comme la Wayback Machine.
  • Internet Archive protège bien plus que de simples sites Web, notamment des logiciels, des livres, des archives musicales, des documentaires et des expériences interactives.

L'Internet Archive, ou IA, catalogue et préserve les sites Web depuis les débuts d'Internet. Certains de ces sites Web n’existent plus, et IA est le seul endroit où nous pouvons nous rendre pour avoir un aperçu de leur apparence à l’époque. Un piratage de ce musée numérique pourrait signifier la perte définitive de ces sites.

Le patrimoine culturel de Ye Olde Internet

J'ai acheté mon premier ordinateur en 1996, mais ce n'est qu'en 2001 que j'ai découvert Internet dans toute sa splendeur. J'avais même un site Web GeoCities, et si vous vous souvenez de ce que c'est, j'espère que votre dos ne vous fait pas mal. À cette époque, Internet semblait bien plus vivant parce que nous avions bien plus que de simples sites de médias sociaux.

Cependant, la lente marche du temps consume toutes choses et bon nombre de ces anciens sites Web ont disparu dans l’éther. Heureusement, quelqu’un a eu la prévoyance de sauvegarder ces pages numériques (les plus populaires, en tout cas) en tant que musée virtuel : Internet Archive. Internet Archive (et Wayback Machine) vous permet de voir Internet tel qu'il était.

Malheureusement, Internet Archive a connu quelques jours difficiles au cours du mois dernier et a été mis hors ligne à plusieurs reprises. Alors que le site s'est rétabli et a finalement repris ses activités, sa vulnérabilité a ouvert la porte à la question : « Que se passera-t-il si nous perdons Internet Archive et Wayback Machine ?

De toute façon, que protègent les archives Internet ?

Pourquoi diable voudrait-on préserver des sites Web morts ? Ils sont morts pour une raison, non ? Outre leur utilisation commerciale, ces anciens sites Web peuvent nous en apprendre beaucoup sur l’époque et le lieu où ils ont été créés. L'IA existe pour protéger certaines choses, telles que :

  • Contenu numérique : IA enregistre le contenu numérique, en veillant à ce qu'il ne disparaisse pas d'Internet, même si le site Web produisant ce contenu n'est plus disponible ou hébergé.
  • Instantanés historiques : La Wayback Machine enregistre des instantanés périodiques de sites Web, permettant aux utilisateurs de rechercher à quoi ressemblait un site particulier au cours d'une période donnée. Ce n’est pas seulement une question de nostalgie. Les enquêteurs Internet peuvent utiliser cela pour vérifier des informations qui pourraient ne plus exister.
  • Travaux du domaine public : IA organise et préserve activement les œuvres du domaine public, notamment les livres, les films et la musique. En numérisant et en mettant à disposition ces ressources, elle promeut le patrimoine culturel et l’accès au savoir.

Selon toutes les mesures, c'est beaucoup de choses à garder en vie. Dans de nombreux cas, c'est le seul endroit sur Internet où l'on peut trouver certaines choses. Et c'est très préoccupant, compte tenu de sa vulnérabilité.

Perdre notre histoire numérique

Même si cela peut paraître paradoxal, l’histoire numérique est réelle et nous en perdons chaque jour des morceaux. Selon le BBC,entre 2013 et 2023, jusqu'à un quart de tous les sites Web ont entièrement disparu. Cette valeur a encore augmenté, pour atteindre 38 % en 2024. Même si nous pouvons compter sur des tablettes sculptées pour nous dire qui était le pire marchand de cuivre d'Ur ; nous ne pouvons pas faire la même chose avec les sites Web, car une fois qu'ils ont disparu, ils sont disparu.

C'est là que des archives comme The Wayback Machine sont inestimables. Par exemple, si nous regardons MySpace dans Wayback Machine, nous pouvons avoir une idée des fondements des réseaux de médias sociaux. Même si Facebook et les autres sites de médias sociaux sont aujourd'hui très différents, les archivistes Internet peuvent évaluer l'impact de MySpace sur le développement et l'évolution de ces sites.

Vous souvenez-vous de Wikitravel ? Ne vous inquiétez pas, la plupart des gens qui n'ont pas voyagé avant 2012 ne le savent pas, mais The Wayback Machine s'en souvient. Le site a disparu en 2012, mais il servait de proto-TripAdvisor, où les gens partageaient leurs idées et leurs conseils sur une page wiki modifiable publiquement. Aujourd'hui, les instantanés de Wikitravel montrent à quel point le voyage numérique a évolué depuis sa disparition. Perdre IA et la Wayback Machine signifie perdre ces instantanés et tout ce qu'ils pourraient nous dire.

Il ne s'agit pas seulement de sites Web

La plupart des gens ne le savent peut-être pas, mais IA est également un référentiel de logiciels, de livres et de documents du domaine public. Voici un aperçu de ce que nous risquons de perdre si l’IA tombe en panne.

  • Logiciel: Les anciens systèmes d'exploitation, tels que les premières versions d'UNIX et MS-DOS, sont conservés sur IA et tout le monde peut y accéder et les essayer.
  • Applications héritées : Certaines personnes âgées se souviennent peut-être de Lotus 1-2-3, le tableur. Si l’IA tombe en panne, nous perdrons complètement les anciennes versions de ce logiciel.
  • Archives musicales : L’audio du domaine public, les enregistrements uniques et les collections de musique historique pourraient disparaître en un clin d’œil.
  • Documentaires et histoires orales : Les récits personnels sous forme de blogs instantanés ou de pages de réseaux sociaux cesseront d’exister, et les personnes qui en sont responsables seront également perdues dans le temps.
  • Expériences interactives : Les années 90 et le début des années 2000 ont été remplies d'expériences interactives liées aux pages Web. Avec les nouvelles normes actuelles en matière de pages Web, nous ne verrons plus jamais le genre de choses que nous avons vues à l’époque. Si nous perdons ces pages archivées, nous ne pourrons peut-être plus jamais revivre l’informatique des années 90.
  • Projets d'archives : Des jeux vidéo épuisés aux autres supports d’archives, nous risquons de perdre une grande partie de notre histoire, en particulier celle de la fin du XXe et du début du XXIe siècle.

Il ne s’agit pas d’une liste exhaustive, loin de là, mais elle touche à la plupart des choses que l’IA préserve pour nous. Beaucoup d’entre nous tiennent l’histoire (en particulier les débuts de l’Internet) pour acquise. Pourtant, c'est comme cette chanson, Grand taxi jaunevous ne savez pas ce que vous avez jusqu'à ce qu'il soit parti. Et si l'IA tombe en panne, elle disparaîtra pour toujours.

Apprendre de l’effondrement des archives Internet

Le récent piratage qui a détruit l’IA devrait souligner l’importance de préserver notre histoire numérique. Le Smithsonian aborde tous les défis liés à l'archivage des données et présente quelques solutions, notamment la sécurité des données, les sauvegardes et les audits. Pourtant, c’est un chemin difficile à parcourir pour une organisation comme Internet Archive. Une grande partie de la préservation de notre passé numérique dépend de nous, les utilisateurs.

Demain, nous pourrions nous réveiller et réaliser que deux décennies de notre histoire numérique ont été effacées du jour au lendemain. Je ne pense pas que je veuille un jour faire face à cette réalité, et vous ne devriez pas non plus le faire. Tant que l’IA existe, nous devons faire tout notre possible pour la maintenir en vie. L’histoire d’Internet est tout aussi essentielle à préserver que les découvertes archéologiques, et nous devons traiter ces archives avec le même respect.

★★★★★