Enlaces accesibilidad

Wayback Machine: la máquina del tiempo de las páginas web se renueva

  • Sirve para ver cómo era la Web en el pasado
  • Una nueva barra de control hace más fácil desplazarse en el tiempo
  • Se puede usar para curiosear o recuperar sitios web desaparecidos

Por
Una de las imágenes recopiladas en Wayback Machine de RTVE.es en 2004.
Una de las imágenes recopiladas en Wayback Machine de RTVE.es en 2004.

Wayback Machine es para muchos uno de los proyectos más apasionantes e interesantes de Internet. Si hubiera que salvar para el futuro sólo uno de todos los que actualmente existen, tal vez debería ser éste.

Se trata de un archivo histórico de cómo es y era la Web, desde más de una década: una especie de "memoria histórica" construida rastreando y guardando copias completas de todas las páginas web, imágenes y documentos que en ella aparecen.

Tan histórica es su importancia que hace tiempo realizaron una copia de seguridad de toda la información en grandes discos y los enviaron a la biblioteca de Alejandría, para que fueran preservados en caso de catástrofe.

El actual propietario de la Wayback Machine es The Internet Archive, una organización sin ánimo de lucro que consiguió una de las primeras copias del contenido completo de la Web gracias al trabajo de Alexa Internet -una empresa que ahora es propiedad de Amazon- que se dedicaba a esas labores de rastreo con finalidades de marketing.

Este archivo contiene en la actualidad más de 5 petabytes

Este archivo contiene en la actualidad más de 5 petabytes (5 millones de gigabytes) de información, y la herramienta que ofrecen a los usuarios para navegar por tan vasta biblioteca es la "máquina del tiempo" denominada Wayback Machine, que ahora se ha renovado.

¿Cómo funciona?

La nueva Wayback Machine funciona de una manera tan simple como la anterior: basta teclear la dirección (URL) de una página web cualquiera para ver cuál es la última copia que hay guardada en el archivo.

El diseño de la portada se ha simplificado y ahora es más claro y elegante. A partir de aquí, las cosas también cambian un poco: en la versión anterior se podía acceder a una lista a modo de calendario que mostraba los momentos clave en que la web en cuestión había sido rastreada y "guardada" en el archivo.

Ahora hay una nueva barra mucho más estilosa en la parte superior de la pantalla, que permite ver gráficamente esos momentos a lo largo del tiempo.  La longitud de las barras del gráfico indica en qué meses se hicieron más copias, lo cual está normalmente asociado a una mayor actividad en la web en cuestión: más grandes, más actualizaciones.

También se pueden navegar con los controles por los distintos años o acceder al calendario. En esta nueva versión lo que aparece es un calendario al estilo tradicional con los días clave en los que se hizo una copia de la página web marcados con un recuadro de color.

¿Para qué sirve?

El archivo, que comenzó a guardarse allá por 1996, contiene todo tipo de webs. Por un lado los «arqueólogos digitales» lo utilizan para examinar cómo eran las versiones de los sitios oficiales de ciertas empresas o proyectos en la antigüedad, dado que las páginas actuales raras veces conservan los diseños anteriores.

Si una web desaparece o se borra, permanecerá en el archivo

Por otro lado, si una web desaparece o se borra, aun así permanecerá en el archivo. Este es el caso de webs y dominios que cambian de propietario o simplemente de proyectos con final desgraciado. ¿Quién no recuerda el entrañable mundo de GeoCities?

A los investigadores privados tampoco les viene mal este archivo, pues es extraño por no decir imposible que algo que estuvo publicado durante un tiempo razonable no haya sido capturado por la máquina y guardado para siempre.

La mayor parte de la gente conoce únicamente la famosa "caché de Google", un enlace que aparece junto a los resultados de las búsquedas que muestra cómo es o era una página aunque haya desaparecido temporalmente por alguna razón.

Pero cuando una página cambia, es borrada o trasladada de forma definitiva, Google normalmente actualiza su memoria caché, borrando la vieja copia.  Pero si bien Google guarda únicamente una versión de cada página, la Wayback Machine las guarda todas.

Es una especie de "fotografía del momento" que perdura para siempre. 

Aun así, quienes prefieran que ciertos contenidos desaparezcan para siempre –tarea nada fácil, por no decir imposible– sólo tienen que hacer una cosas: crear un fichero llamado robots.txt y ponerlo en su web para evitar que Google, la Wayback Machine u otros "robots" accedan al contenido.

Al hacer esto el sistema de Archive.org también borrará los documentos archivados en el pasado dado que, como ellos mismos dicen, "no tenemos ningún interés en dar acceso a webs, documentos o guardar cosas que la gente no quiere que guardemos".