martes, 21 de febrero de 2017

Navegar en el tiempo gracias a Wayback Machine



"El tiempo pasa, nos vamos poniendo viejos...". Así empieza una canción de Pablo Milanes y, aunque esta se refiera a las personas, esto no sólo es aplicable a los seres vivos, las webs también también tienen un periodo de vida y a veces muy corto por culpa de la evolución desenfrenada de la World Wide Web. Es cierto que los grandes parecen inmutables pero no todos tienen la misma suerte, a alguno le habrá pasado que un enlace guardado en favoritos, marcadores,  Feedly o Pocket ya no es accesible cuando pinchamos para volver a verlo, ¿por qué pasa esto? Exacto, esa web ha pasado a mejor vida. Pero no está todo perdido, hay una posibilidad de recuperar esa información y, para eso, nos va a ayudar Wayback Machine.


Internet Archive es un proyecto sin ánimo de lucro fundado en 1996. Nació con el fin de crear una biblioteca digital para preservar páginas webs públicas, software, vídeos, imágenes, audios y libros digitalizados. Ellos fueron los creadores de la página web Wayback Machine y gracias a esta podemos acceder a todo ese contenido de forma rápida y sencilla ya que todo está bien catalogado y ordenado por fechas. 



En mi caso he echado mano muchas veces del historial de páginas web para algún proyecto y funciona bastante bien, solo hay que teclear la dirección de la web en cuestión y al rato nos mostrará varias capturas (snapshots) de la misma a lo largo del tiempo. De ese modo se puede ver la evolución de una web, ver antiguos diseños de proyectos olvidados, hacer cronologías, recuperar artículos que en su tiempo nos resultaron interesantes o, para los nostálgicos, recordar como eran sus webs favoritas en el pasado. En la siguiente imagen muestro el historial de una web que he hecho hace tres años y que en ningún momento he introducido en el archivo de Wayback Machine, ellos mismos la han encontrado y han tomado las capturas.


Se puede evitar su idexación y grabación de información en el archivo robots.txt con: User-agent: ia_archiver Disallow: /

Esto no es todo, nos guardan una joya a los amantes de los juegos árcade (entre los que me incluyo), además del software ya mencionado, disponen de más de 3.000 juegos que se emulan directamente desde la página web sin necesidad de hacer instalaciones o descargas.


Es un proyecto de grandes dimensiones, en el año 2006 contenía hasta 2 petabytes de información y crecía en torno a 20 terabytes por mes.

Recomiendo mucho su uso, yo la conocí hace unos años para recuperar un proyecto de un cliente y me ha dado muy buenos resultados, además, en la sección de software hay unas cuantas maravillas.

Wayback Machine: https://archive.org/web/

0 comentarios:

Publicar un comentario