Preguntas frecuentes
¿Qué otra información puedo obtener sobre la recolección de un sitio web?
Las características principales de un sitio web archivado son la frecuencia (periodicidad de la recolección: diaria, semanal, mensual, etc.) y la profundidad (el número de clics necesarios para alcanzar los recursos de un sitio web a partir de la URL principal). Es posible consultar la frecuencia con la que un recurso ha sido archivado en el calendario que aparece tras una búsqueda en la interfaz de búsqueda. Haciendo clic en uno de los días marcados en azul se accede al recurso solicitado.
En cambio, para verificar la profundidad de los sitios web se deben consultar los ficheros Excel con las semillas incluidas en cada colección, disponibles en la página web de la colección del Archivo de la Web Española
¿Por qué no encuentro lo que busco?
Puede deberse principalmente a dos razones. En primer lugar, la URL que se ha introducido podría ser incorrecta o estar incompleta: de momento, no es posible realizar búsquedas a texto completo. En segundo lugar, es posible que el sitio web o parte del sitio no hayan sido recolectados por incidencias de carácter técnico, o por no responder a los criterios de selección elegidos.
Hay que tener en cuenta que el Archivo de la Web Española conserva miles de sitios web, pero sus colecciones no pueden ser exhaustivas y varían según las características de recolección [Véase ¿Qué otra información puedo obtener sobre la recolección de un sitio web?].
Por lo general, la Biblioteca Nacional de España asegura por lo menos una captura anual y automática de todos los sitios web con dominio .es: esta “recolección masiva” pretende guardar una muestra representativa que refleje el panorama de Internet en un momento dado. Sin embargo, no se guardan todos los niveles de un sitio web, así que algunos hiperenlaces podrían no funcionar.
Asimismo, la Biblioteca Nacional de España y los centros de conservación de las Comunidades Autónomas realizan la captura del patrimonio documental relacionado con España, también para los dominios distintos al .es. Las llamadas “recolecciones selectivas” son colecciones específicas con recursos seleccionados sobre un tema o sobre un acontecimiento de interés. Recogen menos sitios web, pero con una frecuencia y una profundidad mayores que en el caso de las masivas. Aun así, queda la posibilidad de no encontrar una página web o uno de sus elementos: porque no ha sido incluido en la recolección selectiva; porque no se ha realizado su captura el día deseado; o porque, por razones técnicas o de espacio, el recurso solicitado no está archivado.
¿Los sitios web se visualizan tal y como aparecían el día de la captura?
El propósito de las recolecciones web no es sólo conservar los contenidos sino también la apariencia y la interactividad de cada página. Sin embargo, en las recolecciones pueden faltar datos o darse otros inconvenientes: algunos hiperenlaces podrían redirigir a recursos no archivados; otros objetos (imágenes, vídeos, pdf, etc.) podrían presentar errores de visualización; los elementos que necesitan de interacción humana (filtros, búsquedas en el sitio, etc.) no funcionan; etc.
Además, la página web podría presentar errores de visualización, debido al diseño de algunas páginas web o al uso de un lenguaje de programación que no es posible reproducir. Por ello, la página archivada podría no respetar la configuración y la apariencia del recurso original. En ocasiones, los defectos de visualización pueden afectar a la navegación; pero, en la mayoría de los casos, no impiden la consulta de los contenidos de interés. La solución de todos estos problemas sigue siendo objeto de investigación y desarrollo en el campo del archivado web a nivel internacional.
Finalmente, hay que tener en cuenta que la profundidad de recolección (el número de clics necesarios para alcanzar los recursos de un sitio web a partir de la URL principal) no es ilimitada, está condicionada por la configuración establecida dentro de los objetivos de recolección de cada colección en particular.
¿Por qué no consigo visualizar determinados elementos de las páginas web (imágenes, galerías, vídeos, etc.)?
La correcta visualización de los contenidos de una página web depende principalmente de dos factores: por un lado, de la efectividad en la captura del sitio; por otro lado de la capacidad de la herramienta de consulta para reproducir los contenidos recolectados. En este segundo caso, aunque los datos estén archivados, puede ocurrir que los datos se hayan archivado, pero que su visualización resulte, de momento, imposible por las limitaciones técnicas del software de recuperación. Los elementos que presentan este tipo de dificultades para su visualización son principalmente aquellos que utilizan javascript y los vídeos en streaming.