Frequently asked questions

¿Por qué no está limitado por lengua?

Si se hubiera limitado al castellano y al resto de lenguas oficiales del estado español, podrían quedar incluidas publicaciones de países iberoamericanos. Por otra parte, quedarían fuera publicaciones (que podrían contener patrimonio documental) en lenguas no reconocidas como oficiales por nuestra Constitución, como el bable. Además, muchos sitios web con patrimonio documental de las culturas de España están dirigidos a usuarios extranjeros y, por tanto, en otras lenguas.

¿Qué publicaciones están excluidas?

Los correos y la correspondencia privada, los contenidos albergados únicamente en una red privada (como una intranet o un foro de discusión privado) y los ficheros que contengan datos de carácter personal.

¿Qué se entiende por red privada?

Es aquella que utiliza un espacio de direcciones sin conexión directa a Internet, ni desde Internet, por lo que no aparece en la red pública. Sirve para conectar equipos de una organización (intranet) o de varias organizaciones (extranet).

Respeto de la propiedad intelectual

Todo el proceso de gestión del depósito legal respetará escrupulosamente la legislación en materia de propiedad intelectual, igual que se ha hecho a lo largo de la historia con el depósito legal de las publicaciones en soporte tangible. El acceso a las publicaciones depositadas por esta vía en los centros de conservación deberá garantizar que no se producen descargas, copias o transferencia de ficheros que vulneren los derechos de propiedad intelectual. Dicho acceso deberá llevarse a cabo a través de terminales en los centros de conservación que impidan estas prácticas ilegales.

Protección de datos de carácter personal

Todo el proceso de gestión del depósito legal respetará escrupulosamente la legislación en materia de protección de datos de carácter personal. Los ficheros que contienen este tipo de datos están excluidos expresamente del depósito legal.

¿A quién corresponde efectuar el depósito legal de las publicaciones en línea?

Los sujetos obligados a efectuar el depósito legal de las publicaciones en línea son el editor o el productor del sitio web donde se encuentren alojadas (art. 5), esto es, la persona física o jurídica titular del dominio donde se aloja el sitio web, o en su caso, la persona física o jurídica a la que el titular del dominio haya cedido válidamente y con carácter total el derecho a la utilización, gestión y explotación del sitio web y, en particular, la decisión sobre los contenidos alojados o accesibles en el sitio web (art. 2).

¿Qué obligación tienen los editores/productores de contenido en línea?

A diferencia del depósito legal de las publicaciones en soporte tangible, los editores/productores no tienen que tomar ninguna iniciativa ni emprender ninguna acción en este sentido. Su obligación se limita a dejarse recolectar por los sistemas automáticos de archivado web de los centros de conservación o transferir los documentos que estos les requieran para formar parte del depósito legal.

¿Puede negarse un editor, productor o distribuidor de una publicación en línea a que su publicación sea capturada o reclamada por un centro de conservación como parte del depósito legal?

Para el caso de que un editor, productor o cualquier interesado considere que no procede la captura del contenido de una página web, se establece en el art. 6.3 que los “los titulares de los derechos reconocidos en este real decreto podrán ejercitarlos de conformidad con la Ley 30/1992, de 26 de noviembre, de Régimen Jurídico de las Administraciones Públicas y del Procedimiento Administrativo Común, así como con el resto de normas aplicables.”

¿Qué criterios se siguen para seleccionar las publicaciones en línea que se guardan?

No existen aún criterios de selección normalizados a nivel internacional para este propósito. Las instituciones patrimoniales de todo el mundo que conservan las publicaciones en línea trabajan intensamente en este campo, pero por el momento son sus especialistas conservadores de contenido los que deciden qué se archiva y qué no. 

Ante la enorme cantidad de información que hay en Internet, las organizaciones normalmente deciden qué guardar teniendo en cuenta: el riesgo de pérdida de los contenidos en línea y su especial relevancia patrimonial, así como los recursos relacionados con el personal, las posibilidades técnicas, la capacidad de procesamiento informático y la de almacenamiento. Además, puede haber limitaciones derivadas de la legislación. 

¿Cómo se hace el depósito de estas publicaciones?

Utilizando un software especializado de rastreo y archivado automatizado de sitios web, cuando todo el contenido de estos esté libremente accesible; proporcionando a los centros de conservación las claves necesarias para acceder a aquellos documentos que estén protegidos por usuario y contraseña; o transfiriendo –a requerimiento de los centros de conservación- aquellas publicaciones que no puedan capturarse directamente en la web por medios automáticos.

¿Qué es un sitio web de acceso restringido?

Los sitios web de acceso restringido son aquellos que sólo pueden ver usuarios específicos, por estar protegidos con usuario y contraseña. Estos sitios suelen estar dentro de un sitio web principal que sí es libremente accesible.

¿En qué casos los editores de las publicaciones en línea deben proporcionar a los centros de conservación claves de acceso a los contenidos protegidos por usuario y contraseña?

En el caso de publicaciones cuyo acceso depende de una suscripción o de un pago por parte del usuario, los centros de conservación que seleccionen esas publicaciones como parte del patrimonio documental se pondrán en contacto con los editores para que estos faciliten un acceso seguro para poder acceder y descargar esos contenidos como parte del depósito legal. Este proceso se llevará a cabo con los fines exclusivos de preservación del patrimonio documental. Y el acceso que se dé a los usuarios a estos documentos respetará escrupulosamente los derechos de propiedad intelectual.

¿En qué consiste la recolección automática?

Consiste en el barrido y archivado de la web por medio de unos robots recolectores, que navegan partiendo de una semilla (una URL determinada, como www.bne.es) o un conjunto de ellas y que, según una configuración específica (tamaño de lo guardado, tiempo de rastreo, niveles de navegación, frecuencia de barrido…), guardan todos los archivos contenidos o enlazados en un sitio web (.jpg, .doc, .html, .pdf…). Mediante un software de recuperación estos contenidos son visualizados como si se tratase de páginas web, aunque esos contenidos hayan desaparecido de la web viva.

¿Qué tipo de recolecciones se hacen?

Para preservar la mayor cantidad de información se realizan dos tipos de recolecciones:

  • Las recolecciones masivas, que pretenden capturar la totalidad de un dominio (por ejemplo el dominio .es) para guardar una muestra representativa que refleje el panorama de Internet en un momento dado. Suelen realizarse una o dos veces al año y recogen un amplio abanico de sitios web, con una profundidad pequeña en los niveles de navegación.
  • Las recolecciones selectivas, cuyo propósito es capturar los recursos seleccionados sobre un tema (literatura…) o sobre un acontecimiento de interés  (unas elecciones generales, unos juegos olímpicos…). Recogen menos sitios web, pero con profundidad y frecuencia mayores que en el caso de las masivas.

¿Qué son los archivos web?

Son colecciones formadas por la recolección automatizada de sitios web. En ellos se almacenan y preservan los recursos de Internet que se han recolectado en un momento dado y que pueden haber desaparecido de Internet.