OAI-PMH y Linked Open Data en el contexto de Hispana y Europeana. Algunas reflexiones históricas

OAI-PMH y Linked Open Data en el contexto de Hispana y Europeana. Algunas reflexiones históricas
15 de Abril de 2020

 

Agenjo Xavier, Francisca Hernandez

 

Jlis.it, ISSN 2038-1026, Vol. 11, n. 1, 2020, p. 1-16

La evolución de Hispana y Europeana es una buena prueba de la importancia de la aplicación de los estándares de agregación de metadatos como OAI-PMH y de la visibilidad y accesibilidad que comporta la tecnología Linked Open Data. Este artículo se basa en dos casos de estudio muy claros como son Hispana, para España, y Europeana, para Europa, donde se han aplicado estas tecnologías.

En 2003 la Subdirección General de Coordinación Bibliotecaria (SGCB) tomó la decisión de emprender un proyecto de digitalización en toda España de forma cooperativa. Se optó por el protocolo OAI-PMH para crear una base de datos actualizada periódicamente con los datos más recientes de las obras digitalizadas. El resultado fue la apertura en 2006 del sitio web “Directorio y recolector de recursos digitales”, que recogía 55 proyectos de digitalización, de los que 25 disponían de repositorio OAI-PMH, y 116.014 registros de obras digitalizadas. En la actualidad dispone de 226 repositorios y 8,3 millones de registros. La plataforma del Directorio estaba formada por diferentes aplicaciones: un directorio de proyectos e iniciativas de digitalización existentes en España, un recolector OAI-PMH de recursos digitales, un punto de consulta conjunta a todos los metadatos recolectados con acceso al propio documento digitalizado y un servidor SRU. Al mismo tiempo la SGCB tomó la decisión de crear sendas bibliotecas virtuales, una dedicada a la prensa histórica y publicaciones periódicas en general, y otra dedicada al resto de materiales bibliográficos, principalmente monografías y manuscritos. Estas bibliotecas virtuales, denominadas Biblioteca Virtual de Prensa Histórica y Biblioteca Virtual de Patrimonio Bibliográfico, contaron desde el inicio con sus respectivos repositorios OAI-PMH. En 2009 el Directorio cambió su nombre definitivamente a Hispana, designando así a la plataforma para el acceso al contenido digital de cualquier tipo, patrimonial o nacido digitalmente, y producido por instituciones españolas. Hispana ha participado desde su inicio en Europeana figurando entre los primeros proveedores de datos por el volumen de la información y siendo el primer agregador nacional a Europeana. El creciente número de repositorios hizo que aumentara el número de esquemas de metadatos que se podían recolectar siendo algunos de estos esquemas fundamentales para algunos proyectos como, por ejemplo, DRIVER cuyo heredero actual es OpenAire. También Europeana influyó en este sentido puesto que su Europeana Semantic Elements supuso ampliar el esquema de metadatos utilizado por cualquier repositorio OAI-PMH, Dublin Core, ya desde 2009. Europeana se orientó desde sus inicios para utilizar Linked Open Data y las tecnologías de la Web Semántica con el objetivo de generar no sólo datos sino también conocimiento. En 2011 se publicó la primera versión de la ontología Europeana Data Model. Sobre EDM Europeana ha introducido algunas novedades cruciales en la consulta de la gran biblioteca digital, siendo la primera de ellas la búsqueda multilingüe. Y se ha ocupado también, con el mismo objetivo de mejorar la consulta, de enriquecer semánticamente los datos proporcionados por los miles de proveedores europeos, cruzándolos con distintos conjuntos de datos y vocabularios, especialmente aquellos multilingües, como VIAF, GeoNames, o Wikidata. Es importante mencionar que el esfuerzo desarrollado por Hispana y por Europeana en estos últimos años ha sido notabilísimo, pero justamente por el papel que juegan en la actualidad para facilitar el acceso al patrimonio cultural español y europeo se hace necesario también remarcar aquellos aspectos sobre los que es necesario trabajar, como el relativamente bajo nivel de uso de ambas plataformas o la necesidad de mejorar las funcionalidades de las interfaces de búsqueda, pero también la calidad media de los datos y la selección del contenido.

Resumen elaborado por Antonio Rodríguez Vela

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.