Quality of linked bibliographic data: the models, vocabularies, and links of data sets published by four national libraries

Quality of linked bibliographic data: the models, vocabularies, and links of data sets published by four national libraries
13 de Marzo de 2018

Kim Talleras

 

Journal of library metadata, ISSN-e 1937-5034, Vol. 17, n. 2, 2017, p. 126-155

Este artículo examina los metadatos bibliográficos publicados por cuatro bibliotecas nacionales europeas, la Bibliothèque nationale de France (BNF), la British Library (BNB), la Biblioteca Nacional de España (BNE) y la Deutsche Nationalbibliothek (DNB). El estudio pretende contestar a dos preguntas: ¿cómo organizan y representan en la comunidad bibliotecaria las colecciones bibliográficas de metadatos, cuando publican estas colecciones como datos enlazados en la web?, y ¿cómo se ajustan estos conjuntos de datos enlazados a las mediciones establecidas de calidad de los datos enlazados para el uso del vocabulario y la interconexión?

Para responder a estas cuestiones, se analizan estadísticamente las dimensiones concretas de la calidad de los datos enlazados, considerando principalmente el uso de la interconexión y el vocabulario. En la primera parte del artículo se da información sobre antecedentes de los datos bibliográficos enlazados, y sobre dimensiones de la calidad, a la vez que se aclara el alcance del estudio. Seguidamente, se resume la investigación previa y se presentan los datos del corpus seleccionado en cada biblioteca, y las consideraciones metodológicas de la investigación. Por último, se presentan los resultados del estudio, que muestran que todos los conjuntos estudiados se ajustan a los requisitos de los datos enlazados porque están disponibles en la web, ofrecen datos RDF estructurados (a pesar del uso de nodos en blanco por la BNE y  la DNB), y proporcionan un número sustancial de enlaces a fuentes externas. También reutilizan vocabularios sin referencias y ampliamente adoptados. Además, tienen un buen rendimiento en comparación con los resultados de estudios previos sobre el cumplimiento de los datos enlazados.  Este estudio aborda los conjuntos de datos examinados desde la perspectiva de los posibles consumidores de datos, y algunos de los problemas revelados se pueden deber a la dificultad de transformar los datos heredados que están basados en modelos orientados a la manifestación en nuevos modelos basados en conceptualizaciones novedosas. En cuanto a la calidad de los datos, es generalmente impecable para todos los conjuntos de corpus. Al mismo tiempo, el estudio revela problemas de calidad ya que los conjuntos de datos son deficientes y potencialmente bastante desordenados. Las bibliotecas del estudio organizan sus datos de forma diferente, aplican diferentes vocabularios para la representación de los datos, en gran medida enlazan con diferentes fuentes externas y eligen diferentes modelos bibliográficos para sus estructuras. Estas soluciones que pueden servir para sus fines particulares, pueden obstaculizar la interoperabilidad entre conjuntos e instituciones, y la interoperabilidad es importante para la utilización global de datos no solo internamente dentro del campo de las bibliotecas, sino también de forma externa.

Resumen elaborado por Natividad Escavias Extremera

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.