Inserción de metadatos de las bibliotecas españolas en Wikidata: un modelo de datos abiertos enlazados

Inserción de metadatos de las bibliotecas españolas en Wikidata: un modelo de datos abiertos enlazados
16 de Septiembre de 2022

Ángel Obregón Sierra

Revista española de documentación científica, ISSN 0210-0614, Vol. 45, n. 3, 2022

El término datos abiertos enlazados se ha hecho muy habitual en el ámbito de la biblioteconomía en los últimos años. Esto es debido al uso que se puede hacer de los metadatos con los que cuentan las bibliotecas. Normalmente se habla de liberar esta información que poseen, pero no sobre dónde se encuentran físicamente estas instituciones u otros datos de la propia institución, para que también puedan utilizarse por cualquier usuario. Esta información podría ser útil para realizar búsquedas de las bibliotecas más cercanas, acceder a los medios de comunicación con los que cuentan o consultar los identificadores que tienen en otras bases de datos. El objetivo de este artículo es el de mostrar el procedimiento utilizado para inserción de todas las bibliotecas de España en una base de datos libre, con la intención de que sean accesibles por todo el mundo. Utilizando diversas herramientas libres se limpiaron los datos y se insertaron 7861 bibliotecas nuevas en Wikidata, para después corregir duplicaciones existentes e insertar nuevos campos. Por último, se presentan diferentes posibilidades de reutilización de los datos en Wikipedia, demostrando que esos datos pueden ser útiles para los usuarios que quieran utilizarlos en el futuro. En primer lugar, se utilizó el servicio de consultas Sparql de la Fundación Wikimedia para  constatar el número de bibliotecas que ya habían sido introducidas por otros usuarios en Wikidata. A continuación, se consultaron todas las páginas  web  de  las  bibliotecas  de  las  comunidades  autónomas y los gobiernos comunitarios para con-seguir un listado abierto con información actualiza-da  de  las  bibliotecas. Se obtuvo un fichero .xlsx con los datos estructurados de todas las bibliotecas españolas con su código,  nombre,  país,  comunidad  autónoma,  provincia,  municipio,  dirección,  código  postal,  tipología, teléfono, correo electrónico, página web, año de fundación, coordenadas, catálogo, titularidad y gestión. Una vez descargado el archivo de datos se procedió a la limpieza de este con LibreOffice Calc, ya que mucha información no es correcta para introducirse  tal  cual  en  Wikidata, y después se importó el fichero en OpenRefine, que permite crear un esquema de los datos que serán introducidos utilizando un formato muy similar a Wikidata. Esto sirvió para mejorar Wikipedia, recogiendo automáticamente el contenido con fichas o haciendo uso de plantillas específicas como “Wikidata list”. Este  proceso puede  ser  replicado  con  otro tipo de datos, siempre que se disponga de un fichero estructurado.

https://redc.revistas.csic.es/index.php/redc/article/view/1363

Comentarios

Texto sin formato

  • No se permiten etiquetas HTML.
  • Saltos automáticos de líneas y de párrafos.
  • Las direcciones de correos electrónicos y páginas web se convierten en enlaces automáticamente.