Inserción de metadatos de las bibliotecas españolas en Wikidata: un modelo de datos abiertos enlazados
Ángel Obregón Sierra
Revista española de documentación científica, ISSN 0210-0614, Vol. 45, n. 3, 2022
El término datos abiertos enlazados se ha hecho muy habitual en el ámbito de la biblioteconomía en los últimos años. Esto es debido al uso que se puede hacer de los metadatos con los que cuentan las bibliotecas. Normalmente se habla de liberar esta información que poseen, pero no sobre dónde se encuentran físicamente estas instituciones u otros datos de la propia institución, para que también puedan utilizarse por cualquier usuario. Esta información podría ser útil para realizar búsquedas de las bibliotecas más cercanas, acceder a los medios de comunicación con los que cuentan o consultar los identificadores que tienen en otras bases de datos. El objetivo de este artículo es el de mostrar el procedimiento utilizado para inserción de todas las bibliotecas de España en una base de datos libre, con la intención de que sean accesibles por todo el mundo. Utilizando diversas herramientas libres se limpiaron los datos y se insertaron 7861 bibliotecas nuevas en Wikidata, para después corregir duplicaciones existentes e insertar nuevos campos. Por último, se presentan diferentes posibilidades de reutilización de los datos en Wikipedia, demostrando que esos datos pueden ser útiles para los usuarios que quieran utilizarlos en el futuro. En primer lugar, se utilizó el servicio de consultas Sparql de la Fundación Wikimedia para constatar el número de bibliotecas que ya habían sido introducidas por otros usuarios en Wikidata. A continuación, se consultaron todas las páginas web de las bibliotecas de las comunidades autónomas y los gobiernos comunitarios para con-seguir un listado abierto con información actualiza-da de las bibliotecas. Se obtuvo un fichero .xlsx con los datos estructurados de todas las bibliotecas españolas con su código, nombre, país, comunidad autónoma, provincia, municipio, dirección, código postal, tipología, teléfono, correo electrónico, página web, año de fundación, coordenadas, catálogo, titularidad y gestión. Una vez descargado el archivo de datos se procedió a la limpieza de este con LibreOffice Calc, ya que mucha información no es correcta para introducirse tal cual en Wikidata, y después se importó el fichero en OpenRefine, que permite crear un esquema de los datos que serán introducidos utilizando un formato muy similar a Wikidata. Esto sirvió para mejorar Wikipedia, recogiendo automáticamente el contenido con fichas o haciendo uso de plantillas específicas como “Wikidata list”. Este proceso puede ser replicado con otro tipo de datos, siempre que se disponga de un fichero estructurado.
https://redc.revistas.csic.es/index.php/redc/article/view/1363