Linked Data per i Beni Culturali: un approccio tecnico
Angelica Lo Duca
DigItalia, ISSN 1972-621X, Vol. 1, 2018, p. 157-165
Estamos rodeados de datos. Datos de diferente naturaleza, forma y contenido. Esencialmente hay dos tipos de datos: los datos abiertos y los datos en propiedad. Los datos abiertos son los publicados de acuerdo con una licencia abierta, que generalmente autoriza su reutilización y distribución. Los datos de propiedad, por otro lado, son propios de una compañía y normalmente tienen una licencia que prohíbe su uso, o permite el uso de una pequeña parte, con algunas restricciones.
El modelado de datos consiste en la representación de datos según un paradigma. En el ámbito de los Linked Data, los datos están representados en RDF (acrónimo de Resource Description Framework). El modelo RDF está basado en tres partes (sujeto, predicado, objeto). El lenguaje SPARQL7 se utiliza para interrogar una base de datos triple, como SQL se utiliza para consultar una base de datos relacional. Esta SPARQL nace para interrogar a un triplestore, es decir, una base de datos modelada según el modelo RDF. En este artículo encontramos además la manera de crear un simple nodo Linked Data. El primer paso hacia la construcción de un nodo consiste en la instalación de una plataforma que será utilizada para alojar los datos. Las plataformas existentes están divididas en dos categorías: las que se basan en un triplestore nativo (como Virtuoso11 y Apache Jena12) y aquellas que, inclinadas hacia una base de datos relacional (como por ejemplo D2RQ13), expone solo el resultado final en RDF. Supongamos que tenemos un conjunto de datos disponible relativo a una correspondencia de cartas y que desea exponer este conjunto de datos como nodo de datos vinculados. El conjunto de datos estará formado por las siguientes tablas con una serie de campos: Letter, Person y Persona. Se puede hacer navegación de datos con consultas SPARQL, o se puede usar otras herramientas como LodLive17, que es aplicación web para navegar por los campos de datos. En los diferentes esquemas que contiene el artículo se muestran todos estos contenidos de una manera gráfica y visual. Por ejemplo, la última figura muestra la representación del conjunto de datos a través de LodLive. Hay que observar que se han agregado otras propiedades, como el dueño del conjunto de datos (identificado a través de la propiedad edm: publisher), el sujeto (dcterms: subject) que coincide al tema de las letras, y al concepto conectado (edm: isRelatedTo).
Resumen realizado por José María Amate Sánchez