Procedimiento de preparación de registros de metadatos bibliográficos en la desambiguación de nombres de autor
Procedure for preparing bibliographic metadatarecords in author name disambiguation
Daniel Dans Abelenda, Lisandra Díaz de la Paz, José Antonio Senso Ruiz, Amed Abel Leiva Mederos y Edenys Denis González
Journal of library metadata, ISSN 1938-6389, vol. 0, n. 0, pp. 1-21
La calidad de los metadatos de los registros bibliográficos puede verse comprometida por problemas de inconclusión e inexactitud. Uno de los desafíos más importantes es la representación inexacta de los nombres de los autores. En el caso concreto de los metadatos en formato MARC21, la herramienta MARCQuality -desarrollada por investigadores de la Universidad Central “Marta Abreu” de Las Villas- aborda parcialmente estos problemas unificando las variaciones de un mismo nombre de autor y resolviendo, hasta cierto punto, la sinonimia. Sin embargo, sigue habiendo limitaciones en lo que respecta a la homonimia, cuando varios autores tienen el mismo nombre. El objetivo de este estudio es implementar una solución que optimice la preparación de los campos del registro MARC21 para su futuro uso en modelos de redes neuronales diseñados para la desambiguación de nombres de autor. Dado que estos modelos aún no están disponibles, el enfoque propuesto se centra en darles una estructura y adaptar los campos para mejorar la precisión de la predicción. La solución se basa en técnicas de desambiguación que utilizan LAGOS AND (Large, Gold Standard Dataset for Scholarly Author Name Disambiguation), según lo establecido en HFAND (Hybrid Framework for Author Name Disambiguation). Dadas las diferencias entre los registros catalogados MARC21 y las publicaciones LAGOS AND, es necesario realizar un análisis para establecer correspondencias entre sus campos. Este análisis también incorpora el formato Dublin Core, utilizado por el repositorio DSpace de la UCLV, para explorar su posible integración en la herramienta MARCQuality. Como resultado, se desarrolla un procedimiento estructurado para organizar los campos de los registros para su preprocesamiento y cálculo de métricas de similitud, facilitando su aplicación en modelos de redes neuronales para la desambiguación de nombres de autor.
Traducción del resumen de la propia publicación
DOI: https://doi.org/10.1080/19386389.2025.2523715