Semi-Supervised Target-Dependent Sentiment Classification for Micro-Blogs
Shadi I. Abudalfa, Moataz A. Ahmed
Journal of Computer Science and Technology, ISSN-e 1666-6038, Vol. 19, n. 1, 2019
La riqueza de las opiniones disponibles en las redes sociales ha motivado que los investigadores desarrollen herramientas de detección automática de opiniones. Muchas de estas herramientas están actualmente disponibles en línea para la minería de opiniones en textos cortos, conocidos como microblosgs, pero su eficacia es todavía limitada. Las actuales herramientas se centran en detectar polaridad de sentimientos expresados en microblogs sin tener en cuenta el tema (objetivo) del que se habla.
Se han propuesto algunas estrategias con tímidas mejoras para detectar sentimientos hacia objetivos específicos, a las que se llama clasificación de sentimientos relacionados con objetivos. Nuestro repaso bibliográfico muestra que estas estrategias relacionadas con los objetivos usan técnicas de aprendizaje supervisado. Estas técnicas necesitan una gran cantidad de datos etiquetados para aumentar la veracidad de la clasificación. Sin embargo, preparar datos etiquetados de las redes sociales necesita muchos esfuerzos. En este trabajo nos enfrentamos a este problema empleando técnicas de aprendizaje semisupervisadas que no se han usado antes en clasificaciones de sentimientos relacionados con objetivos. Según nuestro conocimiento, nuestro trabajo es la primera investigación que emplea el aprendizaje semisupervisado en este sentido. Las técnicas de aprendizaje semisupervisado son conocidas en la bibliografía para mejorar la veracidad en comparación con las técnicas supervisadas; sin embargo, usan el mismo número de ejemplos etiquetados además de muchos otros sin etiquetar. En este trabajo, proponemos una nueva técnica de aprendizaje semisupervisada que usa un menor número de microblogs etiquetados que los usados con técnicas de aprendizaje supervisadas. Los resultados del experimento muestran que la técnica propuesta proporciona una veracidad competitiva.
Traducción del resumen de la propia publicación