A Methodology for the Automatic Annotation of Factuality in Spanish

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/122848
Información del item - Informació de l'item - Item information
Títol: A Methodology for the Automatic Annotation of Factuality in Spanish
Títol alternatiu: Una metodología para la anotación automática de la factualidad en español
Autors: Castellón Masalles, Irene | Fernández Montraveta, Ana | Alonso Alemany, Laura
Paraules clau: Factuality | Event annotation | Lexico-syntactic patterns | Rule-based systems | Factualidad | Anotación de eventos | Patrones léxico-sintácticos | Sistemas basados en reglas
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de març-2022
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2022, 68: 111-121. https://doi.org/10.26342/2022-68-8
Resum: In the last decade, factuality has undeniably been an area of growing interest in Natural Language Processing. This paper describes a rule-based tool to automatically identify the factual status of events in Spanish text, understood with respect to the degree of commitment with which a narrator presents situations. Factuality is represented compositionally, considering the following semantic categories: commitment, polarity, event structure, and time. In contrast with neural machine learning approaches, this tool is entirely based on manually created lexico-syntactic rules that systematize semantic and syntactic patterns of factuality. Thus, it is able to provide explanations for automatic decisions, which are very valuable to guarantee accountability of the system. We evaluate the performance of the system by comparison with a manually annotated Gold Standard, obtaining results that are comparable, if not better, to machine learning approaches for a related task, the FACT 2019 challenge at the IBERLEF evaluation forum. | La información factual es un área de investigación de creciente interés en el Procesamiento del Lenguaje Natural. Este artículo describe una herramienta basada en reglas para la identificación automática en español de la clase factual de los eventos en un texto, entendida con respecto al grado de compromiso con el que un narrador presenta las situaciones. En esta aproximación la información factual se representa compositivamente, considerando las siguientes categorías semánticas: compromiso, polaridad, estructura del evento y tiempo. A diferencia de los enfoques de Machine Learning, esta herramienta se basa por completo en reglas léxico-sintácticas y semánticas creadas manualmente que sistematizan los patrones semánticos y sintácticos de la información factual. Así, este sistema es capaz de proporcionar explicaciones para las decisiones automáticas, que son muy valiosas para garantía de la responsabilidad del sistema. Evaluamos el rendimiento del sistema mediante la comparación con un Gold Standard anotado manualmente, obteniendo resultados que son comparables, si no mejores, a los enfoques de aprendizaje automático para una tarea relacionada: el reto FACT 2019 del foro de evaluación IBERLEF.
URI: http://hdl.handle.net/10045/122848
ISSN: 1135-5948
DOI: 10.26342/2022-68-8
Idioma: eng
Tipus: info:eu-repo/semantics/article
Drets: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica: si
Versió de l'editor: https://doi.org/10.26342/2022-68-8
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 68 (2022)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_68_08.pdf956,06 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.