Reflexive pronouns in Spanish universal dependencies

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/104716
Información del item - Informació de l'item - Item information
Títol: Reflexive pronouns in Spanish universal dependencies
Títol alternatiu: Los pronombres reflexivos en las Dependencias Universales en español
Autors: Degraeuwe, Jasper | Goethals, Patrick
Paraules clau: Reflexive pronouns | Se | Universal Dependencies | AnCora | Spanish | Pronombres reflexivos | Dependencias Universales | Español
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de març-2020
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2020, 64: 77-84. doi:10.26342/2020-64-9
Resum: In this paper, we argue that in current Universal Dependencies treebanks, the annotation of Spanish reflexives is an unsolved problem, which clearly affects the accuracy and consistency of current parsers. We evaluate different proposals for fine-tuning the various categories, and discuss remaining open issues. We believe that the solution for these issues could lie in a multi-layered way of annotating the characteristics, combining annotation of the dependency relation and of the so-called token features, rather than in expanding the number of categories on one layer. We apply this proposal to the v2.5 Spanish UD AnCora treebank and provide a categorized conversion table that can be run with a Python script. | En este trabajo, argumentamos que en los actuales treebanks que aplican el formalismo de las Dependencias Universales, la anotación de los reflexivos españoles es un problema sin resolver, que afecta claramente a la precisión y consistencia de los parsers actuales. Evaluamos diferentes propuestas para afinar las diferentes categorías y discutimos los problemas pendientes. Creemos que la solución para estos problemas se puede encontrar en una anotación en múltiples niveles, combinando la anotación de la relación de dependencia y de las características (features) de los tokens, en lugar de ampliar el número de categorías en un solo nivel de anotación. Aplicamos la propuesta a la versión española del treebank UD AnCora (v2.5) y proporcionamos una tabla de conversión categorizada que se puede ejecutar mediante un script Python.
URI: http://hdl.handle.net/10045/104716
ISSN: 1135-5948
DOI: 10.26342/2020-64-9
Idioma: eng
Tipus: info:eu-repo/semantics/article
Drets: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica: si
Versió de l'editor: https://doi.org/10.26342/2020-64-9
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 64 (2020)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_64_09.pdf1,08 MBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.