Building corpora for the development of a dependency parser for Spanish using Maltparser
Empreu sempre aquest identificador per citar o enllaçar aquest ítem
http://hdl.handle.net/10045/2999
Títol: | Building corpora for the development of a dependency parser for Spanish using Maltparser |
---|---|
Autors: | Herrera de la Cruz, Jesús | Gervás Gómez-Navarro, Pablo | Moriano Mohedano, Pedro Jesús | Muñoz Moreno, Alfonso | Romero Tejera, Luis |
Paraules clau: | Análisis de dependencias | Corpus de entrenamiento | Etiqueta de funcionalidad sintáctica | Maltparser | JBeaver | Dependency parsing | Training corpus | Syntactic function label |
Data de publicació: | de setembre-2007 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Citació bibliogràfica: | HERRERA DE LA CRUZ, Jesús, et al. "Building corpora for the development of a dependency parser for Spanish using Maltparser". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 181-186 |
Resum: | En el presente artículo se detalla el proceso de creación de corpora para el entrenamiento y pruebas de un generador de analizadores de dependencias (Maltparser). Se parte del corpus Cast3LB, que contiene análisis de constituyentes de textos en español. Estos análisis de constituyentes se transforman automáticamente en análisis de dependencias. Además se describe cómo se obtiene, experimentalmente y de manera semiautomática, un conjunto de etiquetas de funcionalidad sintáctica para etiquetar adecuadamente el corpus de entrenamiento. El proceso seguido ha permitido obtener un analizador de dependencias para el español con una precisión del 91% en la determinación de dependencias. | The present paper details the process followed for creating training and test corpora for a dependency parser generator (Maltparser). The starting point is the Cast3LB corpus, which contains constituency analyses of Spanish texts. These constituency analyses are automatically transformed into dependency analyses. In addition, the empirically and semiautomatically obtention of a set of syntactic function labels for the training corpus is described. As a result of the process followed, it has been obtained a dependency parser for Spanish showing a 91% precision when determining dependencies. |
Patrocinadors: | Partially supported by the Spanish Ministry of Education and Science (TIN2006-14433-C02-01 project). |
URI: | http://hdl.handle.net/10045/2999 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipus: | info:eu-repo/semantics/article |
Apareix a la col·lecció: | Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007) |
Arxius per aquest ítem:
Arxiu | Descripció | Tamany | Format | |
---|---|---|---|---|
PLN_39_22.pdf | 114,72 kB | Adobe PDF | Obrir Vista prèvia | |
Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.