Verb SCF extraction for Spanish with dependency parsing

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/30604
Información del item - Informació de l'item - Item information
Título: Verb SCF extraction for Spanish with dependency parsing
Título alternativo: Extracción de patrones de subcategorización de verbos en castellano con análisis de dependencias
Autor/es: Padró Cirera, Montserrat | Bel Rafecas, Núria | Garí, Aina
Palabras clave: Adquisición automática de patrones de subcategorización | Análisis de dependencias | Adquisición léxica | Automatic subcategorization frame acquisition | Dependency parsing | Lexical acquisition
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2013
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: PADRÓ, Muntsa; BEL, Núria; GARÍ, Aina. “Verb SCF extraction for Spanish with dependency parsing”. Procesamiento del Lenguaje Natural. N. 51 (2013). ISSN 1135-5948, pp. 93-100
Resumen: En este artículo presentamos los resultados de nuestros experimentos en producción automática de léxicos con información de patrones de subcategorización verbal para castellano. La investigación se llevó a cabo en el marco del proyecto PANACEA de adquisición automática de información léxica que redujera al máximo la intervención humana. En nuestros experimentos, se utilizó una cadena de diferentes herramientas que incluía ‘crawling’ de textos de un dominio particular, normalización y limpieza de los textos, segmentación, identificación de unidades, etiquetado categorial y análisis de dependencias antes de, finalmente, la extracción de los patrones de subcategorización. Los resultados obtenidos muestran una gran dependencia de la calidad de los analizadores de dependencias aunque, no obstante, están en línea con los resultados obtenidos en experimentos similares para otras lenguas. | In this paper we present the results of our experiments in automatic production of verb subcategorization frame lexica for Spanish. The work was carried out in the framework of the PANACEA project aiming at the automatic acquisition of lexical information reducing at maximum human intervention. In our experiments, a chain of different tools was used: domain focused web crawling, automatic cleaning, segmentation and tokenization, PoS tagging, dependency parsing and finally SCFs extraction. The obtained results show a high dependency on the quality of the results of the intervening components, in particular of the dependency parsing, which is the focus of this paper. Nevertheless, the results achieved are in line with the state-of-the-art for other languages in similar experiments.
Patrocinador/es: This work was funded by the European Project PANACEA (FP7-ICT-2010- 248064).
URI: http://hdl.handle.net/10045/30604
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 51 (2013)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_51_10.pdf578,4 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.