Detección de menciones anidadas basada en expansión para el español

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/18541
Información del item - Informació de l'item - Item information
Title: Detección de menciones anidadas basada en expansión para el español
Other Titles: Nested mention detection in Spanish based on expansion
Authors: Puchol Blasco, Marcel | Martínez-Barco, Patricio
Research Group/s: Procesamiento del Lenguaje y Sistemas de Información (GPLSI)
Center, Department or Service: Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos
Keywords: Detección | Menciones | Resolución de correferencia | Detection | Mentions | Coreference resolution
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Sep-2011
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: PUCHOL BLASCO, Marcel; MARTÍNEZ BARCO, Patricio. “Detección de menciones anidadas basada en expansión para el español”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 215-221
Abstract: La detección de menciones es el primer módulo utilizado en los sistemas de resolución de la correferencia. Debido a que los errores se van acarreando de un módulo a otro, es importante que los resultados obtenidos por este módulo sean los mejores posibles. Dentro del campo de la detección de menciones, las menciones anidadas son las más difíciles de detectar. En este artículo presentamos un sistema de detección de menciones anidadas basado en expansión, un nuevo modelo de detección de elementos de Procesamiento de Lenguaje Natural anidados basado en aprendizaje automático. Los resultados obtenidos por nuestro sistema son superiores al 72 % de medida-F en el corpus AnCora. No podemos comparar directamente nuestros resultados con otros sistemas debido a que no existen como tales, pero si comparamos la medida-F media obtenida por otros sistemas en la detección de todo tipo de menciones (no solo menciones anidadas), y que nosotros estamos tratando con las menciones más difíciles, conseguimos resultados favorables. | Mention detection is the first module used in coreference resolution systems. Due to that, it is important that the results obtained by this module are as high as possible. Within the field of mention detection, nested mentions are the most difficult ones to detect. In this paper, we present a nested mention detection system based on expansion, a new model for detecting nested elements in NLP based on machine learning. The results obtained by our system are above the 72 % in F-measure in AnCora corpus. We can not compare directly our results with other systems, since there are not exist, but if we consider that the average F-measure obtained by other systems for all mention (not only nested mentions), and that we are dealing with the most difficult mentions, we achieve good results.
Sponsor: Este artículo está parcialmente financiado por el Ministerio de Ciencia e Innovación - Gobierno de España (beca no. TIN2009-13391-C04-01), y Conselleria d’Educació - Generalitat Valenciana (beca no. PROMETEO/2009/119).
URI: http://hdl.handle.net/10045/18541
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Peer Review: si
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 47 (2011)
INV - GPLSI - Artículos de Revistas

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_47_23.pdf409,15 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.