Global joint models for coreference resolution and named entity classification
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/10549
Título: | Global joint models for coreference resolution and named entity classification |
---|---|
Título alternativo: | Modelos juntos globales para la resolución de la correferencia y de la clasificación de las entidades nombradas |
Autor/es: | Denis, Pascal | Baldridge, Jason |
Palabras clave: | Resolución de la correferencia | Entidades nombradas | Aprendizaje automático | Programación lineal entera | Coreference resolution | Named entities | Machine learning | Integer linear programming |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | mar-2009 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | DENIS, Pascal; BALDRIDGE, Jason. “Global joint models for coreference resolution and named entity classification”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 87-96 |
Resumen: | En este artículo, combinamos modelos de correferencia, anaforicidad y clasificación de las entidades nombradas, como un problema de inferencia junta global utilizando la Programación Lineal Entera (ILP). Nuestras restricciones garantizan: (i) la coherencia entre las decisiones finales de los tres modelos locales, y (ii) la transitividad de las decisiones de correferencia. Este enfoque proporciona mejoras significativas en el f-score sobre los corpora ACE con las tres métricas de evaluación principales para la correferencia: MUC, B3, y CEAF. A través de ejemplos, modelos de oráculo y nuestros resultados, se muestra también que es fundamental utilizar estas tres métricas y, en particular, que no se puede confiar únicamente en la métrica MUC. | In this paper, we combine models for coreference, anaphoricity and named entity classification as a joint, global inference problem using Integer Linear Programming (ILP). Our constraints ensure: (i) coherence between the final decisions of the three local models, and (ii) transitivity of multiple coreference decisions. This approach provides significant f-score improvements on the ACE datasets for all three main coreference metrics: MUC, B3, and CEAF. Through examples, oracle models, and our results, we also show that it is fundamental to use all three of these metrics, and in particular, to never rely solely on the MUC metric. |
Patrocinador/es: | This work was supported by NSF grant IIS-0535154. |
URI: | http://hdl.handle.net/10045/10549 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 42 (marzo 2009) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_42_11.pdf | 423,48 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.