Global joint models for coreference resolution and named entity classification

Denis, Pascal; Baldridge, Jason

Global joint models for coreference resolution and named entity classification

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/10549

Información del item - Informació de l'item - Item information
Título:	Global joint models for coreference resolution and named entity classification
Título alternativo:	Modelos juntos globales para la resolución de la correferencia y de la clasificación de las entidades nombradas
Autor/es:	Denis, Pascal \| Baldridge, Jason
Palabras clave:	Resolución de la correferencia \| Entidades nombradas \| Aprendizaje automático \| Programación lineal entera \| Coreference resolution \| Named entities \| Machine learning \| Integer linear programming
Área/s de conocimiento:	Lenguajes y Sistemas Informáticos
Fecha de publicación:	mar-2009
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	DENIS, Pascal; BALDRIDGE, Jason. “Global joint models for coreference resolution and named entity classification”. Procesamiento del lenguaje natural. N. 42 (marzo 2009). ISSN 1135-5948, pp. 87-96
Resumen:	En este artículo, combinamos modelos de correferencia, anaforicidad y clasificación de las entidades nombradas, como un problema de inferencia junta global utilizando la Programación Lineal Entera (ILP). Nuestras restricciones garantizan: (i) la coherencia entre las decisiones finales de los tres modelos locales, y (ii) la transitividad de las decisiones de correferencia. Este enfoque proporciona mejoras significativas en el f-score sobre los corpora ACE con las tres métricas de evaluación principales para la correferencia: MUC, B3, y CEAF. A través de ejemplos, modelos de oráculo y nuestros resultados, se muestra también que es fundamental utilizar estas tres métricas y, en particular, que no se puede confiar únicamente en la métrica MUC. \| In this paper, we combine models for coreference, anaphoricity and named entity classification as a joint, global inference problem using Integer Linear Programming (ILP). Our constraints ensure: (i) coherence between the final decisions of the three local models, and (ii) transitivity of multiple coreference decisions. This approach provides significant f-score improvements on the ACE datasets for all three main coreference metrics: MUC, B3, and CEAF. Through examples, oracle models, and our results, we also show that it is fundamental to use all three of these metrics, and in particular, to never rely solely on the MUC metric.
Patrocinador/es:	This work was supported by NSF grant IIS-0535154.
URI:	http://hdl.handle.net/10045/10549
ISSN:	1135-5948
Idioma:	eng
Tipo:	info:eu-repo/semantics/article
Revisión científica:	si
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 42 (marzo 2009)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_42_11.pdf		423,48 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo