Resolución de correferencia de nombres de persona para extracción de información biográfica

García González, Marcos; Gamallo Otero, Pablo

Resolución de correferencia de nombres de persona para extracción de información biográfica

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/18512

Información del item - Informació de l'item - Item information
Título:	Resolución de correferencia de nombres de persona para extracción de información biográfica
Título alternativo:	Personal name coreference resolution for biographical information extraction
Autor/es:	García González, Marcos \| Gamallo Otero, Pablo
Palabras clave:	Correferencia de nombres de persona \| Extracción de información \| Personal name coreference \| Information extraction
Área/s de conocimiento:	Lenguajes y Sistemas Informáticos
Fecha de publicación:	sep-2011
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	GARCÍA, Marcos; GAMALLO, Pablo. “Resolución de correferencia de nombres de persona para extracción de información biográfica”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 47-55
Resumen:	Los sistemas de extracción de información necesitan un procesamiento previo que reconozca, entre otras cosas, elementos correferenciales tales como las variantes de nombres propios. El presente artículo tiene dos objetivos: por un lado, describe los principales tipos de correferencia de nombres de persona encontrados en textos enciclopédicos y periodísticos en castellano. Por otro lado, presenta un algoritmo que resuelve satisfactoriamente la mayor parte de los casos descritos. El sistema, que no necesita corpus de entrenamiento, permite unificar las variantes de nombres de persona que aparecen en un texto, mejorando así tareas como la extracción de información biográfica. \| Information extraction systems need a previous processing step in order to recognize coreferential elements, such as personal name variants. This paper has two aims: the first is to describe the main types of personal name coreference found in encyclopedic and journalistic texts in Spanish. Furthermore, we introduce an algorithm that solves most coreferential links between personal name variants succesfully. The system, which does not need a training corpus, unifies the coreferential elements found in a text, thereby improving tasks like biographical information extraction.
Patrocinador/es:	Este trabajo ha sido subvencionado por el Ministerio de Ciencia e Innovación, con cargo al proyecto con referencia FFI2010-14986.
URI:	http://hdl.handle.net/10045/18512
ISSN:	1135-5948
Idioma:	spa
Tipo:	info:eu-repo/semantics/article
Revisión científica:	si
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 47 (2011)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_47_05.pdf		415,87 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo