Resolución de correferencia de nombres de persona para extracción de información biográfica
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/18512
Título: | Resolución de correferencia de nombres de persona para extracción de información biográfica |
---|---|
Título alternativo: | Personal name coreference resolution for biographical information extraction |
Autor/es: | García González, Marcos | Gamallo Otero, Pablo |
Palabras clave: | Correferencia de nombres de persona | Extracción de información | Personal name coreference | Information extraction |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2011 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | GARCÍA, Marcos; GAMALLO, Pablo. “Resolución de correferencia de nombres de persona para extracción de información biográfica”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 47-55 |
Resumen: | Los sistemas de extracción de información necesitan un procesamiento previo que reconozca, entre otras cosas, elementos correferenciales tales como las variantes de nombres propios. El presente artículo tiene dos objetivos: por un lado, describe los principales tipos de correferencia de nombres de persona encontrados en textos enciclopédicos y periodísticos en castellano. Por otro lado, presenta un algoritmo que resuelve satisfactoriamente la mayor parte de los casos descritos. El sistema, que no necesita corpus de entrenamiento, permite unificar las variantes de nombres de persona que aparecen en un texto, mejorando así tareas como la extracción de información biográfica. | Information extraction systems need a previous processing step in order to recognize coreferential elements, such as personal name variants. This paper has two aims: the first is to describe the main types of personal name coreference found in encyclopedic and journalistic texts in Spanish. Furthermore, we introduce an algorithm that solves most coreferential links between personal name variants succesfully. The system, which does not need a training corpus, unifies the coreferential elements found in a text, thereby improving tasks like biographical information extraction. |
Patrocinador/es: | Este trabajo ha sido subvencionado por el Ministerio de Ciencia e Innovación, con cargo al proyecto con referencia FFI2010-14986. |
URI: | http://hdl.handle.net/10045/18512 |
ISSN: | 1135-5948 |
Idioma: | spa |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 47 (2011) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_47_05.pdf | 415,87 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.