Alias assignment in information extraction

Sapena Masip, Emili; Padró Cirera, Lluís; Turmo Borrás, Jordi

Alias assignment in information extraction

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/2959

Información del item - Informació de l'item - Item information
Título:	Alias assignment in information extraction
Autor/es:	Sapena Masip, Emili \| Padró Cirera, Lluís \| Turmo Borrás, Jordi
Palabras clave:	Asignación de alias \| Extracción de información \| Entity matching \| Alias assignment \| Information extraction \| Entity matching
Fecha de publicación:	sep-2007
Editor:	Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica:	SAPENA MASIP, Emili; PADRÓ CIRERA, Lluís; TURMO BORRÁS, Jordi. "Alias assignment in information extraction". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948; pp. 105-112
Resumen:	Este artículo presenta un método general para la tarea de asignación de alias en extracción de información. Se comparan dos aproximaciones para encarar el problema y aprender un clasificador. La primera cuantifica una similaridad global entre el alias y todas las posibles entidades asignando pesos a las características sobre cada pareja alias-entidad. La segunda es el clásico clasificador donde cada instancia es una pareja alias-entidad y sus atributos son las características de esta. Ambas aproximaciones usan las mismas funciones de características sobre la pareja alias-entidad donde cada nivel de abstracción, desde los carácteres hasta el nivel semántico, se tratan de forma homogénea. Además, se proponen unas funciones extendidas de características que desglosan la información y permiten al algoritmo de aprendizaje automático determinar la contribución final de cada valor. El uso de funciones extendidas mejora los resultados de las funciones simples. \| This paper presents a general method for alias assignment task in information extraction. We compared two approaches to face the problem and learn a classifier. The first one quantifies a global similarity between the alias and all the possible entities weighting some features about each pair alias-entity. The second is a classical classifier where each instance is a pair alias-entity and its attributes are their features. Both approaches use the same feature functions about the pair alias-entity where every level of abstraction, from raw characters up to semantic level, is treated in an homogeneous way. In addition, we propose an extended feature functions that break down the information and let the machine learning algorithm to determine the final contribution of each value. The use of extended features improve the results of the simple ones.
URI:	http://hdl.handle.net/10045/2959
ISSN:	1135-5948
Idioma:	eng
Tipo:	info:eu-repo/semantics/article
Aparece en las colecciones:	Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)

Archivos en este ítem:

Archivos en este ítem:
Archivo	Descripción	Tamaño	Formato
PLN_39_13.pdf		165,24 kB	Adobe PDF	Abrir Vista previa Cerrar vista previa

Ver citas en Google Académico

Muestra el registro completo