Hypernymy relations from definiens-definiendum co-occurrence in multiple dictionary definitions

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/23923
Información del item - Informació de l'item - Item information
Título: Hypernymy relations from definiens-definiendum co-occurrence in multiple dictionary definitions
Título alternativo: Relaciones de hiperonimia a partir de la coocurrencia definiens-definiendum en múltiples definiciones de diccionario
Autor/es: Renau Araque, Irene | Nazar, Rogelio
Palabras clave: Estadística de coocurrencia | Extracción de taxonomías | Lexicografía computacional | Relaciones hiperonómicas | Co-occurrence statistics | Computational lexicography | Hypernymy relations | Taxonomy extraction
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2012
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: RENAU, Irene; NAZAR, Rogelio. “Hypernymy relations from definiens-definiendum co-occurrence in multiple dictionary definitions”. Procesamiento del Lenguaje Natural. N. 49 (2012). ISSN 1135-5948, pp. 83-90
Resumen: Presentamos una metodología basada en estadísticas de coocurrencia entre definiens y definiendum con el fin de extraer relaciones hiperonómicas de un corpus lexicográfico, como parte de un proyecto más extenso dedicado a la creación de una ontología general de nombres aplicada al estudio de las relaciones predicado-argumento. La idea de la presente propuesta es hacer emerger las relaciones de hiperonimia mediante la combinación de distintas fuentes lexicográficas. Encontramos que los hiperónimos de una palabra son los que aparecen con más frecuencia en las definiciones de esa palabra en diccionarios y que, del mismo modo, sus hipónimos suelen ser los que contienen frecuentes menciones a esta palabra en sus definiciones. Esto crea una asociación estadística entre palabras y permite estructurar un vocabulario en forma de taxonomía. Resultados preliminares muestran una precisión de 71,57% en hiperónimos y de 67,97% en hipónimos. | We present a methodology based on co-occurrence statistics between headwords and words in their definitions in order to derive hypernymy relations from a lexicographic corpus, as part of a more extensive project devoted to the creation of a general purpose Spanish ontology of nouns and its application to the study of predicate-argument structures. The idea of the present proposal is to extract these semantic relations using a statistical technique that allows to combine diverse lexicographic resources. We find that hypernyms of a word are frequently used in its definitions and, similarly, its hyponyms usually are those which have frequent mentions to this word in their definitions. This creates a statistical association between words that allows for a taxonomic structuring of a vocabulary. Preliminary results show precision figures of 71,57% in hypernyms and of 67,97% in hyponyms.
Patrocinador/es: This research was funded by project: “Agrupación semántica y relaciones lexicológicas en el diccionario”, lead by J. DeCesaris (HUM2009-07588/FILO); APLE: “Procesos de actualización del léxico del español a partir de la prensa”, 2010-2012, lead by M. T. Cabré (FFI2009-12188-C05-01/FILO).
URI: http://hdl.handle.net/10045/23923
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 49 (2012)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_49_09.pdf475,33 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.