Desambiguación del sentido y del dominio de las palabras con modelos de probabilidad de máxima entropía

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/1714
Información del item - Informació de l'item - Item information
Títol: Desambiguación del sentido y del dominio de las palabras con modelos de probabilidad de máxima entropía
Autors: Suárez Cueto, Armando | Palomar, Manuel
Paraules clau: Desambiguación del sentido de las palabras | Desambiguación de los dominios de las palabras | Basado en corpus | Aprendizaje supervisado | Máxima entropía | Word sense disambiguation | Word domain disambiguation | Corpus-based | Supervised learning | Maximum entropy
Data de publicació: de maig-2002
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: SUÁREZ CUETO, Armando; PALOMAR SANZ, Manuel. “Desambiguación del sentido y del dominio de las palabras con modelos de probabilidad de máxima entropía". Procesamiento del lenguaje natural. Nº 28 (mayo 2002), pp. 45-53
Resum: En este artículo se presenta un sistema de aprendizaje supervisado para la desambiguación del sentido de las palabras. Dicho sistema se basa en los modelos de probabilidad condicional de máxima entropía. El conocimiento lingüístico se adquiere a partir de un corpus anotado y se representa en forma de atributos (features). Se han estudiado varios tipos de atributos para un conjunto limitado de palabras del corpus DSO. También se ha estudiado la sustitución de los sentidos de WordNet por etiquetas de dominio. En la actualidad, la implementación del sistema no soporta ninguna técnica de suavizado o preproceso complejo, pero sus resultados son buenos si son comparados, por ejemplo, con los de los sistemas presentados en el SENSEVAL-2 | In this paper, a supervised learning system of word sense disambiguation is presented. It is based on maximum entropy conditional probability models. This system acquires the linguistic knowledge from an annotated corpus and this knowledge is represented in the form of features. Several types of features has been analyzed for a few words selected from the DSO corpus. Moreover, substituting WordNet senses by domain labels have been studied too. Currently, the system implementation does not support any smoothing technique or complex pre-processing but its accuracy is good when it is compared with, for example, the systems at SENSEVAL-2
Patrocinadors: Este artículo ha sido financiado parcialmente por el Gobierno Español (CICYT) dentro del proyecto número TIC2000-0664-C02-02.
URI: http://hdl.handle.net/10045/1714
ISSN: 1135-5948
Idioma: spa
Tipus: info:eu-repo/semantics/article
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 28 (mayo 2002)
INV - GPLSI - Artículos de Revistas

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_28_04.pdf270,74 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.