Exploiting rules for word sense disambiguation in machine translation

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/1312
Información del item - Informació de l'item - Item information
Títol: Exploiting rules for word sense disambiguation in machine translation
Autors: Specia, Lucia | Nunes, Maria das Graças Volpe | Stevenson, Mark
Paraules clau: Desambiguación del sentido de las palabras | Aprendizaje de máquina | Evaluación de reglas | Word sense disambiguation | Machine learning | Rule evaluation
Data de publicació: de setembre-2005
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: SPECIA, Lucia; NUNES, Maria das Graças Volpe; STEVENSON, Mark. “Exploiting rules for word sense disambiguation in machine translation”. Procesamiento del lenguaje natural. Nº 35 (sept. 2005), pp. 171-178
Resum: Esta comunicación describe la generación automática y la evaluación de conjuntos de reglas para la desambiguación del sentido de las palabras (DSP) en la traducción automática. El objetivo principal es identificar reglas de alta calidad que se pueden utilizar como fuentes del conocimiento en un modelo relacional de DSP. La evaluación fue realizada automáticamente, por medio de cuatro medidas objetivas (error, cobertura, suporte y novedad), y manualmente, por medio de un análisis subjetivo del nivel del interés de las mejores reglas según lo precisado por las medidas objetivas. Han sido seleccionadas 63 reglas que trataban siete verbos altamente ambiguos. La evaluación también evidenció qué clases de conocimiento fueron utilizadas con eficacia por las reglas de DSP, que no son siempre iguales aquéllas reveladas por evaluaciones tradicionales de los modelos completos de DSP. Aunque hayamos realizado experimentos con inglés-portugués, los procedimientos de generación y evaluación de las reglas se podrían aplicar a cualquier par de lenguas, siempre que un corpus de ejemplos de desambiguación esté disponible para este par de lenguas. | This paper describes the automatic generation and the evaluation of sets of rules for word sense disambiguation (WSD) in machine translation. The ultimate aim is to identify high-quality rules that can be used as knowledge sources in a relational WSD model. The evaluation was carried out both automatically, by means of four objective measures (error, coverage, support and novelty), and manually, by means of a subjective analysis of the level of interest of the best rules as pointed out by the objective measures. As a result, we selected 63 rules addressing seven highly ambiguous verbs. The evaluation also evidenced which kinds of knowledge were effectively used by the WSD rules, which are not always the same as those revealed by traditional evaluations of complete WSD models. Although we experimented with English-Portuguese, the rule generation and evaluation procedures could be applied to any language pair, provided that there is a disambiguation sample corpus for that language pair.
URI: http://hdl.handle.net/10045/1312
ISSN: 1135-5948
Idioma: eng
Tipus: info:eu-repo/semantics/article
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 35 (septiembre 2005)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_35_21.pdf94,05 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.