Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/3018
Información del item - Informació de l'item - Item information
Title: Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego
Authors: Gamallo Otero, Pablo | Pichel Campos, José Ramom
Keywords: Extracción de léxico multilingüe | Corpus comparables | Traducción automática | Multilingual lexical extraction | Comparable corpora | Automatic translation
Issue Date: Sep-2007
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: GAMALLO OTERO, Pablo; PICHEL CAMPOS, José Ramom. "Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 241-248
Abstract: Los trabajos sobre extracción de equivalentes de traducción a partir de corpus comparables no-paralelos no han sido muy numerosos hasta ahora. La raz´on principal radica en los pobres resultados obtenidos si los comparamos con los enfoques que utilizan corpus paralelos y alineados. El método propuesto en este artículo, basado en el uso de contextos semilla generados a partir de diccionarios bilingües externos, obtiene tasas de precisión próximas a los métodos con corpus paralelos. Estos resultados apoyan la idea de que la ingente cantidad de corpus comparables disponibles via Web puede llegar a ser una fuente importante de conocimiento lexicogr áfico. En este artículo, se describen los experimentos realizados sobre un corpus comparable castellano-gallego. | So far, research on extraction of word translations from comparable, non-parallel corpora has not been very popular. The main reason was the poor results when compared to those obtained from aligned parallel corpora. The method proposed in this paper, relying on seed contexts generated from external bilingual dictionaries, allows us to achieve results similar to those from parallel corpus. In this way, the huge amount of comparable corpora available via Web can be viewed as a never-ending source of lexicographic information. In this paper, we desbribe the experiments performed on a comparable, Spanish-Galician corpus.
Sponsor: Este trabajo ha sido subvencionado por el Ministerio de Educación y Ciencia a cargo del proyecto GARI-COTER, ref: HUM2004-05658-D02-02
URI: http://hdl.handle.net/10045/3018
ISSN: 1135-5948
Language: spa
Type: info:eu-repo/semantics/article
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_39_29.pdf175,3 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.