Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego

Gamallo Otero, Pablo; Pichel Campos, José Ramom

Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/3018

Información del item - Informació de l'item - Item information
Title:	Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego
Authors:	Gamallo Otero, Pablo \| Pichel Campos, José Ramom
Keywords:	Extracción de léxico multilingüe \| Corpus comparables \| Traducción automática \| Multilingual lexical extraction \| Comparable corpora \| Automatic translation
Issue Date:	Sep-2007
Publisher:	Sociedad Española para el Procesamiento del Lenguaje Natural
Citation:	GAMALLO OTERO, Pablo; PICHEL CAMPOS, José Ramom. "Un método de extracción de equivalentes de traducción a partir de un corpus comparable castellano-gallego". Procesamiento del lenguaje natural. N. 39 (sept. 2007). ISSN 1135-5948, pp. 241-248
Abstract:	Los trabajos sobre extracción de equivalentes de traducción a partir de corpus comparables no-paralelos no han sido muy numerosos hasta ahora. La raz´on principal radica en los pobres resultados obtenidos si los comparamos con los enfoques que utilizan corpus paralelos y alineados. El método propuesto en este artículo, basado en el uso de contextos semilla generados a partir de diccionarios bilingües externos, obtiene tasas de precisión próximas a los métodos con corpus paralelos. Estos resultados apoyan la idea de que la ingente cantidad de corpus comparables disponibles via Web puede llegar a ser una fuente importante de conocimiento lexicogr áfico. En este artículo, se describen los experimentos realizados sobre un corpus comparable castellano-gallego. \| So far, research on extraction of word translations from comparable, non-parallel corpora has not been very popular. The main reason was the poor results when compared to those obtained from aligned parallel corpora. The method proposed in this paper, relying on seed contexts generated from external bilingual dictionaries, allows us to achieve results similar to those from parallel corpus. In this way, the huge amount of comparable corpora available via Web can be viewed as a never-ending source of lexicographic information. In this paper, we desbribe the experiments performed on a comparable, Spanish-Galician corpus.
Sponsor:	Este trabajo ha sido subvencionado por el Ministerio de Educación y Ciencia a cargo del proyecto GARI-COTER, ref: HUM2004-05658-D02-02
URI:	http://hdl.handle.net/10045/3018
ISSN:	1135-5948
Language:	spa
Type:	info:eu-repo/semantics/article
Appears in Collections:	Procesamiento del Lenguaje Natural - Nº 39 (septiembre 2007)

Files in This Item:

Files in This Item:
File	Description	Size	Format
PLN_39_29.pdf		175,3 kB	Adobe PDF	Open Preview Close preview

See citations in Google Scholar

Show full item record