Using Dependency-Based Contextualization for transferring Passive Constructions from English to Spanish

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/114225
Información del item - Informació de l'item - Item information
Title: Using Dependency-Based Contextualization for transferring Passive Constructions from English to Spanish
Other Titles: Contextualización basada en dependencias sintácticas para transferir construcciones pasivas de inglés a español
Authors: Gamallo Otero, Pablo | Labaka Intxauspe, Gorka
Keywords: Semantic Contextualization | Similarity | Unsupervised Machine Translation | Passive Voice | Contextualización semántica | Similaridad | Traducción automática no supervisada | Voz pasiva
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Mar-2021
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: Procesamiento del Lenguaje Natural. 2021, 66: 53-64. https://doi.org/10.26342/2021-66-4
Abstract: We hypothesize that parallel corpora as well as machine translation outputs contain many literal translations that are the result of transferring the constructions of the source language to the target language. When translating passive expressions from English to Spanish, there are several constructions available, however, both automatic and human (if of low quality) translations tend to select the periphrastic structure, which is the literal construction. The objective of this article is to make use of strategies trained on monolingual corpora to translate English passive expressions into Spanish so as to verify whether unsupervised translation with monolingual corpora benefits syntactic diversity. Special attention will be given to the monolingual-based strategy relying on dependency-based contextualization. The results of the experiments carried out show that the methods relying on monolingual corpora tend to offer more non-literal translations (middle-voice) than those trained on parallel corpora. | Formulamos la hipótesis de que los corpus paralelos así como los resultados de la traducción automática contienen muchas traducciones literales que son el resultado de la transferencia de las construcciones del idioma de origen al idioma de destino. Cuando se traducen expresiones pasivas del inglés al español, hay varias construcciones disponibles, sin embargo, tanto las traducciones automáticas como las humanas (si son de baja calidad) tienden a seleccionar la estructura perifásica, que es la construcción literal. El objetivo de este artículo es hacer uso de estrategias entrenadas a partir de corpus monolingües para traducir las expresiones pasivas del inglés al español, a fin de verificar si la traducción no supervisada con corpus monolingües beneficia la diversidad sintáctica. Se prestará especial atención al método semántico que se apoya en el proceso de contextualización en el marco de la sintaxes de dependencias. Los resultados obtenidos en los experimentos muestran que los métodos basados en corpus monolingües tienden a generar más traducciones no literales (voz media) que los entrenados con corpus paralelos.
Sponsor: This work has received financial support from DOMINO (PGC2018-102041-B-I00, MCIU/AEI/FEDER, UE), eRisk (RTI2018-093336-B-C21), the Consellería de Cultura, Educación e Ordenación Universitaria (accreditation 2016-2019, ED431G/08, Groups of Reference: ED431C 2020/21) and the European Regional Development Fund.
URI: http://hdl.handle.net/10045/114225
ISSN: 1135-5948
DOI: 10.26342/2021-66-4
Language: eng
Type: info:eu-repo/semantics/article
Rights: © Sociedad Española para el Procesamiento del Lenguaje Natural
Peer Review: si
Publisher version: https://doi.org/10.26342/2021-66-4
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 66 (2021)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_66_04.pdf1,05 MBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.