Using Dependency-Based Contextualization for transferring Passive Constructions from English to Spanish

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/114225
Información del item - Informació de l'item - Item information
Título: Using Dependency-Based Contextualization for transferring Passive Constructions from English to Spanish
Título alternativo: Contextualización basada en dependencias sintácticas para transferir construcciones pasivas de inglés a español
Autor/es: Gamallo Otero, Pablo | Labaka Intxauspe, Gorka
Palabras clave: Semantic Contextualization | Similarity | Unsupervised Machine Translation | Passive Voice | Contextualización semántica | Similaridad | Traducción automática no supervisada | Voz pasiva
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: mar-2021
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2021, 66: 53-64. https://doi.org/10.26342/2021-66-4
Resumen: We hypothesize that parallel corpora as well as machine translation outputs contain many literal translations that are the result of transferring the constructions of the source language to the target language. When translating passive expressions from English to Spanish, there are several constructions available, however, both automatic and human (if of low quality) translations tend to select the periphrastic structure, which is the literal construction. The objective of this article is to make use of strategies trained on monolingual corpora to translate English passive expressions into Spanish so as to verify whether unsupervised translation with monolingual corpora benefits syntactic diversity. Special attention will be given to the monolingual-based strategy relying on dependency-based contextualization. The results of the experiments carried out show that the methods relying on monolingual corpora tend to offer more non-literal translations (middle-voice) than those trained on parallel corpora. | Formulamos la hipótesis de que los corpus paralelos así como los resultados de la traducción automática contienen muchas traducciones literales que son el resultado de la transferencia de las construcciones del idioma de origen al idioma de destino. Cuando se traducen expresiones pasivas del inglés al español, hay varias construcciones disponibles, sin embargo, tanto las traducciones automáticas como las humanas (si son de baja calidad) tienden a seleccionar la estructura perifásica, que es la construcción literal. El objetivo de este artículo es hacer uso de estrategias entrenadas a partir de corpus monolingües para traducir las expresiones pasivas del inglés al español, a fin de verificar si la traducción no supervisada con corpus monolingües beneficia la diversidad sintáctica. Se prestará especial atención al método semántico que se apoya en el proceso de contextualización en el marco de la sintaxes de dependencias. Los resultados obtenidos en los experimentos muestran que los métodos basados en corpus monolingües tienden a generar más traducciones no literales (voz media) que los entrenados con corpus paralelos.
Patrocinador/es: This work has received financial support from DOMINO (PGC2018-102041-B-I00, MCIU/AEI/FEDER, UE), eRisk (RTI2018-093336-B-C21), the Consellería de Cultura, Educación e Ordenación Universitaria (accreditation 2016-2019, ED431G/08, Groups of Reference: ED431C 2020/21) and the European Regional Development Fund.
URI: http://hdl.handle.net/10045/114225
ISSN: 1135-5948
DOI: 10.26342/2021-66-4
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2021-66-4
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 66 (2021)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_66_04.pdf1,05 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.