Translating sentences from ‘original’ to ‘simplified’ Spanish

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/40025
Información del item - Informació de l'item - Item information
Title: Translating sentences from ‘original’ to ‘simplified’ Spanish
Other Titles: Traducción de frases del español ‘original’ al español ‘simplificado’
Authors: Štajner, Sanja
Keywords: Text simplification | Phrase-based statistical machine translation | Simplificación de textos | Traducción automática estadística
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Sep-2014
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: Procesamiento del Lenguaje Natural. 2014, 53: 61-68
Abstract: Text Simplification (TS) aims to convert complex sentences into their simpler variants, which are more accessible to wider audiences. Several recent studies addressed this problem as a monolingual machine translation (MT) problem (translating from ‘original’ to ‘simplified’ language instead of translating from one language into another) using the standard phrase-based statistical machine translation (PB-SMT) model. We investigate whether the same approach would be equally successful regardless of the type of simplification we wish to learn (given that different target audiences require different levels of simplification). Our preliminary results indicate that the standard PB-SMT model might not be able to learn the strong simplifications which are needed for certain users, e.g. people with Down's syndrome. Additionally, we show that the phrase-tables obtained during the translation process seem to be able to capture some adequate lexical simplifications. | La Simplificación de Textos (ST) tiene como objetivo la conversión de oraciones complejas en variantes más sencillas, que serán más accesibles para un público más amplio. Algunos estudios recientes han abordado este problema como un problema de traducción automática (TA) monolingüe (traducir de lengua ‘original’ a ‘simplificada’ en lugar de traducir de un idioma a otro), utilizando el modelo estándar de traducción automática basado en frases. En este estudio, investigamos si el mismo enfoque tendrá el mismo éxito independientemente del tipo de simplificación que se quiera estudiar, dado que cada público meta requiere diferentes niveles de simplificación. Nuestros resultados preliminares indican que el modelo estándar podrá no ser capaz de aprender las fuertes simplificaciones que se necesitan para algunos usuarios, e.g. gente con el síndrome de Down. Además, mostramos que las tablas de traducción obtenidas durante el proceso de traducción parecen ser capaces de capturar algunas simplificaciones léxicas adecuadas.
URI: http://hdl.handle.net/10045/40025
ISSN: 1135-5948
Language: eng
Type: info:eu-repo/semantics/article
Peer Review: si
Publisher version: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 53 (2014)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_53_06.pdf712,63 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.