Reducing text complexity through automatic lexical simplification: an empirical study for Spanish

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/23915
Información del item - Informació de l'item - Item information
Título: Reducing text complexity through automatic lexical simplification: an empirical study for Spanish
Título alternativo: Reducción de la complejidad de un texto a través de la simplificación léxica: un estudio para el español
Autor/es: Drndarevic, Biljana | Saggion, Horacio
Palabras clave: Simplificación léxica | Frecuencia | Longitud de palabra | Reducción del contenido | Lexical simplification | Word frequency | Word length | Information expansion | Content reduction
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: sep-2012
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: DRNDAREVIC, Biljana; SAGGION, Horacio. “Reducing text complexity through automatic lexical simplification: an empirical study for Spanish”. Procesamiento del Lenguaje Natural. N. 49 (2012). ISSN 1135-5948, pp. 13-20
Resumen: En este artículo presentamos los resultados de un estudio cuyo objetivo es sentar las bases para el desarrollo de un módulo de simplificación léxica para el español. Basándonos en estudios para otras lenguas analizamos, en primer lugar, la distribución de la frecuencia y la longitud de palabra en textos originales y sus simplificaciones manuales. En segundo lugar nos centramos en los casos de clarificación de información a través de la introducción de definiciones en textos simplificados. Finalmente estudiamos la reducción del contenido informativo del texto y proponemos un sistema para su tratamiento basado en técnicas de resumen. Nuestro estudio empírico sienta las bases para el desarrollo de un componente de tratamiento léxico en un sistema de simplificación de textos en desarrollo. | In this paper we present the results of a study directed towards developing a lexical simplification module of an automatic simplification system for Spanish, intended for readers with cognitive disabilities. We here observe the word length and frequency distribution of two sets of texts that make up our parallel corpus, and we focus on cases of information expansion (through the insertion of definitions) and content reduction (through summarisation). Our ultimate goal is computational implementation of lexical changes in the future.
Patrocinador/es: We present this work as part of a project entitled Simplext: An automatic system for text simplification, with the file number TSI-020302-2010-84 (http://www.simplext.es). We are also grateful to the fellowship RYC-2009-04291 from Programa Ramón y Cajal 2009, Ministerio de Economía y Competitividad, Secretaría de Estado de Investigación, Desarrollo e Innovación, Spain.
URI: http://hdl.handle.net/10045/23915
ISSN: 1135-5948
Idioma: eng
Tipo: info:eu-repo/semantics/article
Revisión científica: si
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 49 (2012)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_49_01.pdf210,76 kBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.