Adapting text simplification decisions to different text genres and target users
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/30628
Título: | Adapting text simplification decisions to different text genres and target users |
---|---|
Título alternativo: | Adaptación de algoritmos de toma de decisiones de simplificación de textos a diferentes corpus y audiencias |
Autor/es: | Štajner, Sanja | Saggion, Horacio |
Palabras clave: | Simplificación de textos | Clasificación de oraciones | Adaptación de métodos | Text simplification | Sentence classification | Method adaptation |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2013 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | ŠTAJNER, Sanja; SAGGION, Horacio. “Adapting text simplification decisions to different text genres and target users”. Procesamiento del Lenguaje Natural. N. 51 (2013). ISSN 1135-5948, pp. 135-142 |
Resumen: | Hemos analizado las alineaciones a nivel de oración de dos corpus paralelos de textos originales y sus simplificaciones creados con diferentes objetivos. Hemos clasificado las alineaciones que se observan y diseñado un algoritmo de clasificación capaz de predecir si las oraciones de un texto serán eliminadas, segmentadas, o transformadas durante el proceso de simplificación. Hemos realizado una evaluación cruzada en cada uno de los corpus así como una evaluación en la cual se entrena en algoritmo en un corpus y se lo evalúa en el otro. | We investigate sentence deletion and split decisions in Spanish text simplification for two different corpora aimed at different groups of users. We analyse sentence transformations in two parallel corpora of original and manually simplified texts for two different types of users and then conduct two classification experiments: classifying between those sentences to be deleted and those to be kept; and classifying between sentences to be split and those to be left unsplit. Both experiments were first run on each of the two corpora separately and then run by using one corpus for the training and the other for testing. The results indicated that both sentence decision systems could be successfully trained on one corpus and then used for a different text genre in a text simplification system aimed at a different target population. |
Patrocinador/es: | The research described in this paper was partially funded by the European Commission under the Seventh (FP7 - 2007-2013) Framework Programme for Research and Technological Development (FIRST 287607). This work is supported by an Advanced Research Fellowship from Programa Ramón y Cajal (RYC-2009-04291) and by the project SKATER: Scenario Knowledge Acquisition - Knowledge-based Concise Summarization (TIN2012-38584-C06-03) , Ministerio de Economía y Competitividad, Secretaria de Estado de Investigación, Desarrollo e Innovación, Spain. |
URI: | http://hdl.handle.net/10045/30628 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Revisión científica: | si |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 51 (2013) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_51_15.pdf | 689,88 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.