Cardoso, Paula C.F., Pardo, Thiago A.S. Multi-document summarization using semantic discourse models Procesamiento del Lenguaje Natural. 2016, 56: 57-64 URI: http://hdl.handle.net/10045/53562 DOI: ISSN: 1135-5948 Abstract: El resumen automático tiene por objetivo reducir el tamaño de los textos, preservando el contenido más importante. En este trabajo, proponemos algunos métodos de resumen basados en dos teorías semántico-discursivas: Teoría de la Estructura Retórica (Rhetorical Structure Theory, RST) y Teoría de la Estructura Inter-Documento (Cross-document Structure Theory, CST). Han sido elegidas ambas teorías con el fin de abordar de un modo más relevante de un texto, los fenómenos relacionales de inter-documentos y la distribución de subtopicos en los textos. Los resultados muestran que el uso de informaciones semánticas y discursivas para la selección de contenidos mejora la capacidad informativa de los resúmenes automáticos. Automatic multi-document summarization aims at reducing the size of texts while preserving the important content. In this paper, we propose some methods for automatic summarization based on two semantic discourse models: Rhetorical Structure Theory (RST) and Cross-document Structure Theory (CST). These models are chosen in order to properly address the relevance of information, multi-document phenomena and subtopical distribution in the source texts. The results show that using semantic discourse knowledge for content selection improve the informativeness of automatic summaries. Keywords:Resumen multidocumento, Cross-document structure theory, Rhetorical structure theory, Multi-document summarization Sociedad Española para el Procesamiento del Lenguaje Natural info:eu-repo/semantics/article