Multi-document summarization using semantic discourse models

Please use this identifier to cite or link to this item: http://hdl.handle.net/10045/53562
Información del item - Informació de l'item - Item information
Title: Multi-document summarization using semantic discourse models
Other Titles: Resumen multidocumento utilizando teorías semántico-discursivas
Authors: Cardoso, Paula C.F. | Pardo, Thiago A.S.
Keywords: Resumen multidocumento | Cross-document structure theory | Rhetorical structure theory | Multi-document summarization
Knowledge Area: Lenguajes y Sistemas Informáticos
Issue Date: Mar-2016
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Citation: Procesamiento del Lenguaje Natural. 2016, 56: 57-64
Abstract: El resumen automático tiene por objetivo reducir el tamaño de los textos, preservando el contenido más importante. En este trabajo, proponemos algunos métodos de resumen basados en dos teorías semántico-discursivas: Teoría de la Estructura Retórica (Rhetorical Structure Theory, RST) y Teoría de la Estructura Inter-Documento (Cross-document Structure Theory, CST). Han sido elegidas ambas teorías con el fin de abordar de un modo más relevante de un texto, los fenómenos relacionales de inter-documentos y la distribución de subtopicos en los textos. Los resultados muestran que el uso de informaciones semánticas y discursivas para la selección de contenidos mejora la capacidad informativa de los resúmenes automáticos. | Automatic multi-document summarization aims at reducing the size of texts while preserving the important content. In this paper, we propose some methods for automatic summarization based on two semantic discourse models: Rhetorical Structure Theory (RST) and Cross-document Structure Theory (CST). These models are chosen in order to properly address the relevance of information, multi-document phenomena and subtopical distribution in the source texts. The results show that using semantic discourse knowledge for content selection improve the informativeness of automatic summaries.
URI: http://hdl.handle.net/10045/53562
ISSN: 1135-5948
Language: eng
Type: info:eu-repo/semantics/article
Rights: © Sociedad Española para el Procesamiento del Lenguaje Natural
Peer Review: si
Publisher version: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln
Appears in Collections:Procesamiento del Lenguaje Natural - Nº 56 (2016)

Files in This Item:
Files in This Item:
File Description SizeFormat 
ThumbnailPLN_56_06.pdf654,3 kBAdobe PDFOpen Preview


Items in RUA are protected by copyright, with all rights reserved, unless otherwise indicated.