Is This Tweet Satirical? A Computational Approach for Satire Detection in Spanish
Por favor, use este identificador para citar o enlazar este ítem:
http://hdl.handle.net/10045/49285
Título: | Is This Tweet Satirical? A Computational Approach for Satire Detection in Spanish |
---|---|
Título alternativo: | ¿Es satírico este tweet? Un método automático para la identificación del lenguaje satírico en español |
Autor/es: | Barbieri, Francesco | Ronzano, Francesco | Saggion, Horacio |
Palabras clave: | Satire detection | Figurative language | Sentiment analysis | Detección automática sátira | Lenguaje figurado | Análisis de sentimientos |
Área/s de conocimiento: | Lenguajes y Sistemas Informáticos |
Fecha de publicación: | sep-2015 |
Editor: | Sociedad Española para el Procesamiento del Lenguaje Natural |
Cita bibliográfica: | Procesamiento del Lenguaje Natural. 2015, 55: 135-142 |
Resumen: | Computational approaches to analyze figurative language are attracting a growing interest in Computational Linguistics. In this paper, we study the characterization of Twitter messages in Spanish that advertise satirical news. We present and evaluate a system able to classify tweets as satirical or not. To this purpose, we concentrate on the tweets published by several satirical and non-satirical Twitter accounts. We model the text of each tweet by a set of linguistically motivated features that aim at capturing the style more than the content of the message. Our experiments demonstrate that our model outperforms a word-based baseline. We also demonstrate that our system models global features of satirical language by showing that it is able to detect if a tweet contains or not satirical contents independently from the account that generated the tweet. | La lingüística computacional está cada vez más interesada en el procesamiento del lenguaje figurado. En este artículo estudiamos la detección de noticias satíricas en español y más específicamente la detección de sátira en mensajes de Twitter. Nuestro modelo computacional se basa en la representación de cada mensaje con un conjunto de rasgos diseñados para detectar el estilo satírico y no el contenido. Nuestros experimentos muestran que nuestro modelo siempre funciona mejor que un modelo de bolsa de palabras. También mostramos que el sistema es capaz de detectar este tipo de lenguaje independientemente de la cuenta de Twitter que lo origina. |
Patrocinador/es: | The research described in this paper is partially funded by the SKATER-UPF-TALN project (TIN2012-38584-C06-03). |
URI: | http://hdl.handle.net/10045/49285 |
ISSN: | 1135-5948 |
Idioma: | eng |
Tipo: | info:eu-repo/semantics/article |
Derechos: | © Sociedad Española para el Procesamiento del Lenguaje Natural |
Revisión científica: | si |
Versión del editor: | http://journal.sepln.org/sepln/ojs/ojs/index.php/pln |
Aparece en las colecciones: | Procesamiento del Lenguaje Natural - Nº 55 (2015) |
Archivos en este ítem:
Archivo | Descripción | Tamaño | Formato | |
---|---|---|---|---|
PLN_55_15.pdf | 714,42 kB | Adobe PDF | Abrir Vista previa | |
Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.