Categorizing Misogynistic Behaviours in Italian, English and Spanish Tweets

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/114226
Información del item - Informació de l'item - Item information
Título: Categorizing Misogynistic Behaviours in Italian, English and Spanish Tweets
Título alternativo: Categorización de comportamientos misóginos en tweets en italiano, inglés y español
Autor/es: Lazzardi, Silvia | Patti, Viviana | Rosso, Paolo
Palabras clave: Automatic misogyny identification | Hate speech online | Identificación automática de misoginia | Mensajes de odio online
Área/s de conocimiento: Lenguajes y Sistemas Informáticos
Fecha de publicación: mar-2021
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Cita bibliográfica: Procesamiento del Lenguaje Natural. 2021, 66: 65-76. https://doi.org/10.26342/2021-66-5
Resumen: Misogyny is a multifaceted phenomenon and can be linguistically manifested in numerous ways. The evaluation campaigns of EVALITA and IberEval in 2018 proposed a shared task of Automatic Misogyny Identification (AMI) based on Italian, English and Spanish tweets. Since the participating teams' results were pretty low in the misogynistic behaviour categorization, the aim of this study is to investigate the possible causes. We measured the overlap and the homogeneity of the clusters by varying the number of categories. This experiment showed that the clusters overlap. Finally, we tested several machine learning models both using the original data sets and merging together some categories according to their overlap, obtaining an increase in terms of macro F1. | La misoginia es un fenómeno con múltiples facetas y puede manifestarse lingüísticamente de muchas formas. Las campañas de evaluación de EVALITA e IberEval en 2018 propusieron una tarea compartida de Identificación Automática de Misoginia (AMI) basada en tweets en italiano, inglés y español. Dado que los resultados de los equipos participantes fueron bastante bajos en la categorización del comportamiento misógino, el objetivo de este estudio es investigar las posibles causas. Medimos el solape y la homogeneidad de los clústeres variando el número de categorías. Este experimento mostró que los grupos se solapan. Finalmente probamos varios modelos de aprendizaje automático utilizando los conjuntos de datos originales y fusionando algunas categorías de acuerdo con consideraciones basadas en medidas de similitud y las matrices de confusión de los modelos, obteniendo un aumento de la F1 macro.
Patrocinador/es: The work of S. Lazzardi was partially carried out at the Universitat Politècnica de València within the framework of the Erasmus+ program, Erasmus Traineeship 2018/19 funding. The work of P. Rosso was partially funded by the Spanish MICINN under the research project MISMIS-FAKEnHATE on Misinformation and Miscommunication in social media: FAKE news and HATE speech (PGC2018-096212-B-C31). The work of V. Patti was partially funded by the research projects “STudying European Racial Hoaxes and sterEOTYPES” (STERHEOTYPES, under the call “Challenges for Europe” of VolksWagen Stiftung and Compagnia di San Paolo) and “Be Positive!” (under the 2019 “Google.org Impact Challenge on Safety” call).
URI: http://hdl.handle.net/10045/114226
ISSN: 1135-5948
DOI: 10.26342/2021-66-5
Idioma: eng
Tipo: info:eu-repo/semantics/article
Derechos: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisión científica: si
Versión del editor: https://doi.org/10.26342/2021-66-5
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 66 (2021)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_66_05.pdf1,25 MBAdobe PDFAbrir Vista previa


Todos los documentos en RUA están protegidos por derechos de autor. Algunos derechos reservados.