Automatic counter-narrative generation for hate speech in Spanish

Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10045/137174
Registro completo de metadatos
Registro completo de metadatos
Campo DCValorIdioma
dc.contributor.authorVallecillo-Rodríguez, M. Estrella-
dc.contributor.authorMontejo Ráez, Arturo-
dc.contributor.authorMartín Valdivia, María Teresa-
dc.date.accessioned2023-09-14T10:20:36Z-
dc.date.available2023-09-14T10:20:36Z-
dc.date.issued2023-09-
dc.identifier.citationProcesamiento del Lenguaje Natural. 2023, 71: 227-245. https://doi.org/10.26342/2023-71-18es_ES
dc.identifier.issn1135-5948-
dc.identifier.urihttp://hdl.handle.net/10045/137174-
dc.description.abstractThis paper analyzes the use of language models to automatically generate counter-narratives for hate speech in Spanish. Despite the existence of a few studies in English and other languages, no previous work has explored this topic focused on Spanish. The article shows that the use of GPT-3 outperforms other models in generating non-offensive and informative counter-narratives, which sometimes present compelling arguments. We have used few-shot learning algorithms applying different prompt strategies and analyzing the results for each of them. Additionally, a new corpus called CONAN-SP, which consists of 238 pairs of hate speech and counter-narratives in Spanish, has been made available to the research community to facilitate further investigations in this area. These findings highlight the potential of language models to combat hate speech in Spanish by counter-narrative generation.es_ES
dc.description.abstractEste trabajo analiza el uso de modelos lingüísticos para generar automáticamente contranarrativas al discurso del odio en español. A pesar de la existencia de algunos estudios en inglés y otros idiomas, ningún trabajo previo ha explorado este tema centrado en el español. El artículo muestra que el uso de GPT-3 supera a otros modelos en la generación de contranarrativas no ofensivas e informativas incluyendo en ocasiones argumentos convincentes. Hemos utilizado diferentes algoritmos de few-shot learning aplicando varias estrategias de prompting y analizando los resultados para cada una de ellas. Además, se ha puesto a disposición de la comunidad investigadora un nuevo corpus llamado CONAN-SP, que consta de 238 pares de discursos de odio y contranarrativas en español, para facilitar nuevas investigaciones en este ámbito. Estos resultados ponen de relieve el potencial de los modelos del lenguaje para combatir el discurso de odio en español mediante la generación de contranarrativas.es_ES
dc.description.sponsorshipThis work has been partially supported by Project CONSENSO (PID2021-122263OB-C21), Project MODERATES (TED2021-130145B-I00) and Project SocialTox (PDC2022-133146-C21) funded by MCIN/AEI/10.13039/501100011033 and by the European Union NextGenerationEU/PRTR, Project PRECOM (SUBV-00016) funded by Ministerio de Consumo and WeLee project (1380939, FEDER Andalucía 2014-2020) funded by the Andalusian Regional Government.es_ES
dc.languageenges_ES
dc.publisherSociedad Española para el Procesamiento del Lenguaje Naturales_ES
dc.rights© Sociedad Española para el Procesamiento del Lenguaje Natural. Distribuido bajo Licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0es_ES
dc.subjectSpanish counter-narrative generationes_ES
dc.subjectHate speeches_ES
dc.subjectNatural language generationes_ES
dc.subjectFew-shot learninges_ES
dc.subjectGeneración de contranarrativas en españoles_ES
dc.subjectDiscurso del odioes_ES
dc.subjectGeneración de lenguaje naturales_ES
dc.subjectAprendizaje con pocos ejemploses_ES
dc.titleAutomatic counter-narrative generation for hate speech in Spanishes_ES
dc.title.alternativeGeneración automática de contranarrativas para discursos de odio en españoles_ES
dc.typeinfo:eu-repo/semantics/articlees_ES
dc.peerreviewedsies_ES
dc.identifier.doi10.26342/2023-71-18-
dc.relation.publisherversionhttps://doi.org/10.26342/2023-71-18es_ES
dc.rights.accessRightsinfo:eu-repo/semantics/openAccesses_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/PID2021-122263OB-C21es_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/TED2021-130145B-I00es_ES
dc.relation.projectIDinfo:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023/PDC2022-133146-C21es_ES
Aparece en las colecciones:Procesamiento del Lenguaje Natural - Nº 71 (2023)

Archivos en este ítem:
Archivos en este ítem:
Archivo Descripción TamañoFormato 
ThumbnailPLN_71_18.pdf1,25 MBAdobe PDFAbrir Vista previa


Este ítem está licenciado bajo Licencia Creative Commons Creative Commons