Masking and BERT-based Models for Stereotype Identification

Empreu sempre aquest identificador per citar o enllaçar aquest ítem http://hdl.handle.net/10045/117481
Información del item - Informació de l'item - Item information
Títol: Masking and BERT-based Models for Stereotype Identification
Títol alternatiu: Modelos Basados en Enmascaramiento y en BERT para la Identificación de Estereotipos
Autors: Sánchez-Junquera, Javier | Rosso, Paolo | Montes y Gómez, Manuel | Chulvi, Berta
Paraules clau: Social bias | Immigrant stereotypes | BETO | Masking technique | Sesgo social | Estereotipos hacia inmigrantes | Técnica de enmascaramiento
Àrees de coneixement: Lenguajes y Sistemas Informáticos
Data de publicació: de setembre-2021
Editor: Sociedad Española para el Procesamiento del Lenguaje Natural
Citació bibliogràfica: Procesamiento del Lenguaje Natural. 2021, 67: 83-94. https://doi.org/10.26342/2021-67-7
Resum: Stereotypes about immigrants are a type of social bias increasingly present in the human interaction in social networks and political speeches. This challenging task is being studied by computational linguistics because of the rise of hate messages, offensive language, and discrimination that many people receive. In this work, we propose to identify stereotypes about immigrants using two different explainable approaches: a deep learning model based on Transformers; and a text masking technique that has been recognized by its capabilities to deliver good and human-understandable results. Finally, we show the suitability of the two models for the task and offer some examples of their advantages in terms of explainability. | Los estereotipos sobre inmigrantes son un tipo de sesgo social cada vez más presente en la interacción humana en redes sociales y en los discursos políticos. Esta desafiante tarea está siendo estudiada por la lingüística computacional debido al aumento de los mensajes de odio, el lenguaje ofensivo, y la discriminación que reciben muchas personas. En este trabajo, nos proponemos identificar estereotipos sobre inmigrantes utilizando dos enfoques diametralmente opuestos prestando atención a la explicabilidad de los mismos: un modelo de aprendizaje profundo basado en Transformers; y una técnica de enmascaramiento de texto que ha sido reconocida por su capacidad para ofrecer buenos resultados a la vez que comprensibles para los humanos. Finalmente, mostramos la idoneidad de los dos modelos para la tarea, y ofrecemos algunos ejemplos de sus ventajas en términos de explicabilidad.
Patrocinadors: The work of the authors from the Universitat Politècnica of València was funded by the Spanish Ministry of Science and Innovation under the research project MISMIS-FAKEnHATE on MISinformation and MIScommunication in social media: FAKE news and HATE speech (PGC2018-096212-B-C31). Experiments were carried out on the GPU cluster at PRHLT thanks to the PROMETEO/2019/121 (DeepPattern) research project funded by the Generalitat Valenciana.
URI: http://hdl.handle.net/10045/117481
ISSN: 1135-5948
DOI: 10.26342/2021-67-7
Idioma: eng
Tipus: info:eu-repo/semantics/article
Drets: © Sociedad Española para el Procesamiento del Lenguaje Natural
Revisió científica: si
Versió de l'editor: https://doi.org/10.26342/2021-67-7
Apareix a la col·lecció: Procesamiento del Lenguaje Natural - Nº 67 (2021)

Arxius per aquest ítem:
Arxius per aquest ítem:
Arxiu Descripció Tamany Format  
ThumbnailPLN_67_07.pdf864,05 kBAdobe PDFObrir Vista prèvia


Tots els documents dipositats a RUA estan protegits per drets d'autors. Alguns drets reservats.