Categorizing Misogynistic Behaviours in Italian, English and Spanish Tweets

La misoginia es un fenomeno con multiples facetas y puede manifestarse linguisticamente de muchas formas. Las campanas de evaluacion de EVALITA e IberEval en 2018 propusieron una tarea compartida de Identificacion Automatica de Misoginia (AMI) basada en tweets en italiano, ingles y espanol. Dado que los resultados de los equipos participantes fueron bastante bajos en la categorizacion del comportamiento misogino, el objetivo de este estudio es investigar las posibles causas. Medimos el solape y la homogeneidad de los clusteres variando el numero de categorias. Este experimento mostro que los grupos se solapan. Finalmente probamos varios modelos de aprendizaje automatico utilizando los conjuntos de datos originales y fusionando algunas categorias de acuerdo con consideraciones basadas en medidas de similitud y las matrices de confusion de los modelos, obteniendo un aumento de la F1 macro.

[1]  Paolo Rosso,et al.  Overview of the Task on Automatic Misogyny Identification at IberEval 2018 , 2018, IberEval@SEPLN.

[2]  Mona Simion,et al.  Down Girl: The Logic of Misogyny , 2020, The Philosophical Quarterly.

[3]  Rafael Valencia-García,et al.  Detecting misogyny in Spanish tweets. An approach based on linguistics features and word embeddings , 2021, Future Gener. Comput. Syst..

[4]  Harith Alani,et al.  Exploring Misogyny across the Manosphere in Reddit , 2019, WebSci.

[5]  Bailey Poland,et al.  Haters: Harassment, Abuse, and Violence Online , 2016 .

[6]  Paolo Rosso,et al.  Overview of the Evalita 2018 Task on Automatic Misogyny Identification (AMI) , 2018, EVALITA@CLiC-it.

[7]  Dirk Hovy,et al.  Hateful Symbols or Hateful People? Predictive Features for Hate Speech Detection on Twitter , 2016, NAACL.

[8]  J. Megarry Online incivility or sexual harassment? Conceptualising women's experiences in the digital age , 2014 .

[9]  Viviana Patti,et al.  Hurtlex: A Multilingual Lexicon of Words to Hurt , 2018, CLiC-it.

[10]  Martine De Cock,et al.  Detecting Hate Speech Against Women in English Tweets , 2018, EVALITA@CLiC-it.

[11]  A. Flammini,et al.  Misogynistic Language on Twitter and Sexual Violence , 2015 .

[12]  Viviana Patti,et al.  14-ExLab@UniTo for AMI at IberEval2018: Exploiting Lexical Knowledge for Detecting Misogyny in English and Spanish Tweets , 2018, IberEval@SEPLN.

[13]  Amir Bakarov,et al.  Vector Space Models for Automatic Misogyny Identification , 2018 .

[14]  Paolo Rosso,et al.  Online Hate Speech against Women: Automatic Identification of Misogyny and Sexism on Twitter , 2019, J. Intell. Fuzzy Syst..

[15]  Viviana Patti,et al.  Misogyny Detection in Twitter: a Multilingual and Cross-Domain Study , 2020, Inf. Process. Manag..

[16]  Paolo Rosso,et al.  Automatic Identification and Classification of Misogynistic Language on Twitter , 2018, NLDB.

[17]  Luis Alfonso Ureña López,et al.  Detecting Misogyny and Xenophobia in Spanish Tweets Using Language Technologies , 2020, ACM Trans. Internet Techn..