Rassismus, Antisemitismus, Sexismus und andere Diskriminierungsund Radikalisierungsformen zeigen sich auf unterschiedliche Arten im Internet. Es kann als Satire verpackt sein oder als menschenverachtende Parolen. Sogenannte Hassrede ist für die Kommunikationskultur ein Problem, dem die betroffenen Personen oder Personengruppen ausgesetzt sind. Zwar gibt es den Volksverhetzungsparagraphen (ğ 130 StGB), Hassrede liegt allerdings nicht selten außerhalb des justiziablen Bereichs. Dennoch sind hasserfüllte Aussagen problematisch, da sie mit falschen Fakten Gruppierungen radikalisieren und Betroffene in ihrer Würde verletzen. 2017 stellte die Bundesregierung das Netzwerkdurchsetzungsgesetz vor, welches die sozialen Netzwerke dazu zwingt, Hassrede konsequent zu entfernen. Ohne eine automatisierte Erkennung ist dieses aber nur schwer möglich. In unserer Arbeit stellen wir einen Ansatz vor, wie solche Inhalte mithilfe des maschinellen Lernens erkannt werden können. Hierfür werden zunächst die Begriffe Radikalisierung und Hate Speech sprachlich eingeordnet. In diesem Zusammenhang wird darauf eingegangen wie Textdaten bereinigt und strukturiert werden. Anschließend wird der k-Nearest-Neighbor-Algorithmus eingesetzt, um Hate Speech in Tweets zu erkennen und zu klassiĄzieren. Mit unserem Vorgehen konnten wir einen Genauigkeitswert von 0,82 (Accuracy) erreichen dieser zeigt die Effektivität des KNN-KlassiĄkationsansatzes.
[1]
Quintan Wiktorowicz,et al.
Radical Islam Rising: Muslim Extremism in the West
,
2005
.
[2]
M. Williams,et al.
Hate speech, machine classification and statistical modelling of information flows on Twitter: interpretation and communication for policy decision making
,
2014
.
[3]
Marcus Lewis,et al.
A Framework for Intelligence and Cortical Function Based on Grid Cells in the Neocortex
,
2018,
bioRxiv.
[4]
Felice Dell'Orletta,et al.
Hate Me, Hate Me Not: Hate Speech Detection on Facebook
,
2017,
ITASEC.
[5]
Ingmar Weber,et al.
Automated Hate Speech Detection and the Problem of Offensive Language
,
2017,
ICWSM.