HSDetector

HSDetector – Entwicklung eines automatisierten Erkennungsverfahrens für Hassrede in Online-Portalen auf der Basis eines nachtrainierbaren Classifiers

Prof. Dr. Peter Mandl

Hintergrund

Hassrede (Hate Speech) ist inzwischen ein verbreitetes, im gesellschaftlichen Fokus stehendes Phänomen, das zunehmend das Sicherheitsgefühl insbesondere von Personen des öffentlichen Lebens nachhaltig negativ beeinflusst. Online-Content mit Hassrede wie Volksverhetzungen, Beleidigungen, Verleumdungen und Morddrohungen stachelt Menschen auf und dient im Einzelfall sogar als Motivation oder Auslöser von politisch motivierten Straftaten bis hin zu Anschlägen auf Personen oder Sachen. Hassrede ist stark kontextabhängig und kann sich im Laufe der Zeit verändern.

Ziele

Auch Online-Zeitungen müssen Vorsorge treffen, um Hassrede in ihrem Online-Content, vor allem in Leser Kommentaren, zu vermeiden. Ziel des Forschungsvorhabens HSDetector ist es, einen neuen Dienst zu entwickeln, der Hassrede in Online-Zeitungen mit hoher Wahrscheinlichkeit entdeckt. Das neue Verfahren findet Hassrede in Webseiten auf der Basis eines lernfähigen Erkennungsverfahrens mithilfe eines nachtrainierbaren Classifiers, der auch Veränderungen in der Ausdrucksweise lernen kann.

Ausblick

Es wird angestrebt, die Ergebnisse aus dem Projekt zu einem webbasierten HatesSpeech Detection Service weiterzuentwickeln, der in Redaktionssysteme von Online-Zeitungen aber auch in andere Content-Management-Systeme eingebunden werden kann.

Eingesetzte Methoden, Technologien und Werkzeuge

CNN, Support Vector Machine, logistische Regression, Random Forest, Bag-of-words, TF-IDF und Google BERT, elasticsearch, Python, Scrapy

Publikationen

Januzaj, E., Weber, M., Keller, M.-E., Auch, M., Mandl, P., CoSim: An Approach to Calculate Complex Object Similarity. 23rd International Conference on Information Integration and Web Intelligence, 2021.

Förderprogramm

Bayerisches Staatsministerium für Wirtschaft, Landwirtschaft und Energie (StMWi) Programm BayVFP Förderlinie

Digitalisierung,

Förderkennzeichen:

DIK02778/01

Laufzeit des Vorhabens

01.09.2021 bis 31.08.2024

Kooperationspartner

Bival GmbH, Ingolstadt

Ippen Digital GmbH & Co. KG, München