Izgradnja jezičnog korpusa govora mržnje na hrvatskom medijskom prostoru društvenih mreža

Autor: Tanja Grmuša, Slobodan Hadžić, Artur Šilić

Sažetak

Govor mržnje predstavlja neprihvatljiv oblik društveno štetnih komunikacijskih formi čija je raširenost u posljednje vrijeme u porastu. Razvojem digitalnih medija, a posebice jačanjem uloge društvenih mreža u privatnoj i javnoj komunikaciji, otvoren je prostor za brojne javne virtualne forume koji su pasivnu publiku potaknuli na aktivniju participaciju i komunikaciju. Sloboda govora i izražavanja kao temeljna demokratska načela s jedne strane suočavaju se s prostorom za toksičnu komunikaciju s druge strane, okupljajući istomišljenike u virtualnim zajednicama kojima su meta napada nerijetko akteri priloga, novinari, urednici, mediji, pa i drugi korisnici. Uzimajući u obzir neograničenost internetskog prostora čiji je sadržaj teško kontrolirati, postavlja se pitanje kako prepoznati društveno štetne komunikacijske forme u javnom prostoru, može li ih se spriječiti i kako zadržati postojeću publiku. Mogućnosti upotrebe proširuju se i na područje moderiranja neprimjerenih komentara korisnika oslanjanjem na softvere koji pružaju trenutne odgovore medijskim organizacijama, ali i koji također pokazuju kontinuiranu potrebu za samopoboljšanjima. Interes autora u ovom radu vezan je za detekciju govora mržnje prema etnicitetu na društvenim mrežama te istraživanju mogućnosti primjene jezičnih tehnologija u prepoznavanju i sprječavanju širenja govora mrženja. Kvantitativnom i kvalitativnom analizom sadržaja te primjenom niza softverskih rješenja temeljenih na jezičnim tehnologijama omogućena je učinkovita automatska i poluautomatska analiza velike količine korisnički generiranog sadržaja. Korišteni su: program WordFinder za brzi pronalazak riječi u velikim korpusima, alat CRONTIMENT za automatsku dodjelu sentimenta tekstovima na hrvatskom jeziku, aplikacija Text Marker za učinkovito ručno označavanje i izgradnju korpusa. U pojedinim studijama slučaja autori detektiraju promjene u vrstama i frekvencijama pojave govora mržnje u predmetu istraživanja te identificiraju glavne prednosti i nedostatke primjene jezičnih tehnologija, sugerirajući pri tome moguće smjerove razvoja.

Ključne riječi: digitalni mediji, društveno štetne komunikacijsk, govor mržnje, jezične tehnologije, komentari korisnika, publika
Download: Klikni ovdje.