UAntwerpen neemt politieke temperatuur

Datum: 8 mei 2019

Inleiding: Taaltechnologie analyseert tweets en online nieuwsberichten tijdens verkiezingscampagne.

Zondag 26 mei trekken we met zijn allen naar de stembus. De verkiezingscampagne wordt meer dan ooit online gevoerd. Op Twitter wordt het debat gedomineerd door de N-VA, en de laatste weken gaat het opvallend vaak over de pensioenen. Dat blijkt uit de Politieke Barometer, een project van UAntwerpen.

De onderzoeksgroep Clips (Computational Linguistics & Psycholinguistics) beschikt over een uitzonderlijke expertise op het vlak van taaltechnologie. Die knowhow gebruiken prof. Walter Daelemans en onderzoeker Tim Kreutz nu voor hun Politieke Barometer. De software achter die website verwerkt dagelijks ongeveer 1000 online nieuwsartikelen en meer dan 200 000 tweets.

“Taaltechnologie maakt het mogelijk om automatisch te bepalen waarover een tekst gaat en of het sentiment ervan eerder positief of eerder negatief is”, legt Daelemans uit. “Voor dit project willen we uitvissen welk sentiment er wordt uitgedrukt over politici en partijen en over bepaalde nieuwsdossiers.”

Sleutelwoorden en context

Om het onderwerp van een tekst te achterhalen screent de software op sleutelwoorden die gebruikt worden om te communiceren over specifieke politieke thema’s, zoals huisvesting en klimaat. Om het sentiment van een tekst te bepalen wordt er gekeken naar de context waarin een partij, politicus of dossier wordt genoemd. Met behulp van woordenlijsten wordt de positieve of negatieve lading van de woorden in die context bepaald.

“Zo kunnen we doorheen de tijd automatisch opvolgen hoe vaak en op welke manier er over specifieke politici, partijen en thema’s wordt gepraat in de pers en op Twitter”, aldus Kreutz. “We kunnen ook nagaan hoe vaak bepaalde politieke thema’s geassocieerd worden met politici en partijen.”

Negatief sentiment blijft laag

Sinds de laatste week van maart analyseert www.politiekebarometer.be de tweets en de online nieuwsberichten. Enkele opvallende voorlopige conclusies:

- De N-VA domineert het debat, vooral op Twitter. Per dag werd N-VA of een van haar politici in gemiddeld 2000 tweets vernoemd. Bij de andere partijen ligt dat aantal gemiddeld drie keer lager. In het online nieuws is de N-VA eveneens veruit de meest aanwezige partij, maar is het verschil met de andere partijen wel kleiner. Op Twitter is ook Groen beduidend meer aanwezig dan de regeringspartijen CD&V en Open VLD.

-  De dominantie van de N-VA kan minstens gedeeltelijk op conto geschreven worden van Theo Francken. Hij werd op een maand tijd meer dan 14 000 keer genoemd op Twitter. Naast Bart De Wever en Jan Jambon vinden we in de top vijf ook de groene politici Kristof Calvo en Meyrem Almaci. Als we enkel kijken naar het online nieuws komen ook de liberale politici Maggie De Block en premier Michel duidelijker in beeld.

- Het sentiment van de partijen op Twitter is (voorlopig) opvallend stabiel. Over de meeste Vlaamse partijen wordt met name in neutrale of positieve termen gesproken, terwijl het negatief sentiment laag blijft.

- In de online campagne staat voorlopig niet één thema centraal. De meeste partijen worden gelinkt aan een brede waaier aan onderwerpen als mobiliteit, onderwijs, migratie en arbeid. De meer concrete dossiers pensioenen en salariswagen overheersten de debatten de laatste maand het duidelijkst. In berichten over de pensioenen werden politici van N-VA het vaakst genoemd terwijl in de discussie over de salariswagen politici van Groen centraal stonden. Het Marrakesh-pact, waarover de regering is gevallen, wordt de laatste weken erg weinig genoemd, al blijft het bredere thema van migratie wel prominent aanwezig in het debat. Het dossier kilometerheffing kreeg in het begin van april veel aandacht in het nieuws en op Twitter, maar is in de loop van de maand bijna volledig uit het online debat verdwenen.

Geen voorspellende waarde

De onderzoekers geven aan dat het systeem niet de ambitie heeft om de uitslag van de verkiezingen te voorspellen. “Deze methode kent haar beperkingen”, zegt Daelemans. “Het proces verloopt volledig automatisch en is niet perfect. Zo zit de accuraatheid van automatische taalkundige analyse van sentiment bijvoorbeeld rond 90%. Trends zullen dus correct gedetecteerd zijn, maar individuele tweets en persberichten kunnen geregeld fout geanalyseerd worden.”

 



Link: