Innovatie

Zoek de scoop: zo vind je nieuwswaardige tweets

0

Gemiddeld worden er wereldwijd per seconde 5700 tweets verstuurd, per dag zo’n 500 miljoen. Als je drie seconden doet over het lezen van een tweet, mis je er dus 17099! Hoe zie je door de bomen het bos nog? Door alleen die twitteraars te volgen die voor jou interessant zijn, maak jij een selectie van dat wat voor jou interessant is. Maar stel je voor dat je als journalist Twitter wil gebruiken om echte nieuwtjes te vinden, hoe doe je dat dan?

Is Twitter sneller dan het nieuws?

Toen het vliegtuig van Turkish Airways neerstortte bij Schiphol, was het nieuws al heel snel op Twitter te vinden. Sneller dan in de reguliere media. Dat is volkomen logisch en het is tevens een foutieve vergelijking. Eerst het logische deel: een bericht op Twitter zetten gaat veel sneller dan het schrijven van een nieuwsbericht. In maximaal 140 tekens meld je wat er volgens jou aan de hand is. Daarnaast is het aantal twitteraars groter is dan het aantal journalisten, wat de kans dat het sneller op Twitter staat dan op de site van een krant of blog, groter maakt.

Een tweet is geen nieuws (of wel?)

Maar een tweet is nog niet per definitie nieuws. Ik heb het dan niet over de tweets van lichamelijk ongemak (“Ik heb zooooo’n kater, echt ziek man”). Neem nou een tweet over een neergestort vliegtuig. Je zult dat toch moeten verifiëren voordat je het op de site van een krant of respectabele blog zet. Zelfs een foto is geen overtuigend bewijs, want wie zegt dat de foto recent is of überhaupt van de vermeende crash? Je wil meer weten voordat je er echt een nieuwsverhaal van kunt maken: om welke maatschappij, welk toestelnummer of vluchtnummer gaat het?

Maar er zit in zo’n tweet natuurlijk wel een verhaal voor een journalist. Je kunt ook wachten tot het topic ‘trending’ wordt, dan is het waarschijnlijker dat het ook echt een nieuwsverhaal begint te worden. Handiger is het echter om nieuws uit tweets te kunnen filteren, voordat het ‘trending’ wordt en daarmee een scoop te hebben als journalist. Maar, hoe doe je dat?

RTreporter filtert de tweets

Sinds 2010 stimuleert het Persinnovatie-fonds journalistieke innovaties. In het eerste jaar kreeg RTreporter honderdduizend euro om de huidige versie van de tool te ontwikkelen. In juni 2013 kreeg RTreporter van het fonds nog eens honderdduizend euro projectsubsidie om het systeem van taaltechnologie (semantiek) te ontwikkelen, dat in RTreporter gebruikt kan worden. Het is een samenwerkingsproject van de Vrije Universiteit Amsterdam (Faculteit der Exacte Wetenschappen) en Ccinq (onderdeel van Ortec).

Wat doet RTreporter?

RTreporter helpt een journalist (landelijk, regionaal of lokaal) met het vinden van nieuws. RTreporter kijkt op Twitter naar berichten die afwijken. Sowieso kun je 80% van het twitterverkeer negeren, dit zijn berichten die alleen van belang of zelfs maar te begrijpen zijn voor een paar of een groep mensen. Denk hierbij aan de al eerder genoemde “Vet ziek man-tweets”. Die worden er uitgefilterd. Wat er overblijft zijn tweets die wel meer betekenis hebben, maar eigenlijk ook ‘normaal’ kunnen zijn. Speelt Ajax of is The Voice of Holland (#TVOH) op televisie, dan is het begrijpelijk dat hier veel tweets over verschijnen of dat deze onderwerpen zelfs ‘trending’ worden.

Ondanks het feit dat ‘trending’ aangeeft dat veel mensen over het onderwerp praten, is het mogelijk nog geen nieuws. Daarnaast is het dan eigenlijk ook al te laat voor een journalist omdat er al heel veel over het onderwerp gecommuniceerd wordt. Het is geen scoop die ze als eerste kunnen brengen.

Waar RTreporter naar op zoek is, is een potentieel nieuwswaardig bericht dat je niet verwacht. En met niet verwacht, bedoel ik: dat je niet verwacht op dat moment. Stel je voor dat The Voice of Holland volgend seizoen niet terugkomt op televisie (een zegen volgens sommigen). Zo’n bericht wordt bijvoorbeeld op maandagochtend verspreid. Op dat moment komen er normaal gesproken niet zo veel #TVOH berichten voor. Dit bericht zal dan gevolgd worden omdat het opvalt. Stel de tweet luidt “The Voice of Holland verdwijnt volgend seizoen van de buis”. Door de keywords ‘verdwijnt’ en ‘The Voice of Holland’ wordt de tweet in de gaten gehouden en zal bij voldoende verkeer opvallen. Opeens komen er heel snel tweets bij die dit bericht ook melden.

Hoe wordt een scoop geïdentificeerd?

Hoe ziet het scherm van RTreporter eruit?

Hieronder het hoofdscherm van RTreporter om even voor 20.00 uur op zondagavond 13 oktober. Blijkbaar komt #sytycd op tv. Want op dit moment is het grootste blok op het scherm daar aan gewijd.

Dat dit klopt, blijkt als we op het tekentje rechts onderin klikken en we naar het overzichtsscherm gaan. Het verkeer over de show komt heel snel op en zal, tenzij er iets heel bijzonders aan de hand is, ook weer op de zelfde manier eindigen, de rest van de week wordt er niet of nauwelijks over getweet.

afb3

Op het scherm zie je nog meer informatie zoals de summary tweet (rechts-bovenaan) die de ontwikkeling weergeeft. Daaronder vind je gerelateerde tweets en in hoeverre deze op het onderwerp slaan. Na tien minuten is #sytycd zeer prominent aanwezig op het hoofdscherm.

afb4

Op het overzichtscherm zie je dat het aantal tweets nu hoger ligt dan vorige week (de piek in de grafiek aan de linkerkant). Ook zie je dat de summary tweet nu anders is, blijkbaar gaat het nu ergens anders over, in dit geval de kledingkeuze van Ann Lemmens.

afb5

Maar de interessante zaken staan niet links op het scherm, maar uiterst rechts. RTreporter is namelijk niet op zoek naar ‘nieuws’ waar we al van weten, maar juist naar datgene wat zich ontpopt als nieuws en wat aan de rechterkant naar voren komt (hier zijn uitzonderingen op, het blok links groeit het hardst ten opzichte van de verwachtingswaarde). Zoals onderstaand voorbeeld, wat duidelijk minder hits heeft (40), maar waar ook niets van verwacht werd (expected is 0.0). Blijkbaar triggeren bepaalde woorden RTreporter om dit te melden.

afb6

Werk aan de winkel

afb7Voor journalisten is het op dit moment nog zaak om het beeldscherm in de gaten te houden. Bij een aantal gebruikers staan een aantal schermen constant op RTreporter ingesteld om de ontwikkelingen bij te houden. Met kleuren wordt ook de groei in verkeer aangegeven.

afb9

Wat kan RTreporter?

Op dit moment is RTreporter in staat om nieuwswaardige tweets te filteren en die te presenteren aan de doelgroep: journalisten. Ik schreef dit artikel op zondagavond, niet de meest nieuwswaardige avond in de week. Een andere dag of een ander tijdstip had heel andere voorbeelden opgeleverd, misschien had ik ook wel een ‘scoop’ gevonden en waren de voorbeelden aansprekender geweest.

De praktijk

Het vervelende is wel dat het erg snel gaat. Gelukkig is daar ook aan gedacht. Door in een clusterblok op het ‘X-teken’ te klikken, kun je het verbergen (of weer terug halen), dit geeft wat rust op het scherm.

afb10

Interessanter is de mogelijkheid om Twitter terug te spoelen. Omdat RTreporter alle tweets opslaat, kun je de ontwikkelingen terugspoelen. Het is echter niet mogelijk om dan door te klikken naar het scherm met de grafiek, die staat op de huidige tijd.

afb 11

RTreporter levert een behoorlijke prestatie met het filteren van tweets. Maar tijdens het gebruik zie je ook wat er nog verbeterd kan worden. Onderstaande tweet kwam ten onrechte boven drijven op zondag, terwijl er niets nieuwswaardigs aan is. Iemand zoekt gewoon een mediatrainer, die gespecialiseerd in crisiscommunicatie in het noorden van het land. Dit komt door het gebruik van keywords zoals ‘crisis’ en ‘land’.

crisi

Als je de zin analyseert snap je dat deze tweet niet over een crisis gaat, maar over een crisismanager die ook nog eens gezocht wordt (niet door de politie maar door iemand die hem wil inhuren). Dit is een mooie illustratie van de uitdaging waar RTreporter voor staat, het goed kunnen analyseren van taal en kennis van de semantiek. Brand is naast vuur ook een biermerk. Aan dergelijke zaken werkt RTreporter het komende jaar, met als doel de tool nog beter en bruikbaarder te maken voor journalisten.

Mijn demo-versie had een beperkte functionaliteit, er waren dashboards ingericht voor Nieuws, Politiek en Sport. Met de ‘echte’ versie kun je custom dashboards maken waarmee je alleen onderwerpen kunt volgen die voor jou van belang zijn. Bijvoorbeeld over zaken in de regio Den Haag, of alleen politiek. Hiermee wordt een sterkere focus aangebracht, dit vermindert de ruis van alle niet relevante tweets.

Potentie

RTreporter heeft de potentie om zich te ontwikkelen tot een waardevolle journalistieke tool. De uitdaging ligt er in om taal-analyses in de tool te brengen, om zo beter het kaf van het koren te kunnen scheiden. Die uitdaging is groot want taal lijkt simpel, maar is zeer complex.