Het lijkt koffiedik kijken: voorspellen wat trending topic wordt op Twitter. Maar dat hoeft het niet te zijn, zo tonen wetenschappers aan. Ze ontwikkelden een algoritme dat met een precisie van 95 procent enkele uren van tevoren kan voorspellen welk onderwerp trending topic wordt.

Het algoritme is ontwikkeld door wetenschappers van MIT. Het algoritme kan zeker anderhalf uur en soms zelfs vier tot vijf uur voordat een onderwerp door Twitter aan de lijst met trending topics wordt toegevoegd, al voorspellen welke onderwerpen trending worden.

Hoe werkt het?
Om goede voorspellingen te kunnen doen, moet ook goed naar het verleden gekeken worden. Om een accuraat algoritme te ontwikkelen, moest dus eerst een stukje geschiedenis onder de loep worden genomen. Welke onderwerpen zijn in het verleden trending topic geweest? En welke onderwerpen werden het net niet? En dan de belangrijkste vraag: is er een patroon te ontdekken? Het mooie aan het algoritme is dat het geen aannames maakt over patronen en zich dus echt door de data laat leiden.

Wat is een trending topic?

Een onderwerp is trending topic als het veel vaker dan andere onderwerpen getagd wordt. Vandaag zijn de volgende onderwerpen bijvoorbeeld trending onder Nederlandse gebruikers van Twitter: Sandy, zorgpremie en VVD.

Factoren
Heel concreet kijkt het algoritme naar heel veel verschillende factoren. Zo vergelijkt het bijvoorbeeld veranderingen in het aantal tweets over een nieuw onderwerp met veranderingen in het aantal tweets over onderwerpen die in het verleden net niet of net wel trending werden. Wanneer er eerder onderwerpen trending of niet trending zijn geworden die qua verloop heel sterk lijken op de manier waarop het nieuwe onderwerp zich op Twitter ontwikkelt, dan weegt dat onderwerp zwaarder mee dan andere onderwerpen. Nadat alle vergelijkingen zijn gemaakt en aan al die vergelijkingen en hun uitkomsten een waarde is gehangen, komt het algoritme met een voorspelling.

Proef op de som
En het algoritme is accuraat, zo bleek wel toen wetenschappers de proef op de som namen. Ze gaven hun algoritme 200 onderwerpen die trending werden en 200 onderwerpen die niet trending werden. Het algoritme volgde live tweets en voorspelde vervolgens met een accuraatheid van 95 procent of een onderwerp trending werd of niet. De onderzoekers verwachten dat het percentage nog verder oploopt naarmate het algoritme meer data verzamelt en dus ook nog meer vergelijkingen uit kan voeren.

Maar wat voor nut heeft het algoritme nu precies? Het kan nuttig zijn om trends op Twitter te voorspellen, aangezien Twitter over het algemeen een goed beeld geeft van wat mensen bezighoudt. En dat kan interessant zijn voor bijvoorbeeld overheden en bedrijven. Maar het algoritme hoeft natuurlijk niet per se op Twitter losgelaten te worden. In principe kan het op alles wat door de tijd in kwantiteit verandert, worden toegepast. Denk aan de duur van een busreis, maar bijvoorbeeld ook aan de aandelenbeurs.