twitter

Twitter geeft een onderzoeksteam van de Universiteit Twente toegang tot twitter-data. De onderzoekers gaan de exclusieve data gebruiken om onderzoek te doen naar de verspreiding en effectiviteit van voorlichtingscampagnes over kanker.

In februari liet Twitter weten dat zij data beschikbaar wilde stellen aan enkele onderzoeksinstellingen. En dat heeft het sociale medium geweten: zo’n 1300 onderzoeksteams wereldwijd dienden een onderzoeksvoorstel in, in de hoop die onderzoeken met behulp van de Twitter-data uit te kunnen voeren. Slechts zes onderzoeksinstellingen kregen daadwerkelijk toegang tot die gegevens. De Universiteit Twente is één van de gelukkigen.

Onnoemelijk veel tweets
“Ons voorstel is gehonoreerd,” bevestigt hoofdaanvrager Tijs van den Broek, werkzaam bij de Universiteit Twente en TNO. “Maar het onderzoek is nog volop in ontwikkeling. We zitten nu in een fase waarin we ons voorstel verder uitwerken.” De data hebben de Twentenaren nog niet. “Wij geven Twitter een aantal sleutelwoorden en vervolgens krijgen wij tweets waarin die sleutelwoorden voorkomen. Het is nog niet helemaal duidelijk wanneer en hoe we die aangeleverd gaan krijgen. Ook weten we nog niet om hoeveel data het precies zal gaan. Waarschijnlijk gaat het om onnoemelijk veel tweets.”

Beter dan scrapen
Waarom is het zo waardevol dat Twitter data verstrekt? In principe hebben onderzoekers toch – net als het grote publiek – altijd toegang tot de tweets? “Wat zo bijzonder is, is dat we nu een volledige dataset krijgen. Als je zelf via Twitter gaat scrapen – oftewel een programmaatje gebruikt om tweets te verzamelen – dan krijg je nooit een volledige dataset, omdat je maar een beperkt aantal tweets per uur mag verzamelen.”

Movember
Die onnoemelijke hoeveelheid tweets gaat Van den Broek, samen met zijn collega’s Michel Ehrenhard, Djoerd Hiemstra en Ariana Need gebruiken om onderzoek te doen naar de effectiviteit van voorlichtingscampagnes over kanker. Een mooi voorbeeld daarvan is ‘Movember’: een campagne die bedoeld is om aandacht te vragen en geld op te halen voor onderzoek naar prostaat- en teelbalkanker. “We gaan kijken hoe die campagne – gekenmerkt door de hashtag #Movember – zich over Twitter verspreidt,” vertelt Van den Broek. “Maar we kijken ook naar tweets waarin die hashtag niet voorkomt. Zo zoeken we bijvoorbeeld naar tweets uit de looptijd van de Movember-campagne om te kijken of er in die tweets meer dan normaal over teelbalkanker gesproken wordt.”

Offline effect
Uiteindelijk hopen de onderzoekers zo te achterhalen hoe een voorlichtingscampagne zich over het sociale medium verspreidt en welke factoren de verspreiding ervan bevorderen of hinderen. “Maar we zullen ook naar de offline effecten gaan kijken. De vraag is dan: heeft wat op Twitter gebeurt ook offline effect?” Een manier om dat te achterhalen, is activiteit op Twitter omtrent een bepaalde campagne naast het geldbedrag te leggen dat de campagne werkelijk heeft binnen weten te halen.

Representatief
Steeds vaker gebruiken onderzoekers sociale media als bron van data. Het is een relatief eenvoudige manier om een grote groep ‘proefpersonen’ te vergaren en te weten te komen wat ze wanneer bezighoudt. Ook hun demografische gegevens (geslacht, leeftijd, locatie) zijn vaak bekend. Toch is er ook wel kritiek op deze manier van onderzoek doen, omdat twijfelachtig is of bepaalde effecten die onder een groep twitteraars optreden, representatief zijn voor de effecten onder de algemene bevolking. “Uit polls blijkt wel dat Nederlandse twitteraars geen goede afspiegeling van de bevolking zijn,” bevestigt Van den Broek. “Het zijn vaak jonge, hoogopgeleide mensen. Maar het is ook niet ons doel om een representatieve survey uit te voeren. Wat wij willen laten zien, is hoe de campagne zich online verspreidt.”

Naar verwachting neemt het onderzoek van Van den Broek en zijn collega’s ongeveer een paar jaar in beslag. En hopelijk weten we dan hoe groot de waarde van een aan kanker gerelateerd (trending) topic op Twitter daadwerkelijk is.