Als boter de scheidingskans vergroot, moet je op gaan passen

statistiek

Het eten van margarine vergroot de kans op een scheiding. U zou het bijna geloven als u de statistieken van Tyler Vigen ziet. Hij wil laten zien dat we zelfs op harde cijfers gebaseerde statistieken niet als zoete koek moeten slikken.

Tussen 2004 en 2005 daalde het aantal scheidingen in de Amerikaanse staat Maine van 4,3 op 1000 mensen naar 4,1 op 1000 mensen. Tegelijkertijd daalde de hoeveelheid boter die per hoofd in de VS genuttigd werd. Tussen 2005 en 2006 steeg het aantal scheidingen in dezelfde staat iets. Net als de consumptie van boter. Tussen 2007 en 2009 daalde het aantal scheidingen weer. Net als de consumptie van boter. Het is overduidelijk: er is een correlatie tussen het aantal scheidingen in Maine en de consumptie van boter per hoofd in de VS (zie ook de grafiek hieronder). En niet zomaar een correlatie. Een correlatie van 99 procent.

Het aantal scheidingen in Maine afgezet tegen de boterconsumptie in de VS. Afbeelding: Tyler Vigen.
Het aantal scheidingen in Maine afgezet tegen de boterconsumptie in de VS. Afbeelding: Tyler Vigen.

Causaal verband
Men zou bijna – en nu komt het – denken dat er daadwerkelijk een verband is tussen de boterconsumptie en de kans op een scheiding. Statistici zullen zich doorgaans verre houden van een dergelijke conclusie. Zij hebben geleerd dat zelfs een ijzersterke correlatie niet mag leiden tot de conclusie dat er sprake is van een causaal verband.

Nicolas Cage en verdrinken in een zwembad
Toch is het niet ongebruikelijk dat wetenschappers op een correlatie stuiten en vervolgens voorzichtig suggereren dat er toch echt een causaal verband is. Tegen die onderzoekers wil Vigen ons waarschuwen met zijn leerzame en tegelijkertijd grappige site Spurious correlations. Op de site staan tal van ijzersterke correlaties die overduidelijk niet het resultaat zijn van een causaal verband. Zo gaat het aantal mensen dat verdronken is door een val in een zwembad gelijk op met het aantal films waarin Nicolas Cage speelt. Daalt het aantal zwembaddoden, dan daalt ook het aantal Nicolas-Cage films en omgekeerd (correlatie van 67 procent). En het budget dat de Verenigde Staten spendeert aan wetenschap, ruimtevaart en technologie gaat gelijk op met het aantal zelfmoorden door ophanging, wurging of verstikking (correlatie van 99 procent). En het aantal mensen dat verdronk na een val uit een vissersboot gaat gelijk op met het aantal huwelijken in Kentucky (correlatie van 95 procent).

Budget van de VS voor wetenschap, ruimtevaart en technologie afgezet tegen het aantal zelfmoorden door ophanging, wurging en verstikking. Afbeelding: Tyler Vigen.
Budget van de VS voor wetenschap, ruimtevaart en technologie afgezet tegen het aantal zelfmoorden door ophanging, wurging en verstikking. Afbeelding: Tyler Vigen.
Manipuleren

Ze lijken zo ondubbelzinnig: statistieken met keiharde cijfers. Maar schijn bedriegt. Want als iets goed te manipuleren is, dan zijn het wel statistieken. Bekijk hier enkele interessante manieren om – ongezien – met statistieken te knoeien.

Aan de slag
U kunt ook zelf aan de slag op de site van Vigen. U kunt een variabele kiezen die u interessant vindt (bijvoorbeeld zonlicht of het aantal scheidingen in Amerikaanse staat x) en vervolgens zoekt de site naar een correlatie met een totaal andere variabele (bijvoorbeeld het aantal advocaten in diezelfde staat).

Hand in hand
Vigen wil met zijn site – die gegevens uit verschillende databases haalt – laten zien dat zelfs ijzersterke correlaties vaak toeval zijn. Zaken die totaal niets met elkaar ophebben, kunnen in een grafiek hand in hand lijken te gaan. En wanneer zaken niet hand in hand lijken te gaan, past Vigen de grafieken zo aan dat het toch lijkt alsof er een verband is. In het geval van Nicolas Cage bijvoorbeeld. De statistieken maken melding van één tot vier films per jaar. Door de schaal van de grafiek aan te passen, is het niet moeilijk om de lijn van zijn films overeen te laten komen met de lijn van een andere variabele.

Het aantal films van Nicolas Cage afgezet tegen het aantal mensen dat na een val in een zwembad verdronk. Afbeelding: Tyler Vigen.
Het aantal films van Nicolas Cage afgezet tegen het aantal mensen dat na een val in een zwembad verdronk. Afbeelding: Tyler Vigen.

Als het aan Vigen ligt, worden we een stuk kritischer als het om statistieken gaat. Een correlatie alleen mag nooit een reden zijn om een causaal verband te vermoeden. En als een causaal verband geopperd wordt, moet daar significant bewijs voor worden aangevoerd.

Bronmateriaal

"Spurious Correlations" - Tylervigen.com
De foto bovenaan dit artikel is gemaakt door iamwahid (via Freeimages.com).

Fout gevonden?

Voor jou geselecteerd