Stats Stats And Damn Lies

Ken je dat? Je zit op een verjaardag, en iemand begint over dat ene onderzoek. "Wist je dat 80% van de mensen tegenwoordig…." vul maar in. Vaak voel je dan al dat er iets niet helemaal klopt. Cijfers! Iedereen gooit ermee, maar wat betekenen ze nou echt? En zijn ze wel zo betrouwbaar als ze klinken?
Nou, welkom in de wondere wereld van statistiek, waar 'stats, stats, and damn lies' de boel nogal eens samenvat. Het is net als koken: je hebt je ingrediënten (data), je recept (de statistische methode), en dan hoop je op een smakelijk resultaat. Maar je kan ook eindigen met een verbrande pan macaroni met pindakaas. Dat gebeurt vaker dan je denkt!
Waarom We Soms Voor De Gek Gehouden Worden
Statistiek is een taal. En net als elke taal, kan je ‘m gebruiken om de waarheid te vertellen… of om iemand stevig bij z’n neus te nemen. Denk maar aan die keer dat je buurman zei dat hij "maar een biertje" had gedronken. Zijn definitie van "een" week waarschijnlijk flink af van de jouwe. Zo werkt het ook met statistiek.
Must Read
Het Probleem met Steekproeven
Stel je voor: je wil weten of alle Nederlanders blij zijn met het weer. Ga je dan élke Nederlander vragen? Nee, natuurlijk niet! Je neemt een steekproef. Maar als je die steekproef alleen neemt op een naturistencamping op een zonnige dag, dan krijg je natuurlijk een vertekend beeld. Representativiteit is het toverwoord. Is de steekproef wel een goede afspiegeling van de hele bevolking? Vaak dus niet.
Of neem nou die politieke peilingen. Die zijn vaak best accuraat… mits iedereen eerlijk antwoord geeft. Maar wie geeft nou toe dat hij of zij stiekem op die partij stemt die ze in de kroeg altijd afkraken? Sociale wenselijkheid, heet dat. Dat beïnvloedt de cijfers enorm.

Correlatie Is Geen Causatie! (De mantra die je moet onthouden)
Dit is een cruciaal punt. Gewoon omdat twee dingen tegelijkertijd gebeuren, betekent dat nog niet dat het ene het andere veroorzaakt. Ik las laatst een onderzoek dat aantoonde dat er een correlatie is tussen de verkoop van ijsjes en het aantal verdrinkingen. Betekent dat dat ijsjes mensen laten verdrinken? Nee! Beide worden simpelweg beïnvloed door het warme weer. Dit is een klassieker!
Denk aan die keer dat je las dat er een verband was tussen het eten van chocola en intelligentie. Wow, chocola maakt je slimmer! Lekker, nog een reep! Maar misschien zijn slimme mensen gewoon eerder geneigd om chocola te eten, of misschien hebben ze meer geld om chocola te kopen. De echte oorzaak kan heel anders liggen, en correlatie = causatie is dus een gevaarlijke aanname.

De Macht van de Mediaan
Gemiddelden kunnen misleidend zijn. Stel, vijf mensen zitten in een bar. Vier hebben een inkomen van 30.000 euro per jaar, en één is Mark Zuckerberg, met een inkomen van miljarden. Het gemiddelde inkomen in die bar is dan astronomisch hoog! De mediaan (de middelste waarde als je alle inkomens op een rijtje zet) geeft dan een veel realistischer beeld. Let dus goed op welke maat er wordt gebruikt!
Een ander voorbeeld: 'De gemiddelde wachttijd voor de huisarts is 10 minuten.' Klinkt prima, toch? Maar wat als 90% van de patiënten 5 minuten wacht, en 10% een uur? Het gemiddelde klopt, maar de ervaring van de meeste mensen is heel anders. Statistiek is een beetje zoals een goocheltruc: het gaat erom hoe je de cijfers presenteert.

Cherry-Picking: De Kers op de Misleidingstaart
Dit is het selectief kiezen van data om een bepaald punt te bewijzen. Je negeert gewoon alle data die jouw verhaal tegenspreken. Stel, je wil aantonen dat jouw nieuwe dieet fantastisch werkt. Je selecteert dan alleen de mensen die succesvol zijn afgevallen, en negeert de rest. "Kijk! 100% succes!" Natuurlijk, als je alleen de goede resultaten laat zien. Dit is pure manipulatie, en helaas komt het veel voor.
Denk aan reclames: "Onze tandpasta beschermt 99% tegen cariës!" Dat klinkt geweldig, maar wat zeggen ze niet? Misschien is de vergelijking gemaakt met iemand die helemaal geen tanden poetst. Of misschien is het onderzoek gefinancierd door… de tandpasta fabrikant zelf! Wees altijd kritisch!

Hoe Je Niet Voor De Gek Gehouden Wordt
Oké, genoeg doemdenken. Hoe kan je nou voorkomen dat je de volgende keer op een verjaardag niet met open mond staat te knikken terwijl iemand je een hoop onzin verkoopt met behulp van cijfers?
- Stel vragen! Wie heeft het onderzoek gedaan? Waar komt de data vandaan? Hoe is de steekproef samengesteld? Welke methode is gebruikt? Durf te vragen!
- Denk na over de bron. Is de bron betrouwbaar? Heeft de bron een agenda? Is de bron objectief? (Spoiler alert: dat is bijna nooit het geval).
- Kijk naar de context. Wat zeggen de cijfers in de context van de situatie? Vergelijk het met andere data. Zoek naar andere bronnen.
- Wees sceptisch. Geloof niet alles wat je leest, ziet of hoort. Zeker niet als het te mooi klinkt om waar te zijn.
- Bedenk dat statistiek een hulpmiddel is, geen waarheid. Het is een manier om inzicht te krijgen, maar het is geen absolute waarheid.
Conclusie: Cijfers zijn net als messen: je kan er brood mee snijden, of iemand mee steken. Het hangt af van de intentie en de vaardigheid van degene die ze hanteert. Dus de volgende keer dat iemand je bombardeert met statistieken, glimlach vriendelijk, knik beleefd, en bedenk: "stats, stats, and damn lies." En dan, denk zelf na.
En onthoud: de beste manier om niet voor de gek gehouden te worden, is door zelf een beetje verstand van zaken te hebben. Een basiscursus statistiek kan wonderen doen! Of gewoon dit artikel nog een keer lezen ;)
