Door Anoniem: Dit lijkt wel een reactie van trol die in de repeteerstand staat en weinig leervermogen toont en veel framed.
Om dat balletje terug te spelen: het is juist een reactie op jouw repeteerstand, in de hoop dat jij wat leervermogen toont.
De aantallen vraag is gewoon een legitieme vraag.
Het is inderdaad een legitieme vraag. Maar het is niet legitiem om een serieus antwoord op die vraag als getrol op te vatten, simpelweg omdat het antwoord niet bevestigt wat je al denkt. Probeer dus even open te staan voor de mogelijkheid dat
jij iets kan leren.
Meer dan het 2-voudige blijft meer dan het 2-voudige, ongeacht de aantallen of het om tientallen gaat of niet.
Het punt is dat dat 2-voudige geen betrouwbaar gegeven is bij kleine aantallen. Dit is een basaal inzicht uit de kansrekening. Hoe kleiner het aantal hoe groter de relatieve invloed van toevallige afwijkingen; hoe slechter de signaal-ruisverhouding dus. Dat betekent dat die factor 2 verschil, dankzij de kleine aantallen, ver naast de realiteit kan zitten.
Dat het toeval kan zijn of iets anders - een dieper liggende oorzaak - dat blijft dus de vraag.
Het belangrijke inzicht dat ik je probeer bij te brengen is dat naarmate de aantallen kleiner worden de impact van toeval onvermijdelijk groter wordt. Dat betekent op zich niet dat er geen dieperliggende oorzaak is, het betekent dat die cijfers niet geschikt zijn om die te herkennen. Je
kan simpelweg niet onderscheiden of er werkelijk iets aan de hand is als toeval alleen al dit soort grote verschillen veroorzaakt.
Met een klein Python-programmaatje kan een simulatie van de situatie gedaan worden. Ik heb daarin aangenomen dat de kans op overlijden na een booster voor Pfizer en Moderna gelijk is, en ik schat hem op het gemiddelde van die 15 en 37 gevallen per (ongeveer) 4,2 miljoen geboosterde mensen, op 26 per 4,2 miljoen dus. Ik herhaal de simulatie met een kans op overlijden die 10x en 100x zo groot is, een kans van 260 en 2600 doden op 4,2 miljoen mensen dus, om te laten zien hoe dat de uitkomsten beïnvloedt.
Dit is het programmaatje:
p = 26 / 4200000
print("Aantal doden bij een kans van 26 op 4.200.000:",
sorted(sum(random.random() < p for i in range(4200000))
for i in range(100)))
p = 260 / 4200000
print("Aantal doden bij een kans van 260 op 4.200.000:",
sorted(sum(random.random() < p for i in range(4200000))
for i in range(100)))
p = 2600 / 4200000
print("Aantal doden bij een kans van 2.600 op 4.200.000:",
sorted(sum(random.random() < p for i in range(4200000))
for i in range(100)))
De drie keer gebruikte expressie
sorted(sum(random.random() < p for i in range(4200000)) for i in range(100))) doet al het rekenwerk, en die werkt als volgt:
•
random.random() geeft een toevallige waarde tussen 0 en 1, waarbij de kans voor elke waarde tussen 0 en 1 gelijk is.
•
random.random() < p kijkt of de uitkomst kleiner is dan de kans
p. Omdat de kansverdeling tussen 0 en 1 van random.random() gelijkmatig verdeeld is is de kans dat de uitkomst van die test waar is gelijk aan de kans
p. Dat dient als simulatie of één persoon wel of niet sterft, als de kans op sterven
p is.
•
random.random() < p for i in range(4200000) voert die simulatie 4,2 miljoen keer uit. We kijken dus welke van 4,2 miljoen mensen sterven in de simulatie. Elk van die mensen loopt afzonderlijk de kans
p om te sterven.
•
sum(...) telt de uitkomsten op. Dat levert het aantal doden per 4,2 miljoen op, omdat in Python de uitkomst True (waar) gelijk is aan het getal 1 en False (onwaar) gelijk is aan 0. De waarde 15 in de tabel voor Pfizer en 37 voor Moderna zijn ook aantallen doden per (ongeveer) 4,2 miljoen mensen; daar kan je deze getallen dus rechtstreeks mee vergelijken.
•
sum(...) for i in range(100) zorgt dat de simulatie over 4,2 miljoen mensen 100 keer wordt uitgevoerd.
•
sorted(...) zet die uitkomsten op volgorde van klein naar groot, zodat ze makkelijker te overzien zijn.
Een heel belangrijk punt om te begrijpen bij kansen is dat je bij een kans van (bijvoorbeeld) 26 doden op 4,2 miljoen gevaccineerden
niet exact die 26 doden te zien krijgt in 4,2 miljoen mensen. Kansen werken niet met een tellertje over het totaal dat precies moet kloppen, in plaats daarvan speelt toeval individu voor individu, zonder rekening te houden met het totaal. Vergelijk het met een dobbelsteen: de kans dat je 6 werpt is 1/6, maar dat wil niet zeggen dat je elke 6 worpen precies één keer 6 gooit, dat fluctueert enorm.
Een run van het simulatieprogamma geeft deze uitkomst (verschillende runs zijn vergelijkbaar maar niet identiek, want toeval speelt nou eenmaal een rol):
Aantal doden bij een kans van 26 op 4.200.000: [12, 14, 17, 18, 18, 18, 19, 19, 19, 20, 21, 21, 21, 21, 22, 22, 22, 22, 22, 22, 22, 22, 22, 22, 22, 23, 23, 23, 23, 23, 23, 23, 23, 23, 23, 24, 24, 24, 24, 24, 24, 24, 25, 25, 25, 25, 25, 25, 25, 25, 25, 26, 26, 26, 26, 26, 26, 26, 26, 27, 27, 27, 27, 27, 27, 27, 27, 28, 28, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 31, 31, 31, 32, 32, 32, 32, 33, 33, 33, 34, 34, 35, 36, 40, 41, 41]
Aantal doden bij een kans van 260 op 4.200.000: [230, 233, 235, 237, 237, 238, 238, 238, 238, 239, 240, 241, 242, 242, 242, 243, 243, 243, 243, 244, 244, 245, 246, 247, 247, 247, 248, 248, 248, 249, 249, 249, 250, 250, 251, 251, 252, 252, 252, 252, 253, 253, 253, 254, 254, 255, 255, 256, 256, 257, 257, 257, 257, 258, 258, 260, 261, 261, 262, 262, 263, 263, 263, 264, 264, 264, 265, 265, 265, 266, 266, 266, 266, 267, 268, 268, 270, 271, 272, 272, 272, 272, 272, 274, 275, 275, 275, 276, 276, 276, 277, 280, 281, 284, 291, 291, 292, 295, 297, 307]
Aantal doden bij een kans van 2.600 op 4.200.000: [2494, 2503, 2508, 2514, 2517, 2521, 2523, 2527, 2535, 2539, 2541, 2542, 2543, 2547, 2549, 2550, 2551, 2551, 2554, 2556, 2559, 2561, 2562, 2562, 2564, 2565, 2569, 2569, 2569, 2573, 2578, 2581, 2582, 2582, 2584, 2587, 2588, 2589, 2592, 2593, 2593, 2593, 2595, 2596, 2598, 2598, 2599, 2601, 2602, 2609, 2610, 2611, 2611, 2611, 2612, 2613, 2614, 2618, 2619, 2620, 2620, 2622, 2624, 2624, 2625, 2626, 2626, 2628, 2629, 2629, 2631, 2632, 2637, 2638, 2639, 2639, 2639, 2640, 2640, 2643, 2644, 2644, 2646, 2646, 2647, 2650, 2651, 2654, 2656, 2660, 2663, 2663, 2666, 2668, 2670, 2680, 2682, 2698, 2705, 2715]
Bij een kans van 26 doden op 4,2 miljoen mensen lopen de uitkomsten van 12 tot 41. De uitersten schelen een factor 3,4; meer dan de factor van ongeveer 2,47 die je tussen Pfizer en Moderna ziet. Het aantal mogelijke combinaties met een factor 2,47 of hoger is fors: 12 kan je daarvoor combineren met alle uitkomsten van 29 of hoger, 41 met alle uitkomsten van 16 of lager, en daartussen zijn nog allerlei andere mogelijkheden. Je kan de uitkomsten van Pfizer en Moderna zien als twee van dergelijke uitkomsten, maar dan niet uitgevoerd in een simulatie maar in de werkelijkheid. De simulaties laten zien hoe sterk de uitkomsten kunnen fluctueren, en dat een factor 2,47 verschil (of meer) makkelijk kan voorkomen.
Als je naar 260 doden per 4,2 miljoen kijkt dan zie je dat de uiterste uitkomsten 230 en 307 zijn. De uitersten schelen slechts een factor 1,33. Bij 2600 doden per 4,2 miljoen zijn de uiterste uitkomsten 2494 en 2715, een factor 1,09 slechts.
Je ziet hier dus heel duidelijk dat toeval een kleinere rol in de verhoudingen gaat spelen naarmate de aantallen doden groter worden. En dat is het punt dat ik maak: door de kleine aantallen doden bij de booster-vaccinaties heb je cijfers waarbij het aandeel van stom toeval in de uitkomsten groot is. Zo groot, zoals mijn simulatie bevestigt, dat die factor 2,47 verschil in uitkomsten stom toeval kan zijn. Dat maakt dat je er domweg niet uit af kan leiden dat Pfizer-boosters twee keer zo veel kans op sterven geven als Moderna-boosters, het signaal verzuipt hier in de ruis.
Door voor zowel de Pfizer- als de Moderna-booster een sterfkans van 26 op 4,2 miljoen aan te nemen claim ik niet dat die kans ook werkelijk gelijk is voor beide vaccins of dat die precies die waarde heeft. Wat mijn simulatie laat zien is dat als je in die omgeving zit de rol van toeval in de uitkomsten zo groot is dat ze niet geschikt zijn om te behandelen alsof dat toeval er niet is. Er zit simpelweg een enorme onzekerheid in die lage tellingen, en die laat zich niet wegredeneren, die is er werkelijk. Als je dat toch doet, en dat doe je tot nu toe, dan maak je een grote beoordelingsfout.
Laat dus je eigen repeteerstand eens los en toon zelf eens wat leervermogen in plaats van wat je niet wilt horen als getrol weg te zetten. Het was geen getrol, het was een bloedserieuze reactie, net als deze reactie bloedserieus is.