Hur stort urval behövs för signifikans?
Vår databas rymmer över 100 Eurojackpot-dragningar och växer för varje dragning. Det är mycket data — men räcker det för att dra tillförlitliga slutsatser om vilka nummer som är "heta" eller "kalla"? Vi dyker ner i statistiken.
Problemet med små urval
Lotteristatistik bygger på lagen om stora tal: ju fler dragningar du observerar, desto närmare sann frekvens kommer observerade utfall att ligga. Med bara några dragningar är variansen enorm. Men även med hundra dragningar finns fortfarande betydande slumpmässiga avvikelser.
I varje Eurojackpot-dragning väljs 5 nummer av 50. Det betyder att varje nummer har en chans på 5/50 = 10% att komma med i varje dragning. Efter 100 dragningar är det förväntade värdet för hur ofta varje nummer dragits:
Vad är statistisk signifikans?
Ett resultat kallas statistiskt signifikant när sannolikheten för att det beror på slump är mycket liten — oftast under 5 %. Det mäts med en så kallad z-score:
- Z-score mellan -1,96 och +1,96: Inom förväntad slumpvariation
- Z-score över ±1,96: Statistiskt signifikant avvikelse (95 % nivå)
- Z-score över ±2,58: Mycket signifikant (99 % nivå)
För våra 100+ Eurojackpot-dragningar är standardavvikelsen ungefär 3,06. Det betyder att för att ett nummer ska räknas som statistiskt "hetare" än förväntat, måste det ha dragits minst 16-17 gånger. För att räknas som "kallare" måste det ha dragits högst 4-5 gånger.
Nummer 20 har i vår data en z-score på +2,41. Det är över tröskeln 1,96, vilket antyder att det är något överrepresenterat. Men det kan också vara slumpvariation — vid 20 nummer testade är det ganska troligt att något nummer kommer hamna över tröskeln bara av slump.
Hur stort urval behövs egentligen?
En snabb tumregel: ju mer exakt du vill kunna uttala dig, desto fler dragningar behöver du. Här är en ungefärlig guide för felmarginalen vid 95 % konfidens:
| Antal dragningar | Felmarginal (±) | Tolkning |
|---|---|---|
| 50 | 4,2 träffar | Mycket grov uppskattning |
| 100 | 3,0 träffar | Hyfsad, våra data här |
| 500 | 1,3 träffar | Ganska precis |
| 1000 | 0,9 träffar | Mycket precis |
| 5000 | 0,4 träffar | Nästan exakt konvergens |
Med andra ord: även med våra 100+ dragningar kan ett nummer "råka" ligga 3 träffar högre eller lägre än förväntat utan att det betyder något statistiskt. Du behöver tusentals dragningar för att kunna säga något med hög precision om enskilda nummers frekvens.
Problemet med multipelt testande
Det finns en till fälla. När du testar många hypoteser samtidigt ökar risken för falska positiva. Med 50 nummer att testa på 95 % signifikansnivå förväntar du dig att ungefär 2,5 nummer hamnar över tröskeln även om alla är helt slumpmässiga.
Det kallas family-wise error rate. Det är varför man måste vara försiktig med att dra stora slutsatser från "heta" eller "kalla" nummer — även i stora urval.
Vad det betyder i praktiken
Vi är transparent med detta i vår app. Varje frekvenstabell visar både observerad frekvens och z-score så du kan se om avvikelsen faktiskt är anmärkningsvärd eller bara slumpmässig variation.
Vår slutsats: på 100+ dragningar finns det praktiskt taget inget starkt bevis för att något nummer har "hetare" eller "kallare" sannolikhet än 10 %. Resultat som ser anmärkningsvärda ut är oftast bara slumpens bullriga natur.
Använd frekvensstatistik för att förstå historisk variation — inte för att förutsäga framtida dragningar. All seriös analys bör redovisa osäkerhet, inte bara råa tal.