Analys

Hur stort urval behövs för signifikans?

21 april 2026 · 7 min läsning

Vår databas rymmer över 100 Eurojackpot-dragningar och växer för varje dragning. Det är mycket data — men räcker det för att dra tillförlitliga slutsatser om vilka nummer som är "heta" eller "kalla"? Vi dyker ner i statistiken.

Problemet med små urval

Lotteristatistik bygger på lagen om stora tal: ju fler dragningar du observerar, desto närmare sann frekvens kommer observerade utfall att ligga. Med bara några dragningar är variansen enorm. Men även med hundra dragningar finns fortfarande betydande slumpmässiga avvikelser.

I varje Eurojackpot-dragning väljs 5 nummer av 50. Det betyder att varje nummer har en chans på 5/50 = 10% att komma med i varje dragning. Efter 100 dragningar är det förväntade värdet för hur ofta varje nummer dragits:

10,4

Förväntat antal gånger varje nummer ska ha dragits efter 104 dragningar. Men spridningen är stor — det är inte konstigt att se variationer mellan 5 och 17 träffar.

Vad är statistisk signifikans?

Ett resultat kallas statistiskt signifikant när sannolikheten för att det beror på slump är mycket liten — oftast under 5 %. Det mäts med en så kallad z-score:

Z-score mellan -1,96 och +1,96: Inom förväntad slumpvariation
Z-score över ±1,96: Statistiskt signifikant avvikelse (95 % nivå)
Z-score över ±2,58: Mycket signifikant (99 % nivå)

För våra 100+ Eurojackpot-dragningar är standardavvikelsen ungefär 3,06. Det betyder att för att ett nummer ska räknas som statistiskt "hetare" än förväntat, måste det ha dragits minst 16-17 gånger. För att räknas som "kallare" måste det ha dragits högst 4-5 gånger.

Praktiskt exempel

Nummer 20 har i vår data en z-score på +2,41. Det är över tröskeln 1,96, vilket antyder att det är något överrepresenterat. Men det kan också vara slumpvariation — vid 20 nummer testade är det ganska troligt att något nummer kommer hamna över tröskeln bara av slump.

Hur stort urval behövs egentligen?

En snabb tumregel: ju mer exakt du vill kunna uttala dig, desto fler dragningar behöver du. Här är en ungefärlig guide för felmarginalen vid 95 % konfidens:

Antal dragningar	Felmarginal (±)	Tolkning
50	4,2 träffar	Mycket grov uppskattning
100	3,0 träffar	Hyfsad, våra data här
500	1,3 träffar	Ganska precis
1000	0,9 träffar	Mycket precis
5000	0,4 träffar	Nästan exakt konvergens

Med andra ord: även med våra 100+ dragningar kan ett nummer "råka" ligga 3 träffar högre eller lägre än förväntat utan att det betyder något statistiskt. Du behöver tusentals dragningar för att kunna säga något med hög precision om enskilda nummers frekvens.

Problemet med multipelt testande

Det finns en till fälla. När du testar många hypoteser samtidigt ökar risken för falska positiva. Med 50 nummer att testa på 95 % signifikansnivå förväntar du dig att ungefär 2,5 nummer hamnar över tröskeln även om alla är helt slumpmässiga.

Det kallas family-wise error rate. Det är varför man måste vara försiktig med att dra stora slutsatser från "heta" eller "kalla" nummer — även i stora urval.

Vad det betyder i praktiken

Vi är transparent med detta i vår app. Varje frekvenstabell visar både observerad frekvens och z-score så du kan se om avvikelsen faktiskt är anmärkningsvärd eller bara slumpmässig variation.

Vår slutsats: på 100+ dragningar finns det praktiskt taget inget starkt bevis för att något nummer har "hetare" eller "kallare" sannolikhet än 10 %. Resultat som ser anmärkningsvärda ut är oftast bara slumpens bullriga natur.

Slutsats

Använd frekvensstatistik för att förstå historisk variation — inte för att förutsäga framtida dragningar. All seriös analys bör redovisa osäkerhet, inte bara råa tal.

Hur stort urval behövs för signifikans?

Problemet med små urval

Vad är statistisk signifikans?

Hur stort urval behövs egentligen?

Problemet med multipelt testande

Vad det betyder i praktiken

Se datan själv.