Provstorlek (definition, formel) - Beräkna provstorlek

Formel för att bestämma provets storlek på befolkningen

Provstorleksformel hjälper till att beräkna eller bestämma den minsta provstorlek som krävs för att känna till tillräcklig eller korrekt andel av befolkningen tillsammans med konfidensnivån och felmarginalen.

Termen "prov" avser den del av befolkningen som gör det möjligt för oss att dra slutsatser om populationen och det är därför viktigt att urvalets storlek är tillräcklig så att meningsfulla slutsatser kan göras. Med andra ord är det den minsta storlek som behövs för att uppskatta den verkliga befolkningsandelen med erforderlig felmarginal och konfidensnivå. Som sådan är bestämningen av lämplig provstorlek ett av de återkommande problemen i statistisk analys. Dess ekvation kan härledas med hjälp av populationsstorlek, det kritiska värdet för normalfördelningen, provandel och felmarginal.

Provstorlek n = N * (Z 2 * p * (1-p) / e 2 ) / (N - 1 + (Z 2 * p * (1-p) / e 2 )

var,

  • N = Befolkningsstorlek,
  • Z = Kritiskt värde för normalfördelningen vid önskad konfidensnivå,
  • p = Provandel,
  • e = Felmarginal

Hur man beräknar provstorlek? (Steg för steg)

  • Steg 1: För det första, bestäm befolkningsstorleken, vilket är det totala antalet distinkta enheter i din befolkning, och det betecknas med N. (Obs: Om befolkningsstorleken är mycket stor men det exakta antalet inte är känt, använd sedan 100.000 eftersom provstorleken inte förändras mycket för populationer som är större än det.)
  • Steg 2: Bestäm sedan det kritiska värdet för normalfördelningen vid önskad konfidensnivå. Till exempel är det kritiska värdet vid 95% konfidensnivå 1,96.
  • Steg 3: Bestäm sedan provproportionen som kan användas från tidigare undersökningsresultat eller samlas in genom att köra en liten pilotundersökning. (Obs: om man är osäker kan man alltid använda 0,5 som ett konservativt tillvägagångssätt, och det ger största möjliga provstorlek.)
  • Steg 4: Bestäm sedan felmarginalen, vilket är det område inom vilket den verkliga populationen förväntas ligga. (Obs: Mindre felmarginal, mer är precisionen och därmed det exakta svaret.)
  • Steg 5: Slutligen kan provstorleksekvationen härledas med hjälp av populationsstorlek (steg 1), det kritiska värdet för normalfördelningen vid den önskade konfidensnivån (steg 2), provandel (steg 3) och felmarginal ( steg 4) som visas nedan.

Exempel

Exempel 1

Låt oss ta exemplet med en återförsäljare som är intresserad av att veta hur många av deras kunder som köpt ett objekt från dem efter att ha sett deras webbplats en viss dag. Med tanke på att deras webbplats i genomsnitt har 10 000 visningar per dag bestämmer kundernas urvalstorlek som de måste övervaka med en konfidensnivå på 95% med en felmarginal på 5% om:

  • De är osäkra på den aktuella omräkningskursen.
  • De vet från tidigare undersökningar att omvandlingsfrekvensen är 5%.

Given,

  • Befolkningsstorlek, N = 10.000
  • Kritiskt värde vid 95% konfidensnivå, Z = 1,96
  • Felmarginal, e = 5% eller 0,05

1 - Eftersom den nuvarande omvandlingsfrekvensen är okänd, låt oss anta att p = 0,5

Därför kan provstorleken beräknas med formeln som,

= (10 000 * (1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ) / (10000 - 1 + ((1,96 2 ) * 0,5 * (1-0,5) / (0,05 2 ))))

Därför kommer 370 kunder att vara tillräckliga för att få en meningsfull slutsats.

2 - Den nuvarande omvandlingsfrekvensen är p = 5% eller 0,05

Därför kan provstorleken beräknas med formeln ovan som,

= (10.000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (10000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Därför kommer en storlek på 72 kunder att vara tillräcklig för att härleda meningsfull slutsats.

Exempel 2

Låt oss ta exemplet ovan, och i det här fallet, låt oss anta att befolkningsstorleken, dvs. den dagliga webbplatsvisningen, är mellan 100.000 och 120.000, men då är det exakta värdet inte känt. Resten av värdena är desamma, tillsammans med en omvandlingsfrekvens på 5%. Beräkna provstorleken för både 100.000 och 120.000.

Given,

  • Provandel, p = 0,05
  • Kritiskt värde vid 95% konfidensnivå, Z = 1,96
  • Felmarginal, e = 0,05

Därför kan provstorleken för N = 100.000 beräknas som,

= (100000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (100000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Därför kan provstorleken för N = 120 000 beräknas som,

= (120000 * (1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ) / (120000 - 1 + ((1,96 2 ) * 0,05 * (1-0,05) / (0,05 2 ))))

Därför är det bevisat att eftersom befolkningsstorleken ökar till att vara mycket stor blir den irrelevant vid beräkningen av urvalsstorleken.

Relevans och användningsområden

Beräkning av provstorlek är viktigt för att förstå begreppet lämplig provstorlek eftersom det används för validitet av forskningsresultat. Om det är för litet kommer det inte att ge giltiga resultat, medan ett prov är för stort kan slösa bort både pengar och tid. Statistiskt sett används den betydande urvalsstorleken huvudsakligen för marknadsundersökningar, hälsoundersökningar och utbildningsundersökningar.

Intressanta artiklar...