Empirisk regel - Definition, formel, hur man använder i statistik?

Vad är den empiriska regeln i statistik?

Empirisk regel i statistik säger att nästan alla (95%) av observationerna i en normalfördelning ligger inom 3 standardavvikelser från medelvärdet. Detta är en mycket viktig regel och hjälper till vid prognoser.

Formel

Formeln visar den beräknade procentandelen observationer som ligger inom varje standardavvikelse från medelvärdet.

Regeln säger att:

  • 68% av observationerna ligger inom +/- 1 standardavvikelse från medelvärdet
  • 95% av observationerna ligger inom +/- 2 standardavvikelser från medelvärdet
  • 7% av observationerna ligger inom +/- 3 standardavvikelser från medelvärdet

Hur man använder?

Detta används i prognosutvecklingen för en datamängd. När datamängden är omfattande och det blir svårt att studera hela befolkningen kan Empirisk regel tillämpas på urvalet för att få en uppskattning av hur uppgifterna i befolkningen kommer att reagera om du blir ombedd att hitta den genomsnittliga lönen för alla revisorerna i USA. Då är det en svår uppgift att utföra eftersom befolkningen är enorm. Så i så fall kan du välja, säg, 90 observationer slumpmässigt från hela befolkningen.

Så nu kommer du att ha 90 löner. Du måste hitta medelvärdet och standardavvikelsen för observationerna. Om observationen följer en normalfördelning kan denna tillämpas och en uppskattning av lönen för alla revisorer i USA kan göras.

Anta att den genomsnittliga lönen för provet blir $ 90.000. Och standardavvikelsen är 5000 dollar. Så av hela befolkningen drar 68% av revisorerna en lön som sträcker sig mellan +/- 1 standardavvikelser från genomsnittet. Eftersom medelvärdet är $ 90.000 och standardavvikelsen är $ 5.000. Så 68% av alla revisorer i USA får betalt inom $ 90.000 +/- (1 * $ 5.000). Det är inom $ 85.000 till $ 95.000

Om vi ​​sprider lite mer får 95% av alla revisorer i USA betalt inom medelvärdet +/- 2 standardavvikelser. 90 000 $ +/- (2 * 5000). Så intervallet är $ 80.000 till $ 100.000.

I ett bredare intervall drar 99,7% av alla revisorer löner från genomsnittliga +/- 3 standardavvikelser. Det är 90 000 +/- (3 * 5000). Området är $ 75.000 till $ 105.000

Du kan tydligt se att utan att studera hela befolkningen kan man göra en uppskattning av befolkningen. Om någon planerar att arbeta som revisor i USA, kan han lätt förvänta sig att hans lön kommer att variera från $ 75 000 till $ 105 000

Denna typ av uppskattning hjälper till att underlätta arbetet och göra prognoser för framtiden.

Empiriska regelexempel

Mr. X försöker hitta det genomsnittliga antalet år som en person överlever efter pension, med tanke på att pensionsåldern är 60. Om medelöverlevnadsåren på 50 slumpmässiga observationer är 20 år och SD är 3, ta reda på sannolikheten att personen drar pension i mer än 23 år

Lösning

Empiriska regeln säger att 68% av observationerna ligger inom 1 standardavvikelse från medelvärdet. Här är medelvärdet av observationerna 20.

68% av observationerna ligger inom 20 +/- 1 (standardavvikelse), vilket är 20 +/- 3. Så intervallet är 17 till 23.

Det finns en chans på 68% att de minsta åren som en person överlever efter pensionen ligger mellan 17 och 23. Nu är andelen som ligger utanför detta intervall (100 - 68) = 32%. 32 fördelas lika på båda sidor, vilket innebär en 16% chans att minimiåren kommer att vara under 17 och en 16% chans att minsta år blir större än 23.

Så sannolikheten för att personen kommer att dra mer än 23 år av pension är 16%.

Empirisk regel mot Chebyshevs sats

Empirisk regel tillämpas på datamängder som följer en normalfördelning som betyder klockformad. I en normal distribution har båda sidor av distributionen 50% sannolikhet vardera.

Om datamängden inte normalt distribueras finns det en annan approximation eller regel som gäller för alla typer av datamängder, vilket är Chebyshevs sats. Det säger tre saker:

  • Minst 3/4 : e av alla observationer kommer att ligga inom 2Standard Avvikelser från medelvärdet. Det är en stark approximation. Det betyder om det finns 100 observationer, därefter 3/4 : e av de iakttagelser som är 75 observationer kommer att ligga inom +/- 2 standardavvikelser från medelvärdet.
  • Minst 8/9: e av alla observationer ligger inom 3 Standardavvikelser från medelvärdet.
  • Minst 1 - 1 / k 2 av alla observationer ligger inom K Standardavvikelser från medelvärdet. Här kallas K vilket som helst heltal.

När ska jag använda?

Data är som guld i den moderna världen. Det finns enorma data som flyter från olika källor och används för olika approximationer eller prognoser. Om en datamängd följer en normalfördelning visar den en klockformad kurva; sedan kan Empirical Rule användas. Den tillämpas på observationer för att skapa en approximation för befolkningen.

När man väl har sett att observationerna visar en normalfördelningsstruktur följs empirisk regel för att hitta flera sannolikheter för observationerna. Regeln är extremt användbar för många statistiska prognoser.

Slutsats

Empirisk regel är ett statistiskt begrepp som hjälper till att skildra sannolikheten för observationer och är mycket användbart när man hittar en approximation av en enorm befolkning. Det bör alltid noteras att dessa är ungefärliga. Det finns alltid chanser för avvikare som inte faller i distributionen. Resultaten är därför inte korrekta och försiktighetsåtgärder bör vidtas när de agerar enligt prognosen.

Intressanta artiklar...