Central Limit Theorem (Definition, Formula) - Beräkningar och exempel

Innehållsförteckning

Central Limit Theorem Definition

Den centrala gränssatsen säger att slumpmässiga prover från en slumpmässig populationsvariabel med någon fördelning kommer att närma sig att vara en normal sannolikhetsfördelning när storleken på provet ökar och det antar att eftersom storleken på provet i populationen överstiger 30, är ​​medelvärdet av urvalet som genomsnittet av alla observationer för urvalet kommer att vara nästan lika med genomsnittet för befolkningen.

Formel för central gränssats

Vi har redan diskuterat att när provstorleken överstiger 30 tar distributionen formen av en normalfördelning. För att bestämma normalfördelningen för en variabel är det viktigt att känna till dess medelvärde och dess varians. En normalfördelning kan anges som

X ~ N (u, a)

Var

  • N = inga observationer
  • µ = medelvärdet av observationerna
  • α = standardavvikelse

I de flesta fall avslöjar observationerna inte mycket i sin råa form. Så det är viktigt att standardisera observationerna för att kunna jämföra det. Det görs med hjälp av z-poängen. Det är nödvändigt att beräkna Z-poängen för en observation. Formeln för att beräkna z-poängen är

Z = (X- µ) / a / √n

Var

  • Z = Z-poäng för observationerna
  • µ = medelvärdet av observationerna
  • α = standardavvikelse
  • n = provstorlek

Förklaring

Den centrala gränssatsen anger att slumpmässiga prover från en slumpmässig populationsvariabel med någon fördelning kommer att närma sig att vara en normal sannolikhetsfördelning när storleken på provet ökar. Den centrala gränssatsen antar att eftersom storleken på provet i populationen överstiger 30, kommer medelvärdet av provet, som genomsnittet av alla observationer för provet, att vara nära lika med genomsnittet för befolkningen. Även standardavvikelsen för provet när storleken på provet överstiger 30 kommer att vara lika med standardavvikelsen för befolkningen. Eftersom urvalet slumpmässigt väljs från hela populationen och storleken på urvalet är mer än 30, hjälper det vid hypotesprovning och konstruktion av konfidensintervallet för hypotesprovningen.

Exempel på formel för central gränssats (med Excel-mall)

Exempel 1

Låt oss förstå begreppet normal distribution med hjälp av ett exempel. Den genomsnittliga avkastningen från en fond är 12% och standardavvikelsen från den genomsnittliga avkastningen för investeringsfonden är 18%. Om vi ​​antar att fördelningen av avkastningen normalt fördelas, låt oss tolka fördelningen för avkastningen i placeringen i fonden.

Given,

  • Den genomsnittliga avkastningen för investeringen blir 12%
  • Standardavvikelsen kommer att vara 18%

Så för att ta reda på avkastningen för ett 95% konfidensintervall kan vi ta reda på det genom att lösa ekvationen som

  • Övre intervall = 12 + 1,96 (18) = 47%
  • Lägre intervall = 12 - 1,96 (18) = -23%

Resultatet betyder att avkastningen från fonden 95% av tiden kommer att ligga i intervallet 47% till -23%. I det här exemplet kommer urvalsstorleken, som är avkastningen av ett slumpmässigt urval på mer än 30 observationer av avkastning, att ge oss resultatet för fondens avkastning för den gemensamma fonden eftersom provfördelningen normalt kommer att fördelas.

Exempel 2

Fortsätt med samma exempel, låt oss bestämma vad som blir resultatet för ett 90% konfidensintervall

Given,

  • Den genomsnittliga avkastningen för investeringen blir 12%
  • Standardavvikelsen kommer att vara 18%

Så för att ta reda på avkastningen för ett 90% konfidensintervall kan vi ta reda på det genom att lösa ekvationen som

  • Övre intervall = 12 + 1,65 (18) = 42%
  • Lägre intervall = 12 - 1,65 (18) = -18%

Resultatet betyder att avkastningen från fonden 90% av tiden kommer att ligga i intervallet 42% till -18%.

Exempel # 3

Fortsätt med samma exempel, låt oss bestämma vad som blir resultatet för ett 99% konfidensintervall

Given,

  • Den genomsnittliga avkastningen för investeringen blir 12%
  • Standardavvikelsen kommer att vara 18%

Så för att ta reda på avkastningen för ett 90% konfidensintervall kan vi ta reda på det genom att lösa ekvationen som

  • Övre intervall = 12 + 2,58 (18) = 58%
  • Lägre intervall = 12 - 2,58 (18) = -34%

Resultatet betyder att avkastningen från fonden för 99% av tiden kommer att ligga i intervallet 58% till -34%.

Relevans och användning

Den centrala gränssatsen är extremt fördelaktig eftersom den gör det möjligt för forskaren att förutsäga medelvärdet och standardavvikelsen för hela befolkningen med hjälp av urvalet. Eftersom urvalet slumpmässigt väljs från hela populationen och storleken på urvalet är mer än 30, kommer alla slumpmässiga urvalsstorlekar som tas från befolkningen att närma sig att distribueras normalt, vilket kommer att hjälpa till vid hypotesprovning och konstruktion av konfidensintervallet för hypotes testning. Baserat på den centrala gränssatsen kan forskaren välja valfritt slumpmässigt urval från hela populationen, och när storleken på provet är mer än 30,då kan den förutsäga populationen med hjälp av urvalet eftersom provet kommer att följa en normalfördelning och också som medelvärdet och standardavvikelsen för provet kommer att vara samma som medelvärdet och standardavvikelsen för befolkningen.

Intressanta artiklar...