Hypergeometrisk distribution (definition, formel) - Hur man beräknar?

Definition av hypergeometrisk distribution

I statistiken och sannolikhetsteorin är hypergeometrisk fördelning i grunden en distinkt sannolikhetsfördelning som definierar sannolikheten för k-framgångar (dvs några slumpmässiga dragningar för objektet som har någon specificerad funktion) i n antal dragningar, utan någon ersättning, från en given befolkningsstorlek N som innehåller exakt K-objekt som har den funktionen, där dragningen kan lyckas eller misslyckas.

Formeln för sannolikheten för en hypergeometrisk fördelning härleds med hjälp av ett antal objekt i populationen, antal artiklar i urvalet, antal framgångar i populationen, antal framgångar i urvalet och få kombinationer. Matematiskt representeras sannolikheten som,

P = K C k * (N - K) C (n - k) / N C n

var,

  • N = antal artiklar i befolkningen
  • n = Antal artiklar i provet
  • K = Antal framgångar i befolkningen
  • k = antal framgångar i urvalet

Medelvärdet och standardavvikelsen för en hypergeometrisk fördelning uttrycks som,

Medelvärde = n * K / N Standardavvikelse = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Förklaring

Steg 1: För det första, bestäm det totala antalet objekt i befolkningen, vilket betecknas med N. Till exempel är antalet spelkort i en kortlek 52.

Steg 2: Bestäm sedan antalet objekt i provet, betecknat med n-till exempel antalet kort som dras från kortlek.

Steg 3: Bestäm sedan de tillfällen som kommer att anses vara framgångar i befolkningen, och det betecknas med K. Till exempel antalet hjärtan i det totala däcket, som är 13.

Steg 4: Bestäm sedan de tillfällen som kommer att betraktas som framgångar i det dragna provet och det betecknas med k. Till exempel antalet hjärtan i korten som dras från kortlek.

Steg 5: Slutligen härleds formeln för sannolikheten för en hypergeometrisk fördelning med ett antal objekt i populationen (steg 1), antal artiklar i urvalet (steg 2), antal framgångar i befolkningen (steg 3) och antalet framgångar i provet (steg 4) såsom visas nedan.

P = K C k * (N - K) C (n - k) / N C n

Exempel på hypergeometrisk distribution (med Excel-mall)

Exempel 1

Låt oss ta exemplet med en vanlig kortlek med spelkort, där 6 kort dras slumpmässigt utan utbyte. Bestäm sannolikheten för att dra exakt fyra röda svitkort, dvs. diamanter eller hjärtan.

  • Givet, N = 52 (eftersom det finns 52 kort i en vanlig spellek)
  • n = 6 (antal kort som dras slumpmässigt från kortlek)
  • K = 26 (eftersom det finns 13 röda kort vardera i diamanter och hjärtsvit)
  • k = 4 (Antal röda kort som ska anses vara framgångsrika i det dragna provet)

Lösning:

Därför kan sannolikheten för att dra exakt 4 röda svitkort i de dragna 6 korten beräknas med formeln ovan som,

Sannolikhet = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C 4 * 26 C två / 52 C 6

= 14950 * 325/20358520

Sannolikheten kommer att vara -

Sannolikhet = 0.2387 ~ 23.87%

Därför är det 23,87% sannolikhet att dra exakt 4 röda kort medan du drar 6 slumpmässiga kort från en vanlig kortlek.

Exempel 2

Låt oss ta ytterligare ett exempel på en plånbok som innehåller 5 $ 100-räkningar och 7 $ 1-räkningar. Om fyra räkningar väljs slumpmässigt, bestäm sedan sannolikheten för att välja exakt 3 $ 100 räkningar.

  • Angivet, N = 12 (Antal $ 100 räkningar + Antal $ 1 räkningar)
  • n = 4 (antal slumpmässigt valda räkningar)
  • K = 5 (eftersom det finns 5 $ 100 räkningar)
  • k = 3 (Antal $ 100 räkningar som ska anses vara en framgång i det valda urvalet)

Lösning:

Därför kan sannolikheten att välja exakt 3 $ 100 räkningar i de slumpmässigt valda 4 räkningarna beräknas med formeln ovan som,

Sannolikhet = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C en / 12 C 4

= 10 * 7/495

Sannolikheten kommer att vara -

Sannolikhet = 0,1414 ~ 14,14%

Därför är det 14,14% sannolikhet att välja exakt 3 $ 100 räkningar medan du drar 4 slumpmässiga räkningar.

Relevans och användningsområden

Begreppet hypergeometrisk fördelning är viktigt eftersom det ger ett exakt sätt att bestämma sannolikheterna när antalet försök inte är ett mycket stort antal och att prover tas från en begränsad population utan ersättning. I själva verket är den hypergeometriska fördelningen analog med binomialfördelningen, som används när antalet försök är väsentligt stort. Emellertid används hypergeometrisk fördelning huvudsakligen för provtagning utan ersättning.

Intressanta artiklar...