Skewness - Betydelse, typer och exempel

Innehållsförteckning

Skewness Betydelse

Skewness Betydelse

Skewness beskriver hur mycket statistisk datafördelning är asymmetrisk från normalfördelningen, där fördelningen är lika uppdelad på varje sida. Om en fördelning inte är symmetrisk eller normal är den sned, dvs den är antingen frekvensfördelningen snedställd till vänster eller till höger sida.

Typer av skevhet

Om fördelningen är symmetrisk har den en snedhet på 0 och dess medelvärde = median = läge.

Så i princip finns det två typer -

Positiv : Fördelningen är positivt skev när det mesta av distributionsfrekvensen ligger på höger sida av distributionen och har en längre och fetare höger svans. Där distributionens medelvärde> median> läge.
Negativ : Fördelningen är negativt skev när det mesta av distributionsfrekvensen ligger på vänster sida av distributionen och har en längre och fetare vänster svans. Där distributionens medelvärde <Median <-läge.

Formel

Skewness formula visas som nedan -

Det finns flera sätt att beräkna snedvridningen av datafördelningen. En av dem är Pearsons första och andra koefficienter.

Pearsons första koefficienter (Mode Skewness): Den är baserad på distributionens medelvärde, läge och standardavvikelse.

Formel: (medelvärde) / standardavvikelse.

Pearsons andra koefficienter (Median Skewness): Den är baserad på medelvärdet, medianen och standardavvikelsen för fördelningen.

Formel: (medelvärde - median) / standardavvikelse.

Som du kan se ovan har Pearsons första skevhetskoefficient ett läge som en variabel för att beräkna det och det är bara användbart när data har ett mer repetitivt antal i datamängden, som om det bara finns några få repetitiva data i data som hör till läget, då är Pearsons andra snedhetskoefficient ett mer tillförlitligt mått på central tendens eftersom det anser att medianen för datamängden istället för läge.

Till exempel:

Datauppsättning (a): 7,8,9,4,5,6,1,2,2,3.

Datamängd (b): 7,8,4,5,6,1,2,2,2,2,2,2,2,2,2,2,3.

För båda datamängderna kan vi dra slutsatsen att läget är 2. Men det är inte meningsfullt att använda Pearsons första skevhetskoefficient för datamängden (a) eftersom dess nummer 2 bara visas två gånger i datamängden, men det kan användas att göra för datauppsättning (b) eftersom den har ett mer repetitivt läge.

Ett annat sätt att beräkna skevhet med formeln nedan:

= Slumpmässig variabel.
X = fördelningsmedelvärde.
N = Total variabel i fördelningen.
α = standardavvikelse.

Exempel på skevhet

För att förstå detta koncept mer detaljerat, låt oss titta på exemplet nedan:

I XYZ management college överväger 30 sista årsstudenter anställning i QPR-forskningsföretaget och deras ersättningar baseras på studentens akademiska prestationer och tidigare arbetslivserfarenhet. Nedan visas uppgifter om studenters ersättning i PQR-forskningsföretaget.

Lösning

Använd nedanstående data

Beräkning av fördelningsmedelvärde

= ($ 400 * 12 + $ 500 * 8 + $ 700 * 5 + $ 850 * 3 + $ 1000 * 2) / 30
Distributionsmedelvärde = 561,67

Beräkning av standardavvikelse

Standardavvikelse = √ ((Summan av avvikelsefyrkanten * Antal studenter) / N).
Standardavvikelse = 189,16

Beräkning av skevhet kan göras enligt följande -

Skewness: (summan av Deviation Cube) / (N-1) * Standardavvikelsens Cube.
= (106374650.07) / (29 * 6768161.24)
= 0,54

Därför berättar värdet 0,54 oss att distributionsdata är något snedställda från normalfördelningen.

Fördelar

Skevhet är bättre att mäta resultatet för investeringsavkastningen.
Investeraren använder detta när man analyserar datamängden eftersom den tar hänsyn till distributionens yttersta än att bara förlita sig på
Det är ett allmänt använt verktyg i statistiken eftersom det hjälper till att förstå hur mycket data som är asymmetrisk från normalfördelningen.

Nackdelar

Skevhet sträcker sig från negativ oändlighet till positiv oändlighet och det blir ibland svårt för en investerare att förutsäga trenden i datamängden.
En analytiker förutspår en tillgångs framtida resultat med hjälp av den finansiella modellen, som vanligtvis förutsätter att data distribueras normalt, men om distributionen av data är sned, återspeglar den här modellen inte det faktiska resultatet i sitt antagande.

Betydelse

I statistik spelar det en viktig roll när distributionsdata inte normalt distribueras. De extrema datapunkterna i datamängden kan leda till att datadistribution snedställs åt vänster (dvs extrema data i datamängden är mindre, den snedställda datamängden är negativ vilket resulterar läge). Det hjälper en investerare som har en kortvarig innehavsperiod att analysera data för att identifiera trenden, som faller i yttersta änden av distributionen.

Slutsats

Skakhet är helt enkelt hur mycket datauppsättning som avviker från dess normala distribution. Ett större negativt värde i datamängden innebär att distributionen är negativt skev och större positivt värde i datamängden innebär att distributionen är positivt fördelad. Det är ett bra statistiskt mått som hjälper investeraren att förutsäga avkastning från distributionen.