Korrelationsformel - Hur man beräknar? (Steg för steg)

Formel för beräkning av korrelation

Korrelation är ett statistiskt mått mellan två variabler och definieras som förändringen av kvantitet i en variabel motsvarande förändring i en annan och den beräknas genom summering av produkten av summan av den första variabeln minus medelvärdet av den första variabeln till summan av den andra variabeln minus medelvärdet av den andra variabeln dividerad med hela under roten av produkten av kvadrat av den första variabeln minus medelvärdet av den första variabeln i summan av kvadraten av den andra variabeln minus medelvärdet av den andra variabeln.

Korrelationsvärdet är begränsat mellan -1 och +1 och kan tolkas enligt följande:

  • -1: Om det är -1, är variabler kända som perfekt negativt korrelerade. Det betyder att om en variabel rör sig i en riktning, så rör sig en annan i motsatt riktning.
  • 0: Det betyder att variabeln inte har någon korrelation.
  • +1: Om det är +1, är variabler kända som perfekt korrelerade. Båda variablerna rör sig i positiva riktningar.

Om vi ​​har 2 variabler x och y kan korrelationskoefficienten mellan två variabler hittas som:

Korrelationskoefficient = ∑ (x (i) - medelvärde (x)) * (y (i) -medel (y)) / √ (∑ (x (i) -medel (x)) 2 * ∑ (y (i) -medel (y)) 2 )

Var,

  • x (i) = värdet på x i provet
  • Medelvärde (x) = medelvärde för alla värden på x
  • y (i) = värdet på y i provet
  • Medelvärde (y) = medelvärde för alla värden på y

Exempel

Det är enkelt att beräkna korrelationen i Excel. Syntaxen för den använda funktionen är som följer:

Korrelationskoefficient = CORREL (array1, array2)

Exempel nr 1

Låt oss ta samma exempel som vi har tagit ovan för att beräkna korrelation med hjälp av excel.

Lösning:

Nedan visas värdena för x och y:

Beräkningen är som följer.

Grundläggande excelformel = CORREL (array (x), array (y))

Koefficient = +0,95

Eftersom denna koefficient är nära +1 är därmed x och y mycket positivt korrelerade.

Exempel 2

Korrelation är huvudsakligen användbar för att analysera aktiekursen i företag och skapa en aktieportfölj baserat på det.

Låt oss ta reda på korrelationen mellan Apple-aktier och Nasdaq-index baserat på det senaste års aktieprestanda. Apple är ett USA-baserat multinationellt företag som är specialiserat på IT-produkter som iPod, iPad, Mac, etc.

Lösning:

Nedan följer månadsavkastningen för Apple och Nasdaq-aktier för det senaste året:

Låt oss nu ange värdena -

Korrelationskoefficient = ∑ (x (i) - medelvärde (x)). (Y (i) -medel (y)) / √ ∑ (x (i) -medel (x)) 2 ∑ (y (i) - medelvärde (y)) 2

Korrelation mellan Apple och Nasdaq = 0,039 / (√0,0039)

Koefficient = 0,62

Eftersom korrelationen mellan Apple och Nasdaq är positiv är Apple därför positivt korrelerat med Nasdaq.

Exempel # 3

Låt oss nu titta på korrelationen mellan Walmart och Nasdaq-index baserat på det senaste års aktieutvecklingen. Walmart är ett amerikanskt företag som har en stormarknadskedja.

Lösning:

Nedan följer den månatliga utvecklingen mellan Walmart och Nasdaq för det senaste året-

Låt oss nu ange värdena i formeln -

Korrelationskoefficient = ∑ (x (i) - medelvärde (x)). (Y (i) -medel (y)) / √ ∑ (x (i) -medel (x)) 2 ∑ (y (i) - medelvärde (y)) 2

Därför är beräkningen som följer,

Korrelation mellan Walmart och Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Koefficient = 0,12

Vi kan se att Walmart och Nasdaq också är positivt korrelerade men inte lika mycket jämfört med Apple-korrelation med Nasdaq.

Relevans och användning

En korrelationskoefficient är användbar för att fastställa det linjära sambandet mellan två variabler. Den mäter hur en variabel rör sig jämfört med rörelsen för en annan variabel. Den praktiska användningen av denna koefficient är att ta reda på sambandet mellan aktiekursrörelser och den totala marknadsrörelsen. Grunden för denna analys, en aktieanalytiker, kommer att inkludera andelen aktier för att skapa en optimal portfölj med minimal risk. Det är också användbart i datavetenskap att ta reda på förhållandet mellan två variabler.

Dessutom används korrelationskoefficienten mycket högt för att studera konstruktionsgiltigheten av data i faktoranalys. Det används starkt i regressionsanalys för att förutsäga värdena för beroende variabler baserat på sambandet mellan beroende och oberoende variabler. Denna ekvation är ganska användbar i kvantitativ analys för att få karaktären av förhållandet mellan olika variabler. Grunden för detta förhållande, om en variabel inte är relaterad till andra variabler, kan den elimineras från listan.

Intressanta artiklar...