R Squared (R ^ 2) - Definition, Formel, Beräkna R Squared

Innehållsförteckning

Vad är R Squared (R2) i regression?

R-kvadrat (R 2 ) är ett viktigt statistiskt mått som är en regressionsmodell som representerar den andel av skillnaden eller variansen i statistiska termer för en beroende variabel, som kan förklaras av en oberoende variabel eller variabler. Kort sagt bestämmer det hur bra data passar regressionsmodellen.

R kvadratformel

För beräkning av R i kvadrat måste du bestämma korrelationskoefficienten och sedan måste du kvadrera resultatet.

R kvadratformel = r 2

Där r kan korrelationskoefficienten beräknas enligt nedan:

r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))

Var,

  • r = Korrelationskoefficienten
  • n = nummer i den angivna datasetet
  • x = första variabeln i sammanhanget
  • y = andra variabel

Förklaring

Om det finns någon relation eller korrelation som kan vara linjär eller icke-linjär mellan dessa två variabler, ska den ange om det finns en förändring i den oberoende variabeln i värde, då kommer den andra beroende variabeln sannolikt att förändras i värde, säg linjärt eller icke-linjärt.

Täljardelen av formeln utför ett test om de rör sig tillsammans och tar bort sina individuella rörelser och relativa styrka för dem båda som rör sig tillsammans, och nämnarens del av formeln skalar täljaren genom att ta kvadratroten av produkten av skillnaderna i variablerna från deras kvadrerade variabler. Och när du kvadrerar detta resultat får vi R i kvadrat, vilket är ingenting annat än bestämningskoefficienten.

Exempel

Exempel 1

Tänk på följande två variabler x och y, du måste beräkna R kvadrat i regression.

Lösning:

Med hjälp av ovan nämnda formel måste vi först beräkna korrelationskoefficienten.

Vi har alla värden i tabellen ovan med n = 4.

Låt oss nu ange värdena i formeln för att komma fram till figuren.

r = (4 * 26,046,25) - (265,18 * 326,89) / √ ((4 * 21,274,94) - (326,89) 2 ) * ((4 * 31,901,89) - (326,89) 2 )

r = 17,501,06 / 17,512,88

Korrelationskoefficienten kommer att

r = 0,99932480

Så beräkningen kommer att vara som följer,

r 2 = (0,99932480) 2

R kvadratformel i regression

r 2 = 0,998650052

Exempel 2

Indien, ett utvecklingsland, vill genomföra en oberoende analys av huruvida förändringar i råoljepriser har påverkat dess rupier. Följande är historien om Brent råoljepris och rupier värdering både mot dollar som rådde i genomsnitt under dessa år per nedan.

RBI, Indiens centralbank, har kontaktat dig för att ge en presentation om samma under nästa möte. Bestäm om rörelserna i råolja påverkar rörelserna i Rupee per dollar?

Lösning:

Med hjälp av formeln för korrelationen ovan kan vi först beräkna korrelationskoefficienten. Behandla genomsnittligt råoljepris som en variabel, säg x, och behandla rupie per dollar som en annan variabel som y.

Vi har alla värden i tabellen ovan med n = 6.

Låt oss nu ange värdena i formeln för att komma fram till figuren.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )

r = -620,06 / 1 715,95

Korrelationskoefficienten kommer att

r = -0,3614

Så beräkningen kommer att vara som följer,

r 2 = (-0,3614) 2

R kvadratformel i regression

r 2 = 0,1306

Analys: Det verkar som om det finns ett mindre samband mellan förändringar i råoljepriset och förändringar i priset på den indiska rupien. När råoljepriset stiger påverkar också förändringarna i den indiska rupien. Men eftersom R-kvadraten bara är 13%, förklarar förändringarna i råoljepriset mycket mindre om förändringar i den indiska rupien, och den indiska rupien är föremål för förändringar i andra variabler också, vilket måste redovisas.

Exempel # 3

XYZ-laboratorium bedriver forskning om längd och vikt och är intresserad av att veta om det finns någon form av samband mellan dessa variabler. Efter att ha samlat ett urval på 5000 personer för varje kategori och kommit fram till en genomsnittlig vikt och en genomsnittlig höjd i just den gruppen.

Nedan är detaljerna som de har samlat in.

Du måste beräkna R Squared och avsluta om den här modellen förklarar varianter i höjd påverkar vikter i vikt.

Lösning:

Med hjälp av formeln för korrelationen ovan kan vi först beräkna korrelationskoefficienten. Behandla höjd som en variabel, säg x, och behandla vikt som en annan variabel som y.

Vi har alla värden i tabellen ovan med n = 6.

Låt oss nu ange värdena i formeln för att komma fram till figuren.

r = (7 * 74 058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )

r = 6581,05 / 7,075,77

Korrelationskoefficienten kommer att

Korrelationskoefficient (r) = 0,9301

Så beräkningen kommer att vara som följer,

r 2 = 0,8651

Analys: Korrelationen är positiv och det verkar finnas något samband mellan höjd och vikt. När höjden ökar verkar personens vikt också öka. Medan R2 föreslår att 86% av höjdförändringarna tillskrivs viktförändringar och 14% är oförklarliga.

Relevans och användningsområden

Relevansen av R i kvadrat vid regression är dess förmåga att hitta sannolikheten för framtida händelser inom de givna förutsagda resultaten eller resultaten. Om fler prover läggs till i modellen, kommer koefficienten att visa sannolikheten eller sannolikheten för att en ny punkt eller den nya datasetet faller på raden. Även om båda variablerna har en stark koppling, visar bestämningen inte kausalitet.

Några av de utrymmen där R kvadrat används mestadels är för att spåra fondens resultat, för att spåra risk i hedgefonder, för att bestämma hur väl aktier rör sig med marknaden, där R2 skulle föreslå hur mycket av rörelserna i aktien kan förklaras av rörelserna på marknaden.

Intressanta artiklar...