Regression (mening, typer) - Vad är regressionsanalys?

Innehållsförteckning

Vad är regression?

Regressionsanalys är en statistikbaserad mätning som används i ekonomi, investering etc., som syftar till att skapa ett samband mellan en beroende variabel och andra serier av oberoende variabler, och huvudfokus är att bestämma styrkan i ovanstående relation.

Förklaringar

  • För att förklara regressionsanalys på lekman, låt oss anta att ett företags försäljningschef försöker hårt att förutse försäljningen nästa månad. Det är många faktorer inblandade som driver försäljningen av produkten, från väder till konkurrentens nya strategi, festival och förändring i konsumenternas livsstil.
  • Detta är en metod för att anpassa ut de olika faktorer som påverkar försäljningen, som är de som har störst inverkan. Det kan hjälpa till att svara på många frågor som vad som är de viktigaste faktorerna, vilka faktorer som är mindre viktiga, vad är sambandet mellan dessa faktorer och viktigast av allt, vad som är säkerheten för dessa faktorer.
  • Dessa faktorer kallas variabler. Den viktigaste faktorn som vi försöker förutsäga kallas den beroende variabeln, och de andra faktorer som har inverkan på den beroende variabeln kallas de oberoende variablerna.

Formel

Enkel linjär regressionsanalys i excel kan uttryckas som formeln nedan och den mäter förhållandet mellan en beroende variabel och en oberoende variabel.

Y = a + bX + ϵ

Här:

  • Y - Beroende variabel
  • X - Oberoende (förklarande) variabel
  • a - Avlyssning
  • b - Lutning
  • ϵ - Rest (fel)

Hur ska man tolka regressionsanalys?

Detta kan tolkas genom att anta ett enkelt scenario. Här tar vi sambandet mellan priserna på antik samling för auktion och dess ålder. Ju mer en antik blir äldre, desto mer får det priset. Förutsatt att vi har ställt in data för de senaste 50 föremålen som hade auktionerats ut, kan vi förutsäga vilka framtida auktionspriser som kommer att baseras på artikelns ålder. Med hjälp av dessa data kan vi bygga en regressionsekvation.

Regressionsformeln som kan skapa en relation mellan ålder och pris är som följer:

y = β0 + β1 x + fel
  • Här är den beroende faktorn Y. Y representerar priset på varje artikel som ska auktioneras, medan den oberoende faktorn är X, som bestämmer åldern.
  • Parametrarna β0 och β1 är parametrar som inte är kända och kommer att uppskattas av ekvationen.
  • β0 är en konstant som används för att definiera den linjära trendlinjen som avlyssnar Y-axeln.
  • β1 är en konstant som visar storleken på förändringen i värdet på den beroende variabeln som en relaterad funktion av den förändring som antyds till de oberoende variablerna.
  • Detta kallas i princip ekvationens lutning. När lutningen är en liner betyder det att det finns ett proportionellt förhållande mellan ålder och pris, och där lutningen är invers betyder det att förhållandet är indirekt proportionellt.
  • Det fel kan definieras som buller eller variationen i mål-variabeln och är slumpmässig i naturen.

Verkliga exempel på regressionsanalys

Låt oss anta att vi måste etablera en relation mellan försäljningen som har hänt och det belopp som spenderas på reklam relaterad till en produkt.

Vi kan generellt se ett positivt samband mellan försäljningskvantiteten och det belopp som spenderas på reklam. Med allierad enkel linjär regressionsekvation har vi:

Y = a + bX

Antag att vi får värdet som

Y = 500 + 30X

Resultattolkning:

Den förutspådda lutningen på 30 hjälper oss att dra en slutsats att den genomsnittliga försäljningen ökar $ 30 per år när utgifterna för reklam ökar.

Typer av regressionsanalys

# 1 - Linjär

Detta kan uttryckas som formeln nedan och det mäter förhållandet mellan en beroende variabel och en oberoende variabel.

# 2 - Polynom

I denna metod används analysen för att mäta sambandet mellan enstaka beroende faktorer och flera oberoende variabler.

# 3 - Logistisk

Här är den beroende faktorn eller variabeln binär till sin natur. De oberoende variablerna kan vara kontinuerliga eller binära. I multinomial logistisk regression har vi råd att ha mer än två kategorier medan vi väljer vår oberoende variabel.

# 4 - Kvantil

Detta är ett tillsatsbegrepp av linjär regression och används främst när outliers och skevhet finns i data.

# 5 - Elastiskt nät

Detta är användbart när man hanterar mycket höga korrelerade oberoende variabler.

# 6 - Regression (Principal Components Regression)

Detta är en teknik som är tillämplig när det finns för många oberoende variabler eller multikollinearitet finns i data

# 7 - Partial Least Squares (PLS)

Det är en motsatt metod för huvudkomponenten där vi har oberoende variabler som är starkt korrelerade. Det är också tillämpligt när det finns många oberoende variabler.

# 8 - Stödvektor

Detta kan ge en lösning på linjära och icke-linjära modeller. Den använder icke-linjära kärnfunktioner för att hitta den optimala lösningen för icke-linjära modeller.

# 9 - Ordinarie

Det är tillämpligt på förutsägelse av rankade värden. I grund och botten är det lämpligt när den beroende variabeln är ordinär till sin natur

# 10 - Poisson

Detta är tillämpligt när den beroende variabeln har räkningsdata.

# 11 - Negativ binomial

Det är också tillämpligt att bara hantera räkningsdata att negativ binomiell regression inte antar en fördelning av räkningen med varians lika med medelvärdet, medan Poisson-regression antar variansen lika med medelvärdet.

# 12 - Quasi Poisson

Det är en ersättning för negativ binomial regression. Det är också tillämpligt på spridda räkningsdata. Variansen hos en kvasi-Poisson-modell är en linjär funktion av medelvärdet, medan variansen hos en negativ binomial modell är en kvadratisk funktion av medelvärdet.

# 13 - Cox

Det används mer för att analysera data från tid till händelse.

Skillnaden mellan regression och korrelation

  • Regression fastställer förhållandet mellan en oberoende varians och en beroende variabel där båda variablerna är olika, medan korrelation bestämmer sambandet eller beroendet av två variabler där det inte finns någon skillnad mellan båda variablerna.
  • Huvudsyftet med regression är att skapa en linje med bästa passform och uppskattning av en variabel görs på basis av andra, medan i korrelationen visar det linjära förhållandet mellan två variabler.
  • I detta uppskattar vi storleken på en viss förändring i den igenkända variabeln (X) på den uppskattade variabeln (Y), medan koefficienten i korrelation används för att mäta i vilken utsträckning de två variablerna rör sig tillsammans.
  • Det är en process för att uppskatta storleken på slumpmässiga oberoende variabler baserat på storleken på en statisk beroende variabel, medan korrelation hjälper oss att bestämma ett visst värde för att uttrycka det ömsesidiga beroendet mellan båda variablerna.

Slutsats

  • Regressionsanalys använder främst data för att etablera en relation mellan två eller flera variabler. Här antas att relationer som finns i det förflutna också kommer att reflektera i nuet eller framtiden. Få anser att detta är en tidsfördröjning mellan förflutna och nutid / framtid.
  • Det är dock en allmänt använd prognos- och uppskattningsteknik. Även om det handlar om matematik, som många användare kan tycka tuffa, är tekniken relativt lätt att använda, särskilt när en modell är tillgänglig.

Intressanta artiklar...