Kas yra regresija?
Regresijos analizė yra statistika pagrįsta finansavimo, investavimo ir kt. Analizė, kuria siekiama nustatyti priklausomo kintamojo ir kitų nepriklausomų kintamųjų serijų ryšį, o pagrindinis dėmesys skiriamas pirmiau minėtų santykių stiprumui nustatyti.
Paaiškinimai
- Norėdami paaiškinti regresijos analizę nespecialistiškai, tarkime, kad įmonės pardavimų vadovas labai stengiasi prognozuoti kito mėnesio pardavimus. Produkto pardavimą skatina daugybė veiksnių, pradedant oru, baigiant konkurento nauja strategija, festivaliu ir keičiant vartotojų gyvenimo būdą.
- Tai būdas suderinti keletą veiksnių, turinčių įtakos pardavimui, kurie turi didžiausią poveikį. Tai gali padėti atsakyti į daugelį klausimų, pavyzdžiui, kokie yra svarbiausi veiksniai, kokie veiksniai yra mažiau svarbūs, koks yra šių veiksnių ryšys ir, svarbiausia, koks yra šių veiksnių laidavimas.
- Šie veiksniai vadinami kintamaisiais. Pagrindinis veiksnys, kurį bandome prognozuoti, vadinamas priklausomuoju kintamuoju, o kiti veiksniai, turintys įtakos priklausomam kintamajam, vadinami nepriklausomaisiais.

Formulė
Paprasta tiesinės regresijos analizė programoje „Excel“ gali būti išreikšta kaip toliau pateikta formulė, ir ji matuoja priklausomo kintamojo ir vieno nepriklausomo kintamojo santykį.
Y = a + bX + ϵČia:
- Y - priklausomas kintamasis
- X - nepriklausomas (aiškinamasis) kintamasis
- a - perimti
- b - nuolydis
- ϵ - likutis (klaida)
Kaip interpretuoti regresijos analizę?
Tai galima interpretuoti darant prielaidą paprastą scenarijų. Čia imamas antikvarinių daiktų aukcione kainų ir jų amžiaus trukmės santykis. Kuo senoviškumas sensta, tuo didesnę kainą jis gauna. Darant prielaidą, kad nustatėme duomenis apie paskutinius 50 aukcione parduotų daiktų, galime numatyti, kokios bus būsimos aukciono kainos, atsižvelgiant į prekės amžių. Naudodamiesi šiais duomenimis, galime sukurti regresijos lygtį.
Regresijos formulė, pagal kurią galima nustatyti amžiaus ir kainos santykį, yra tokia:
y = β0 + β1 x + paklaida- Čia priklausomas faktorius yra Y. Y reiškia kiekvieno aukcione parduodamo daikto kainą, o nepriklausomas faktorius yra X, kuris lemia amžių.
- Parametrai β0 ir β1 yra parametrai, kurie nėra žinomi ir bus įvertinti pagal lygtį.
- β0 yra konstanta, naudojama apibrėžti tiesinę tendencijos liniją, perimančią Y ašį.
- β1 yra konstanta, kuri parodo priklausomo kintamojo vertės pokyčio dydį kaip susijusią nepriklausomų kintamųjų pokyčio funkciją.
- Tai iš esmės vadinama lygties nuolydžiu. Kai nuolydis yra pamušalas, tai reiškia, kad tarp amžiaus ir kainos yra proporcingas santykis, o kur nuolydis yra atvirkštinis, tai reiškia, kad santykis yra netiesiogiai proporcingas.
- Klaida gali būti apibrėžiama kaip triukšmo ar variacijos tikslinės kintamojo ir yra atsitiktinis pobūdžio.
Regresijos analizės pavyzdžiai realiame gyvenime
Tarkime, kad turime nustatyti ryšį tarp įvykusių pardavimų ir sumos, išleistos su produktu susijusiai reklamai.
Apskritai galime pastebėti teigiamą pardavimo kiekio ir reklamai išleistos sumos santykį. Remdamiesi paprasta tiesinės regresijos lygtimi, mes turime:
Y = a + bXTarkime, kad mes gauname vertę kaip
Y = 500 + 30X
Rezultatų aiškinimas:
Prognozuojamas 30 nuolydis padeda mums padaryti išvadą, kad vidutiniai pardavimai padidėja 30 USD per metus, kai išlaidos reklamai didėja.
Regresijos analizės tipai
# 1 - tiesinis
Tai galima išreikšti kaip žemiau pateiktą formulę, ir ji matuoja priklausomo kintamojo ir vieno nepriklausomo kintamojo santykį.
# 2 - daugianaris
Taikant šį metodą, analizė naudojama santykiui tarp pavienių priklausomų veiksnių ir kelių nepriklausomų kintamųjų įvertinti.
# 3 - logistika
Čia priklausomas veiksnys ar kintamasis yra dvejetainio pobūdžio. Nepriklausomi kintamieji gali būti tęstiniai arba dvejetainiai. Daugialypėje logistinėje regresijoje mes galime sau leisti turėti daugiau nei dvi kategorijas pasirinkdami savo nepriklausomą kintamąjį.
# 4 - kvantilis
Tai yra papildoma tiesinės regresijos sąvoka ir pirmiausia naudojama tada, kai duomenyse yra pašaliniai rodikliai ir iškreipimas.
# 5 - Elastinis tinklas
Tai naudinga, kai tvarkomi labai aukšti koreliuoti nepriklausomi kintamieji.
# 6 - pagrindinių komponentų regresija (PGR)
Tai yra technika, kuri taikoma, kai duomenyse yra per daug nepriklausomų kintamųjų arba yra daugiakolineariškumas
# 7 - daliniai mažiausiai kvadratai (PLS)
Tai yra priešingas pagrindinio komponento metodas, kai turime labai koreliuojančius nepriklausomus kintamuosius. Jis taip pat taikomas, kai yra daug nepriklausomų kintamųjų.
# 8 - palaikymo vektorius
Tai gali suteikti linijinių ir netiesinių modelių sprendimą. Norint rasti optimalų netiesinių modelių sprendimą, jis naudojasi nelinijinėmis branduolio funkcijomis.
# 9 - eilinis
Tai taikoma prognozuojant reitinguojamas vertes. Iš esmės jis yra tinkamas, kai priklausomas kintamasis yra eilinio pobūdžio
# 10 - Puasonas
Tai taikoma, kai priklausomas kintamasis turi skaičiavimo duomenų.
# 11 - neigiamas dvejetainis
Tai taip pat taikoma tvarkant skaičiavimo duomenis tik tuo atveju, jei neigiama binominė regresija neprisiima skaičiaus pasiskirstymo, kurio dispersija yra lygi jos vidurkiui, o Puasono regresija prisiima dispersiją, lygią jos vidurkiui.
# 12 - Kvazis Puasonas
Tai yra neigiamos binominės regresijos pakaitalas. Jis taip pat taikomas išsklaidytų skaičiavimo duomenims. Kvazi Puasono modelio dispersija yra tiesinė vidurkio funkcija, o neigiamo binominio modelio dispersija yra kvadratinė vidurkio funkcija.
# 13 - Koksas
Jis labiau naudojamas analizuojant laiko iki įvykio duomenis.
Regresijos ir koreliacijos skirtumas
- Regresija nustato santykį tarp nepriklausomo dispersijos ir priklausomo kintamojo, kai abu kintamieji yra skirtingi, o koreliacija nustato dviejų kintamųjų ryšį ar priklausomybę, kai nėra skirtumo tarp abiejų kintamųjų.
- Pagrindinis regresijos tikslas yra sukurti geriausiai tinkančią liniją ir vieno kintamojo įvertinimas atliekamas remiantis kitais, o koreliacijoje parodo linijinį ryšį tarp dviejų kintamųjų.
- Tuo mes įvertiname tam tikro pripažinto kintamojo (X) pokyčio dydį įvertintame kintamajame (Y), o koreliacijoje koeficientas naudojamas norint įvertinti, kiek abu kintamieji juda kartu.
- Tai yra atsitiktinių nepriklausomų kintamųjų dydžio nustatymo procesas, pagrįstas statinio priklausomo kintamojo dydžiu, o koreliacija padeda mums nuspręsti tam tikrą vertę, kad būtų išreikšta abiejų kintamųjų tarpusavio priklausomybė.
Išvada
- Regresijos analizėje pirmiausia naudojami duomenys, siekiant nustatyti ryšį tarp dviejų ar daugiau kintamųjų. Čia daroma prielaida, kad praeityje egzistavę santykiai atsispindės ir dabartyje ar ateityje. Nedaugelis laiko tai laiko pertrauka tarp praeities ir dabarties / ateities.
- Tačiau tai yra plačiai naudojama prognozavimo ir įvertinimo technika. Nors tai apima matematiką, kuri daugeliui vartotojų gali pasirodyti sunki, metodiką palyginti lengva naudoti, ypač kai yra modelis.