Tiesinė regresija (apibrėžimas, pavyzdžiai) Kaip interpretuoti?

Kas yra tiesinė regresija?

Linijinė regresija iš esmės yra statistinio modeliavimo technika, naudojama parodyti santykį tarp vieno priklausomo kintamojo ir vieno ar daugiau nepriklausomų kintamųjų. Tai yra viena iš labiausiai paplitusių prognozinės analizės rūšių. Šio tipo pasiskirstymas formuojasi tiesėje, todėl tai vadinama tiesine regresija. Šiame straipsnyje mes imsimės linijinės regresijos analizės „Excel“ pavyzdžių.

Norėdami pirmiausia atlikti tiesinę regresijos analizę, atlikdami veiksmus turime pridėti „Excel“ priedus.

Spustelėkite Failas - Parinktys (tai atidarys „Excel“ parinkčių iššokantį langą).

Spustelėkite priedus - „Excel“ išskleidžiamajame meniu „Tvarkyti“ pasirinkite „Excel“ priedus, tada spustelėkite Pirmyn.

Tai atidarys iššokantį priedų priedą. Pasirinkite „Analysis ToolPak“, tada spustelėkite Gerai.

Duomenų analizės priedas bus rodomas skirtuke Įterpti.

Leiskite mums suprasti toliau pateiktus linijinės regresijos analizės pavyzdžius.

Tiesinės regresijos analizės pavyzdžiai

1 pavyzdys

Tarkime, kad praėjusiais metais mes turime mėnesinius pardavimus ir išleidome rinkodarai, o dabar turime prognozuoti ateities pardavimus, remdamiesi praėjusių metų pardavimais ir rinkodara.

Mėnuo Reklama Pardavimai
Jan 40937 502729
Vasario mėn 42376 507553
Kovas 43355 516885
Balandžio mėn 44126 528347
Gegužė 45060 537298
Birželio mėn 49546 544066
Liepos mėn 56105 553664
Rugpjūčio mėn 59322 563201
Rugsėjo mėn 59877 568657
Spalio mėn 60481 569384
Lapkritis 62356 573764
Gruodžio mėn 63246 582746

Skirtuke „Duomenys“ spustelėkite „Duomenų analizė“, ir jums bus atidarytas Duomenų analizės iššokantis langas.

Dabar sąraše pasirinkite Regresija ir spustelėkite Gerai.

Atsivers regresijos langas.

Y ašies laukelyje pasirinkite pardavimo diapazoną $ C $ 1: $ C $ 13, nes tai yra priklausomas kintamasis, o $ B $ 1: $ B $ 14 X ašyje, nes išleista reklama yra nepriklausomas kintamasis.

Pažymėkite žymės langelį Etiketės, jei duomenyse pasirinkote antraštes, kitaip jums bus padaryta klaida.

Pasirinkite Išvesties diapazonas, jei norite gauti konkretaus darbalapio diapazono vertę, o kita pasirinkite Naujas darbalapio sluoksnis: ir tai pridės naują darbalapį ir suteiks jums rezultatą.

Tada pažymėkite laukelį Likutis ir spustelėkite Gerai.

Tai pridės darbalapius ir suteiks jums tokį rezultatą.

Supraskime išvestį.

Santraukos rezultatas

Daugkartinis R: Tai reiškia koreliacijos koeficientą. 1 reikšmė rodo teigiamą ryšį, o 0 vertė nerodo jokio ryšio.

R kvadratas: R kvadratas reiškia nustatymo koeficientą. Tai parodo, kiek procentų taškų patenka į regresijos liniją. 0,49 reiškia, kad modeliui tinka 49% verčių

Koreguotas R kvadratas : Tai koreguojamas R kvadratas, reikalaujantis, kai turite daugiau nei vieną X kintamąjį.

Standartinė klaida: tai yra standartinio paklaidos nuokrypio įvertis. Tai yra tikslumas, kuriuo matuojamas regresijos koeficientas.

Stebėjimai: tai yra stebėjimų, kuriuos atlikote imtyje, skaičius.

ANOVA - Df: Laisvės laipsniai

SS: kvadratų suma.

VN: mes turime dvi VN

  • Regresijos MS yra regresijos SS / regresijos Df.
  • Liekamasis MS yra vidutinė kvadrato paklaida (likęs SS / likęs Df).

F: F testas nulinei hipotezei.

Reikšmė F: P reikšmės, susijusios su reikšmingumu

Koeficientas: koeficientas pateikia mažiausių kvadratų įvertį.

T statistika: T nulio hipotezės ir alternatyvios hipotezės statistika.

P reikšmė: tai hipotezės testo p vertė.

Apatinė 95% ir viršutinė 95%: tai yra apatinė ir viršutinė pasikliautino intervalo riba

Likučių išvestis . Remiantis duomenimis, turime 12 stebėjimų. 2 -asis stulpelis rodo numanomą pardavimus ir 3 -iasis stulpelių liekamąją. Likučiai iš esmės yra numatomų pardavimų skirtumas nuo faktinio.

2 pavyzdys

Pasirinkite numatomų pardavimų ir rinkodaros stulpelį

Eikite į diagramų grupę skirtuke „Įterpti“. Pasirinkite sklaidos diagramos piktogramą

Tai išsklaidys sklaidos diagramą „Excel“. Žiūrėkite paveikslėlį žemiau

Dešiniuoju pelės mygtuku spustelėkite bet kurį tašką, tada pasirinkite „ Add Trendline in Excel“. Tai pridės jūsų diagramos tendencijas.

  • Galite suformatuoti tendencijų liniją dešiniuoju pelės mygtuku spustelėkite bet kurioje tendencijos vietoje ir pasirinkite formato tendenciją.
  • Galite patobulinti diagramą. ty formuoti tendenciją, spalvą ir pakeisti pavadinimą ir kt
  • Taip pat galite parodyti formulę diagramoje, pažymėdami diagramos rodymo formulę, o diagramoje parodykite R kvadrato vertę.

Keletas daugiau tiesinės regresijos analizės pavyzdžių:

  1. Parduodamo skėčio prognozavimas pagal lietų nutiko Srityje.
  2. Parduodamos kintamosios srovės spėjimas pagal vasaros temperatūrą.
  3. Egzaminų sezono metu iš esmės išaugo „Stationary“, „Exam Guide“ pardavimai.
  4. Pardavimų prognozavimas, kai reklama buvo vykdoma, remiantis „High TRP“ serija, kur daroma reklama, prekės ženklo ambasadoriaus populiarumu ir pėdomis toje vietoje, kur laikoma reklama.
  5. Namo pardavimas pagal vietovę, plotą ir kainą.

3 pavyzdys

Tarkime, kad mes turime devynis studentus su savo intelekto koeficientu ir skaičiumi, kurį jie surinko per testą.

Studentas Testo rezultatas IQ
Avinas 100 145
Šyam 97 140
Kul 93 130
Kappu 91 125
Radžu 89 115
Vishal 86 110
Vivekas 82 100
Vinay 78 95
Kumaras 75 90

1 veiksmas: pirmiausia sužinokite priklausomus ir nepriklausomus kintamuosius. Čia testo rezultatas yra priklausomas kintamasis, o IQ yra nepriklausomas kintamasis, nes testo rezultatas kinta keičiantis IQ.

2 žingsnis: Eikite į skirtuką Duomenys - spustelėkite Duomenų analizė - Pasirinkite regresiją - spustelėkite Gerai.

Tai atidarys langą Regresija.

3 žingsnis. Įvesties bandymo rezultatų diapazonas „Input Y Range Box“ ir IQ „Input X Range Box“ laukelyje. (Pažymėkite etiketes, jei duomenų diapazone yra antraštės. Pasirinkite išvesties parinktis, tada pažymėkite norimus likučius. Spustelėkite Gerai.

Gausite santraukos išvestį, parodytą žemiau esančiame paveikslėlyje.

4 žingsnis: Regresijos analizavimas pagal suvestinės išvestį

Santraukos rezultatas

Daugkartinis R: Čia koreliacijos koeficientas yra 0,99, kuris yra labai artimas 1, o tai reiškia, kad tiesinis ryšys yra labai teigiamas.

R kvadratas: R kvadrato vertė yra 0,983, o tai reiškia, kad 98,3% verčių tinka modeliui.

P reikšmė: Čia P reikšmė yra 1.86881E-07, tai yra labai mažiau nei .1, o tai reiškia, kad IQ turi reikšmingas nuspėjamąsias reikšmes.

Žr. Toliau pateiktą diagramą.

Matote, kad beveik visi taškai krinta tiesiai arba šalia esanti tendencija.

4 pavyzdys

Turime prognozuoti kintamosios srovės pardavimus pagal kito mėnesio pardavimus ir temperatūrą.

Mėnuo Temp Pardavimai
Jan 25 38893
Vasario mėn 28 42254
Kovas 31 42845
Balandžio mėn 33 47917
Gegužė 37 51243
Birželio mėn 40 69588
Liepos mėn 38 56570
Rugpjūčio mėn 37 50000

Norėdami gauti regresijos rezultatą, atlikite toliau nurodytus veiksmus.

1 veiksmas: pirmiausia sužinokite priklausomus ir nepriklausomus kintamuosius. Čia pardavimai yra priklausomas kintamasis, o temperatūra - nepriklausomas kintamasis, nes pardavimai kinta, kai temperatūra keičiasi.

2 žingsnis: Eikite į skirtuką Duomenys - spustelėkite Duomenų analizė - Pasirinkite regresiją - spustelėkite Gerai.

Tai atidarys langą Regresija.

3 žingsnis. Įvesties pardavimai įvesties Y diapazono laukelyje ir temperatūra įvesties X diapazono laukelyje. (Pažymėkite etiketes, jei duomenų diapazone yra antraštės. Pasirinkite išvesties parinktis, tada pažymėkite norimus likučius. Spustelėkite Gerai.

Tai suteiks jums santrauką, kaip nurodyta toliau.

4 žingsnis: išanalizuokite rezultatą.

Daugkartinis R: Čia koreliacijos koeficientas yra 0,877, kuris yra artimas 1, o tai reiškia, kad tiesinis ryšys yra teigiamas.

R kvadratas: R kvadrato vertė yra 0,770, o tai reiškia, kad 77% reikšmių tinka modeliui

P reikšmė: Čia P vertė yra 1.86881E-07, tai yra labai mažesnė nei .1, o tai reiškia, kad IQ turi reikšmingas nuspėjamąsias reikšmes.

5 pavyzdys

Dabar atlikime kelių nepriklausomų kintamųjų regresijos analizę:

Turite numatyti mobiliųjų įrenginių, kurie bus pradėti pardavinėti kitais metais, pardavimus. Turite kainų ir šalių, turinčių įtakos mobiliųjų telefonų pardavimams, skaičių.

Mobili versija Pardavimai Kiekis Gyventojai
JAV 63860 858 823
JK 61841 877 660
KZ 60876 873 631
CH 58188 726 842
HN 52728 864 573
AS 52388 680 809
NZ 51075 728 661
49019 689 778

Norėdami gauti regresijos rezultatą, atlikite toliau nurodytus veiksmus.

1 žingsnis. Pirmiausia sužinokite priklausomus ir nepriklausomus kintamuosius. Čia pardavimai priklauso nuo kintamojo, kiekio ir populiacijos. Abu šie rodikliai yra nepriklausomi kintamieji, nes pardavimai skiriasi priklausomai nuo šalies kiekio ir gyventojų skaičiaus.

2 žingsnis. Eikite į skirtuką Duomenys - spustelėkite Duomenų analizė - Pasirinkite regresiją - spustelėkite Gerai.

Tai atidarys langą Regresija.

3 žingsnis. Įvesties pardavimai įvesties Y diapazono laukelyje ir „Input X Range Box“ laukelyje pasirinkite kiekį ir populiaciją. (Pažymėkite etiketes, jei duomenų diapazone yra antraštės. Pasirinkite išvesties parinktis, tada pažymėkite norimus likučius. Spustelėkite Gerai.

Dabar vykdykite regresiją naudodamiesi duomenų analize skirtuke „Duomenys“. Tai suteiks jums žemiau pateiktą rezultatą.

Santraukos rezultatas

Daugkartinis R: Čia koreliacijos koeficientas yra 0,93, kuris yra labai artimas 1, o tai reiškia, kad tiesinis ryšys yra labai teigiamas.

R kvadratas: R kvadrato vertė yra 0,866, o tai reiškia, kad 86,7% reikšmių tinka modeliui.

Reikšmė F: Reikšmė F yra mažesnė nei .1, o tai reiškia, kad regresijos lygtis turi reikšmingą numatomąją vertę.

P reikšmė : pažvelgę ​​į kiekio ir populiacijos P vertę, galite pamatyti, kad reikšmės yra mažesnės nei .1, o tai reiškia, kad kiekis ir populiacija turi reikšmingą numatomąją vertę. Kuo mažiau P reikšmių, tai reiškia, kad kintamasis turi reikšmingesnes numatomas vertes.

Tačiau tiek kiekis, tiek populiacija turi reikšmingą prognozuojamą vertę, tačiau, jei pažvelgtumėte į kiekio ir populiacijos P vertę, matytumėte, kad kiekio P vertė yra mažesnė nei populiacijoje. Tai reiškia, kad kiekis turi reikšmingesnę prognozuojamą vertę nei Gyventojai.

Ką reikia atsiminti

  • Visada patikrinkite priklausomus ir nepriklausomus kintamuosius, kai pasirenkate bet kokius duomenis.
  • Tiesinės regresijos analizėje atsižvelgiama į santykį tarp kintamųjų vidurkio.
  • Tai tik modeliuoja santykį tarp tiesinių kintamųjų
  • Kartais tai nėra tinkamiausia realaus pasaulio problemai spręsti. Pavyzdžiui: (amžius ir darbo užmokestis). Dažniausiai darbo užmokestis didėja didėjant amžiui. Tačiau išėjus į pensiją amžius didėja, bet atlyginimai mažėja.

Įdomios straipsniai...