Kas yra R kvadratas (R2) regresijoje?
R kvadratas (R 2 ) yra svarbus statistinis matas, kuris yra regresijos modelis, kuris statistiniu požiūriu rodo priklausomo kintamojo skirtumo ar dispersijos proporciją, kurią galima paaiškinti nepriklausomu kintamuoju ar kintamaisiais. Trumpai tariant, tai nustato, ar duomenys tiks regresijos modeliui.
R kvadratinė formulė
Norėdami apskaičiuoti R kvadratą, turite nustatyti koreliacijos koeficientą, o tada rezultatą kvadratu.
R kvadratinė formulė = r 2
Kur r koreliacijos koeficientą galima apskaičiuoti pagal žemiau pateiktą reikšmę:
r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))
Kur,
- r = koreliacijos koeficientas
- n = skaičius nurodytame duomenų rinkinyje
- x = pirmasis kintamasis kontekste
- y = antrasis kintamasis
Paaiškinimas
Jei tarp šių dviejų kintamųjų yra koks nors ryšys ar koreliacija, kuri gali būti tiesinė ar netiesinė, tai rodo, ar pasikeitė nepriklausomo kintamojo vertė, tada kito priklausomo kintamojo vertė greičiausiai pasikeis, tarkim tiesiškai ar netiesiškai.
Formulės skaitiklio dalis atlieka bandymą, ar jie juda kartu, ir pašalina jų individualius judesius ir santykinę jungtį, o formulės vardiklis dalija skaitiklį paimdamas kvadratinę šaknies šaknies skirtumą kintamieji iš jų kintamųjų. Kai kvadratu apskaičiuosite šį rezultatą, gausime kvadratą R, o tai yra ne kas kita, o apsisprendimo koeficientas.
Pavyzdžiai
1 pavyzdys
Apsvarstykite šiuos du kintamuosius x ir y, jums reikia apskaičiuoti R kvadratą regresijoje.

Sprendimas:
Naudodamiesi minėta formule, pirmiausia turime apskaičiuoti koreliacijos koeficientą.

Mes turime visas aukščiau pateiktoje lentelėje pateiktas reikšmes, kai n = 4.
Įveskime reikšmes į formulę, kad gautume paveikslą.

r = (4 * 26 046,25) - (265,18 * 326,89) / √ ((4 * 21 274,94) - (326,89) 2 ) * ((4 * 31 901,89) - (326,89) 2 )
r = 17 501,06 / 17 512,88
Koreliacijos koeficientas bus

r = 0,99932480
Taigi, skaičiavimas bus toks,

r 2 = (0,99932480) 2
R kvadratinė formulė regresijoje

r 2 = 0,998650052
2 pavyzdys
Indija, besivystanti šalis, nori atlikti nepriklausomą analizę, ar žalios naftos kainų pokyčiai paveikė jos rupijos vertę. Toliau pateikiama „Brent“ žaliavinės naftos kainos ir rupijos vertinimo istorija, palyginti su doleriais, kuri vyravo vidutiniškai tais metais žemiau.

RBI, Indijos centrinis bankas, kreipėsi į jus, kad pateiktumėte pranešimą apie tą patį kitame susitikime. Nustatykite, ar žalios naftos pokyčiai veikia rupijos už dolerį pokyčius?
Sprendimas:
Naudodami aukščiau pateiktą koreliacijos formulę, pirmiausia galime apskaičiuoti koreliacijos koeficientą. Vidutinės žalios naftos kainos vertinimas kaip vienas kintamasis, sakykime x, o rupija už dolerį - kaip kitas kintamasis, kaip y.

Mes turime visas aukščiau pateiktoje lentelėje pateiktas reikšmes, kai n = 6.
Įveskime reikšmes į formulę, kad gautume paveikslą.

r = (6 * 23592,83) - (356,70 * 398,59) / √ ((6 * 22829,36) - (356,70) 2 ) * ((6 * 26529,38) - (398,59) 2 )
r = -620,06 / 1,715,95
Koreliacijos koeficientas bus
r = -0,3614
Taigi, skaičiavimas bus toks,

r 2 = (-0,3614) 2
R kvadratinė formulė regresijoje

r 2 = 0,1306
Analizė: Atrodo, kad žalios naftos kainų pokyčiai ir Indijos rupijos kainos pokyčiai yra nedideli. Didėjant žalios naftos kainoms, įtakos turi ir Indijos rupijos pokyčiai. Kadangi R kvadratas yra tik 13%, tada žalios naftos kainos pokyčiai labai mažiau paaiškina Indijos rupijos pokyčius, o Indijos rupija taip pat keičiasi ir kituose kintamuosiuose, į kuriuos reikia atsižvelgti.
3 pavyzdys
XYZ laboratorija atlieka ūgio ir svorio tyrimus ir nori sužinoti, ar tarp šių kintamųjų yra koks nors ryšys. Surinkęs 5000 žmonių atranką kiekvienai kategorijai ir sugalvojęs vidutinį svorį ir vidutinį ūgį toje grupėje.
Žemiau pateikiama jų surinkta informacija.

Privalote apskaičiuoti R kvadratą ir padaryti išvadą, jei šis modelis paaiškina aukščio skirtumus ir svorio svyravimus.
Sprendimas:
Naudodami aukščiau pateiktą koreliacijos formulę, pirmiausia galime apskaičiuoti koreliacijos koeficientą. Aukštis traktuojamas kaip vienas kintamasis, sakykime x, o svoris - kaip kitas kintamasis, kaip y

Mes turime visas aukščiau pateiktoje lentelėje pateiktas reikšmes, kai n = 6.
Įveskime reikšmes į formulę, kad gautume paveikslą.

r = (7 * 74 058,67) - (1031 * 496,44) / √ ((7 * 153595 - (1031) 2 ) * ((7 * 35793,59) - (496,44) 2 )
r = 6581,05 / 7075,77
Koreliacijos koeficientas bus
Koreliacijos koeficientas (r) = 0,9301
Taigi, skaičiavimas bus toks,

r 2 = 0,8651
Analizė: Koreliacija yra teigiama ir atrodo, kad yra tam tikras ryšys tarp ūgio ir svorio. Didėjant ūgiui, atrodo, kad padidėja ir asmens svoris. Nors R2 teigia, kad 86% ūgio pokyčių siejami su svorio pokyčiais, o 14% yra nepaaiškinami.
Aktualumas ir naudojimas
R kvadrato reikšmė regresijoje yra jo sugebėjimas rasti būsimų įvykių tikimybę pagal numatomus rezultatus ar rezultatus. Jei prie modelio pridedama daugiau pavyzdžių, koeficientas parodys tikimybę ar tikimybę, kad naujas taškas ar naujas duomenų rinkinys nukris tiese. Net jei abu kintamieji turi tvirtą ryšį, nustatymas neįrodo priežastingumo.
Kai kurios erdvės, kuriose dažniausiai naudojamas R kvadratas, yra naudojamos investicinių fondų rezultatams stebėti, rizikos draudimo fondų rizikai stebėti, siekiant nustatyti, kaip gerai akcijos juda kartu su rinka, kur R2 pasiūlytų, kiek akcijų pokyčių galima paaiškinti. rinkos pokyčiai.