Koreguotas R kvadratas (tai reiškia, formulė) - Apskaičiuokite pakoreguotą R ^ 2

Kas yra koreguotas R kvadratas?

Koreguotas R kvadratas reiškia statistikos priemonę, kuri padeda investuotojams įvertinti kintamojo, kuris priklauso nuo kintamojo, kurį galima paaiškinti nepriklausomu kintamuoju, dispersijos mastą, ir atsižvelgiama tik į tų kintamųjų, kurie turi įtakos kintamajam, poveikį. priklausomo kintamojo.

Koreguotas R kvadratas arba modifikuotas R 2 nustato priklausomo kintamojo dispersijos dydį, kurį galima paaiškinti nepriklausomu kintamuoju. Modifikuoto R 2 ypatybė yra ta, kad jame nėra atsižvelgiama į visų nepriklausomų kintamųjų poveikį, o tik į tuos, kurie daro įtaką priklausomo kintamojo kitimui. Modifikuoto R 2 vertė taip pat gali būti neigiama, nors ji nėra neigiama dažniausiai.

Koreguota R kvadrato formulė

Koreguoto R regresijos kvadrato apskaičiavimo formulė pateikiama taip, kaip nurodyta toliau,

R 2 = ((1 / N) * Σ ((xi - x) * (Yi - y)) / (σx * σy)) 2

Kur

  • R 2 = pakoreguotas regresijos lygties R kvadratas
  • N = stebėjimų skaičius regresijos lygtyje
  • Xi = nepriklausomas regresijos lygties kintamasis
  • X = regresijos lygties nepriklausomo kintamojo vidurkis
  • Yi = priklausomas regresijos lygties kintamasis
  • Y = priklausomo regresijos lygties kintamojo vidurkis
  • σx = Nepriklausomo kintamojo standartinis nuokrypis
  • σy = Priklausomo kintamojo standartinis nuokrypis.

Atkreipkite dėmesį

Norint jį apskaičiuoti naudojant „Excel“, „Excel“ programoje reikia pateikti y ir x kintamuosius, o „Excel“ sugeneruoja visą išvestį kartu su koreguotu R 2. Tai yra konkretus atvejis, kai sunku pateikti kūrinį teksto formatu, skirtingai nuo kitų formulių.

Interpretacija

Koreguotas R kvadratas nustato priklausomo kintamojo dispersijos dydį, kurį galima paaiškinti nepriklausomu kintamuoju. Pažvelgus į pakoreguotą R 2 vertę, galima spręsti, ar regresijos lygties duomenys gerai tinka. Kuo aukštesnė pakoreguota R 2, tuo geriau regresijos lygtis, nes tai reiškia, kad nepriklausomas kintamasis yra pasirinktas nustatyti priklausomą kintamąjį, gali paaiškinti priklausomo kintamojo kitimą.

Modifikuoto R 2 vertė taip pat gali būti neigiama, nors ji nėra neigiama dažniausiai. Koreguotame R kvadrate pakoreguoto R kvadrato vertė padidės pridėjus nepriklausomą kintamąjį tik tada, kai nepriklausomo kintamojo kitimas paveiks priklausomo kintamojo kitimą. Tai netaikoma R 2 atveju, svarbi tik pakoreguotos R 2 vertei.

Pavyzdžiai

1 pavyzdys

Pabandykime pavyzdžio pagalba suprasti koreguoto R 2 sąvoką. Pabandykime išsiaiškinti, koks yra sunkvežimio vairuotojo nuvažiuoto atstumo ir sunkvežimio vairuotojo amžiaus santykis. Kažkas daro regresijos lygtį, kad patvirtintų, ar tai, ką jis mano apie dviejų kintamųjų santykį, patvirtina ir regresijos lygtis.

Šiame konkrečiame pavyzdyje pamatysime, kuris kintamasis yra priklausomas, o kuris - nepriklausomas. Priklausomas kintamasis šioje regresijos lygtyje yra sunkvežimio vairuotojo nuvažiuotas atstumas, o nepriklausomas kintamasis yra sunkvežimio vairuotojo amžius. Vykdydami regresiją su kintamaisiais, gautas pakoreguotas R kvadratas bus 65%. Žemiau pateiktoje nuotraukoje vaizduojama kintamųjų regresijos išvestis. Duomenų rinkinys ir kintamieji pateikiami pridedamame „Excel“ lape.

Šios regresijos pakoreguota 65% R 2 reikšmė reiškia, kad nepriklausomas kintamasis paaiškina 65% priklausomo kintamojo kitimo. Idealiu atveju tyrėjas ieškos nustatymo koeficiento, kuris yra arčiausiai 100%.

2 pavyzdys

Pabandykime ir suprasime pakoreguoto R kvadrato sąvoką kito pavyzdžio pagalba. Pabandykime išsiaiškinti, koks yra santykis tarp klasės mokinių ūgio ir tų mokinių GPA pažymio. Šiame konkrečiame pavyzdyje pamatysime, kuris kintamasis yra priklausomas, o kuris - nepriklausomas. Priklausomas kintamasis šioje regresijos lygtyje yra studentų GPA, o nepriklausomas kintamasis yra studentų ūgis.

Vykdydami regresiją su kintamaisiais, gautas koreguotas R 2 yra nereikšmingas arba neigiamas. Žemiau pateiktoje nuotraukoje vaizduojama kintamųjų regresijos išvestis. Duomenų rinkinys ir kintamieji pateikiami pridedamame „Excel“ lape.

Koreguota R 2 reikšmė šiai regresijai yra nereikšminga, o tai reiškia, kad nepriklausomas kintamasis nepaaiškina priklausomo kintamojo kitimo. Idealiu atveju tyrėjas ieškos nustatymo koeficiento, kuris yra arčiausiai 100%.

Interpretacija

Koreguotas R kvadratas yra reikšmingas rezultatas norint sužinoti, ar duomenų rinkinys tinka, ar ne. Kažkas daro regresijos lygtį, kad patvirtintų, ar tai, ką jis mano apie dviejų kintamųjų santykį, patvirtina ir regresijos lygtis. Didesnė vertė, tuo geresnė regresijos lygtis, nes tai reiškia, kad nepriklausomas kintamasis, pasirinktas nustatyti priklausomą kintamąjį, yra tinkamai parinktas. Idealiu atveju tyrėjas ieškos nustatymo koeficiento, kuris yra arčiausiai 100%.

Įdomios straipsniai...