Normalus pasiskirstymas statistikoje - apibrėžimas, pavyzdys, aiškinimas

Kas yra įprastas statistikos pasiskirstymas?

Normalus pasiskirstymas yra varpo formos dažnio pasiskirstymo kreivė, padedanti apibūdinti visas galimas vertes, kurias atsitiktinis kintamasis gali gauti tam tikrame diapazone, o didžioji dalis paskirstymo ploto yra viduryje, o nedaug yra uodegose, kraštutiniuose taškuose. Šis paskirstymas turi du pagrindinius parametrus: vidurkį (µ) ir standartinį nuokrypį (σ), kurie vaidina pagrindinį vaidmenį apskaičiuojant turto grąžą ir rizikos valdymo strategiją.

Kaip interpretuoti normalų pasiskirstymą

Aukščiau pateiktame paveiksle parodyta, kad statistinis normalusis pasiskirstymas yra varpo formos kreivė. Šio pasiskirstymo galimų rezultatų diapazonas yra visi realieji skaičiai, esantys nuo -∞ iki + ∞. Varpo kreivės uodegos tęsiasi iš abiejų diagramos pusių (+/-) be apribojimų.

  • Maždaug 68% visų stebėjimų patenka į +/- vieną standartinį nuokrypį (σ)
  • Maždaug 95% visų stebėjimų patenka į +/- du standartinius nuokrypius (σ)
  • Maždaug 99% visų stebėjimų patenka į +/- tris standartinius nuokrypius (σ)

Jis turi nulį (pasiskirstymo simetrija). Jei duomenų pasiskirstymas yra asimetriškas, tada pasiskirstymas yra netolygus, jei duomenų rinkinio iškrypimas yra didesnis nei nulis arba teigiamas iškrypimas. Tada dešinioji pasiskirstymo uodega yra ilgesnė nei kairė, o neigiamo iškrypimo atveju (mažiau nei nulis) kairė uodega bus ilgesnė už dešinę.

Jo kurtosis yra 3 (matuoja pasiskirstymo viršūnę), o tai rodo, kad pasiskirstymas nėra nei per aukščiausią, nei per ploną uodegą. Jei kurtosis yra didesnis nei trys, nei pasiskirstymas yra labiau pasiektas riebesnėmis uodegomis, o jei kurtosis yra mažesnis nei trys, tada jis turi plonas uodegas, o smailės taškas yra žemesnis nei įprastas pasiskirstymas.

Charakteristikos

  • Jie atstovauja pasiskirstymo šeimai, kur vidurkis ir nuokrypis lemia pasiskirstymo formą.
  • Šio pasiskirstymo vidurkis, mediana ir būdas yra vienodi.
  • Pusė reikšmių yra kairėje centro, kita pusė - dešinėje.
  • Bendra vertė pagal standartinę kreivę visada bus viena.
  • Labiausiai tikėtina, kad paskirstymas yra centre, o uodegos gale slypi mažiau vertybių.

Transformacija (Z)

Toliau pateikto atsitiktinio kintamojo (X) tikimybės tankio funkciją (PDF) pateikia:

kur -∞ <x <∞; -∞ <µ 0

Kur,

  • F (x) = Normali tikimybės funkcija
  • x = atsitiktinis kintamasis
  • µ = pasiskirstymo vidurkis
  • σ = skirstinio standartinis nuokrypis
  • π = 3,14159
  • e = 2,71828

Transformacijos formulė

Kur,

  • X = atsitiktinis kintamasis

Normalaus pasiskirstymo statistikoje pavyzdžiai

Aptarkime šiuos pavyzdžius.

1 pavyzdys

Tarkime, kad įmonėje dirba 10000 darbuotojų ir yra keletas atlyginimų struktūros, atsižvelgiant į darbo vaidmenį, kuriame darbuotojas dirba. Atlyginimai paprastai paskirstomi, kai gyventojų vidurkis yra µ = 60 000 USD, o gyventojų standartinis nuokrypis σ = 15 000 USD. Kokia tikimybė, kad atsitiktinai pasirinkto darbuotojo atlyginimas bus mažesnis nei 45 000 USD per metus.

Sprendimas

Kaip parodyta aukščiau esančiame paveikslėlyje, norėdami atsakyti į šį klausimą, turime išsiaiškinti plotą po įprasta kreive nuo 45 iki kairės pusės uodegos. Be to, norėdami gauti teisingą atsakymą, turime naudoti lentelės „Z“ vertę.

Pirma, naudodami transformacijos formulę, turime paversti nurodytą vidurkį ir standartinį nuokrypį į standartinį normalųjį pasiskirstymą, kurio vidurkis (µ) = 0 ir standartinis nuokrypis (σ) = 1.

Po perskaičiavimo turime ieškoti lentelės Z, kad sužinotume atitinkamą vertę, kuri suteiks mums teisingą atsakymą.

Atsižvelgiant į tai,

  • Vidurkis (µ) = 60 000 USD
  • Standartinis nuokrypis (σ) = 15000 USD
  • Atsitiktinis kintamasis (x) = 45000 USD

Transformacija (z) = (45000 - 60000/15000)

Transformacija (z) = -1

Dabar Z lentelėje vertė, lygi -1, yra 0,1587, kuri rodo plotą po kreive nuo 45 iki kelio į kairę. Tai parodė, kad atsitiktinai atrenkant darbuotoją tikimybė uždirbti mažiau nei 45000 USD per metus yra 15,87%.

2 pavyzdys

Laikydamiesi to paties scenarijaus, kaip nurodyta aukščiau, sužinokite tikimybę, kad atsitiktinai pasirinktas darbuotojas uždirba daugiau nei 80 000 USD per metus, naudodamas įprastą paskirstymą.

Sprendimas

Taigi šiame klausime turime išsiaiškinti užtamsintą plotą nuo 80 iki dešinės uodegos, naudodami tą pačią formulę.

Atsižvelgiant į tai,

  • Vidurkis (µ) = 60 000 USD
  • Standartinis nuokrypis (σ) = 15000 USD
  • Atsitiktinis kintamasis (X) = 80 000 USD

Transformacija (z) = (80000 - 60000/15000)

Transformacija (z) = 1,33

Pagal Z lentelę ekvivalentinė vertė 1,33 yra 0,9082 arba 90,82%, o tai rodo, kad tikimybė atsitiktinai pasirinkti darbuotojus, uždirbančius mažiau nei 80 000 USD per metus, yra 90,82%.

Tačiau pagal klausimą turime nustatyti tikimybę, kad atsitiktiniai darbuotojai uždirbs daugiau nei 80 000 USD per metus, todėl turime atimti vertę iš 100.

  • Atsitiktinis kintamasis (X) = 100% - 90,82%
  • Atsitiktinis kintamasis (X) = 9,18%

Taigi tikimybė, kad darbuotojai uždirbs daugiau nei 80 000 USD per metus, yra 9,18%.

Naudoja

  • Akcijų rinkos techninė diagrama dažnai yra skambučio kreivė, leidžianti analitikams ir investuotojams daryti statistines išvadas apie numatomą akcijų grąžą ir riziką.
  • Jis naudojamas realiame pasaulyje, pavyzdžiui, siekiant nustatyti labiausiai tikėtiną laiką, kurį picų kompanijos užima picai tiekti ir dar daugiau realių programų.
  • Naudojamas lyginant tam tikros populiacijos rinkinio aukštį, kuriame dauguma žmonių turės vidutinį dydį, o labai nedaug žmonių turi aukštesnį ar mažesnį nei vidutinis ūgį.
  • Jie naudojami nustatant vidutinius studentų akademinius rezultatus, kurie padeda palyginti studentų rangą.

Išvada

Normalus paskirstymas randa duomenų mokslo ir duomenų analizės programas. Pažangios technologijos, tokios kaip dirbtinis intelektas ir mašininis mokymasis, naudojamos kartu su šiuo paskirstymu, gali suteikti geresnę duomenų kokybę, kuri padės asmenims ir įmonėms efektyviai priimti sprendimus.

Įdomios straipsniai...