Empirinė taisyklė - apibrėžimas, formulė, kaip naudoti statistikoje?

Kas yra empirinė taisyklė statistikoje?

Empirinė statistikos taisyklė teigia, kad beveik visi (95%) normalaus pasiskirstymo stebėjimai yra 3 standartinių nuokrypių nuo vidurkio ribose. Tai yra labai svarbi taisyklė ir padeda prognozuoti.

Formulė

Formulė rodo numatomą stebėjimų procentą, priklausantį kiekvienam standartiniam nuokrypiui nuo vidurkio.

Taisyklė sako, kad:

  • 68% stebėjimų bus +/- 1 standartinis nuokrypis nuo vidurkio
  • 95% stebėjimų bus +/- 2 standartiniai nuokrypiai nuo vidurkio
  • 7% stebėjimų bus +/- 3 standartinių nuokrypių nuo vidurkio ribose

Kaip naudoti?

Tai naudojama prognozuojant duomenų rinkinio tendencijas. Kai duomenų rinkinys yra platus ir sunku tirti visą populiaciją, imčiai gali būti taikoma empirinė taisyklė, kad būtų galima įvertinti, kaip reaguos populiacijos duomenys, jei jūsų bus prašoma rasti visų vidutinį atlyginimą. buhalterių JAV. Tuomet tai atlikti yra nelengva, nes gyventojų skaičius yra milžiniškas. Taigi tokiu atveju galite pasirinkti, tarkime, 90 stebėjimų atsitiktinai iš visų gyventojų.

Taigi dabar turėsite 90 atlyginimų. Turite rasti stebėjimų vidutinį ir standartinį nuokrypį. Jei stebėjimas atliekamas pagal įprastą paskirstymą, tai galima pritaikyti ir įvertinti visų JAV buhalterių atlyginimus.

Tarkime, kad vidutinis imties atlyginimas yra 90 000 USD. Standartinis nuokrypis yra 5000 USD. Taigi iš visų gyventojų 68% buhalterių gauna atlyginimą, kuris svyruoja tarp +/- 1 standartinio nuokrypio nuo vidurkio. Kadangi vidurkis yra 90 000 USD, o standartinis nuokrypis - 5 000 USD. Taigi 68% visų buhalterių JAV mokama nuo 90 000 USD +/- (1 * 5 000 USD). Tai yra nuo 85 000 iki 95 000 USD

Jei mes paskirstysime šiek tiek daugiau, tada 95% visų JAV buhalterių mokama vidutinių +/- 2 standartinių nuokrypių diapazone. 90 000 USD +/- (2 * 5000). Taigi diapazonas yra nuo 80 000 iki 100 000 USD.

Platesniame diapazone 99,7% visų buhalterių moka atlyginimus, kurie svyruoja nuo Vidutinis +/- 3 Standartiniai nuokrypiai. Tai yra 90 000 +/- (3 * 5000). Diapazonas yra nuo 75 000 iki 105 000 USD

Jūs aiškiai matote, kad netyrus visų gyventojų, galima įvertinti gyventojų skaičių. Jei kas nors planuoja dirbti buhalteriu JAV, jis lengvai gali tikėtis, kad jo atlyginimas svyruos nuo 75 000 iki 105 000 USD

Toks vertinimas padeda palengvinti darbą ir prognozuoti ateitį.

Empirinių taisyklių pavyzdžiai

Ponas X bando išsiaiškinti vidutinį metų, per kurį žmogus išgyvena išėjęs į pensiją, skaičių, manydamas, kad pensinis amžius yra 60 metų. Jei 50 atsitiktinių stebėjimų vidutinis išgyvenamumas yra 20 metų, o SD - 3, tada sužinokite tikimybę, kad asmuo gaus pensiją daugiau nei 23 metams

Sprendimas

Empirinėje taisyklėje teigiama, kad 68% stebėjimų bus 1 standartinio nuokrypio nuo vidurkio ribose. Čia stebėjimų vidurkis yra 20.

68% stebėjimų bus 20 +/- 1 (standartinis nuokrypis), kuris yra 20 +/- 3. Taigi diapazonas yra nuo 17 iki 23.

Yra 68% tikimybė, kad minimalūs metų, kuriuos žmogus išgyvena išėjęs į pensiją, dydis yra nuo 17 iki 23. Dabar procentas, kuris guli už šios ribos, yra (100–68) = 32%. 32 yra paskirstytas vienodai abiem pusėms, o tai reiškia 16% tikimybę, kad minimalūs metai bus mažesni nei 17, ir 16% tikimybę, kad minimalūs metai bus didesni nei 23.

Taigi tikimybė, kad asmuo gaus daugiau nei 23 metų pensiją, yra 16%.

Empirinė taisyklė prieš Čebyševo teoremą

Empirinė taisyklė taikoma duomenų rinkiniams, kurie laikosi įprasto pasiskirstymo, o tai reiškia varpo formos. Normaliame pasiskirstyme abi skirstinio pusės turi 50% tikimybę.

Jei duomenų rinkinys paprastai nėra paskirstytas, tada yra dar vienas aproksimavimas arba taisyklė, taikoma visų tipų duomenų rinkiniams, tai yra Chebyševo teorema. Tai sako tris dalykus:

  • Bent 3/4 oji visų stebėjimų bus neperžengti 2Norminis nukrypimai nuo vidurkio. Tai tvirtas derinimas. Tai reiškia, kad jei yra 100 stebėjimų, tai 3/4 -oji stebėjimų, kurie yra 75 stebėjimai, bus +/- 2 standartinių nuokrypių nuo vidurkio ribose.
  • Mažiausiai 8/9 tūkst . Visų stebėjimų bus 3 standartinių nuokrypių nuo vidurkio ribose.
  • Mažiausiai 1 - 1 / k 2 visų stebėjimų yra K standartinių nuokrypių nuo vidurkio ribose. Čia K vadinamas bet kokiu sveikuoju skaičiumi.

Kada naudoti?

Duomenys yra tarsi auksas šiuolaikiniame pasaulyje. Yra daugybė duomenų, gaunamų iš skirtingų šaltinių ir naudojami skirtingoms apytikslėms ar prognozėms. Jei duomenų rinkinys seka įprastą pasiskirstymą, jis rodo varpelio formos kreivę; tada gali būti naudojama empirinė taisyklė. Jis taikomas stebėjimams, norint sukurti gyventojų aproksimaciją.

Kai pastebima, kad stebėjimai rodo normalaus pasiskirstymo struktūrą, vadovaujantis empirine taisykle nustatomos kelios stebėjimų tikimybės. Taisyklė yra labai naudinga daugeliui statistinių prognozių.

Išvada

„Empirinė taisyklė“ yra statistinė sąvoka, padedanti pavaizduoti stebėjimų tikimybę ir yra labai naudinga ieškant didžiulės populiacijos aproksimacijos. Visada reikia pažymėti, kad tai yra apytiksliai. Visada yra tikimybė, kad nepaskirstyti nepateks. Taigi išvados nėra tikslios, todėl reikėtų imtis atsargumo priemonių, elgiantis pagal prognozę.

Įdomios straipsniai...