Išskirtinė formulė - Išsamių rezultatų apskaičiavimas žingsnis po žingsnio (su pavyzdžiu)

Išorinė formulė pateikia grafinį įrankį, skirtą apskaičiuoti duomenis, esančius už nurodyto paskirstymo rinkinio, kuris gali būti vidinis arba išorinis, priklausomai nuo kintamųjų.

Kas yra „Outlier Formula“?

Išskirtinis yra pateiktos imties arba stebėjimo duomenų taškas arba pasiskirstymas, kuris neturi atitikti viso modelio. Paprastai naudojama taisyklė, sakanti, kad duomenų taškas bus laikomas ribiniu, jei jis turi daugiau nei 1,5 IQR žemiau pirmojo kvartilio arba virš trečiojo kvartilio.

Kitaip tariant, mažos pašalinės reikšmės turi būti žemesnės nei Q1-1,5 IQR, o didelės pašalintos - Q3 + 1,5IQR

Reikia apskaičiuoti medianą, kvartiles, įskaitant IQR, Q1 ir Q3.

Išskirtinė formulė pateikiama taip,

Už Q1 Formulės = ¼ (n + 1) -oji terminas  už Q3 Formulės = ¾ (n + 1) -oji terminas  už Q2 Formulės = Q3 - Q1

Žingsnis po žingsnio apskaičiuojamas išvestinis

Norint apskaičiuoti išvestį, reikia atlikti toliau nurodytus veiksmus.

  • 1 žingsnis: Pirmiausia apskaičiuokite kvartiles, ty Q1, Q2 ir interkvartilius
  • 2 žingsnis: Dabar apskaičiuokite vertę Q2 * 1,5
  • 3 žingsnis: Dabar atimkite Q1 vertę iš 2 žingsnyje apskaičiuotos vertės
  • 4 žingsnis: Čia pridėkite Q3 su 2 žingsnyje apskaičiuota verte
  • 5 žingsnis: sukurkite 3 ir 4 veiksmuose apskaičiuotų verčių diapazoną
  • 6 žingsnis: išdėstykite duomenis didėjimo tvarka
  • 7 veiksmas: patikrinkite, ar yra kokių nors verčių, esančių žemiau ar didesnio už 5 žingsnyje sukurtą diapazoną.

Pavyzdys

Apsvarstykite šių skaičių duomenų rinkinį: 10, 2, 4, 7, 8, 5, 11, 3, 12. Jūs turite apskaičiuoti visus pašalinius rodiklius.

Sprendimas:

Pirmiausia turime surikiuoti duomenis didėjimo tvarka, kad rastume medianą, kuri mums bus Q2.

2, 3, 4, 5, 7, 8, 10, 11, 12

Kadangi stebėjimų skaičius yra nelyginis, kuris yra 9, mediana gulėtų 5 -oje pozicijoje, kuri yra 7, ir tas pats bus Q2 šiame pavyzdyje.

Todėl Q1 apskaičiuojamas taip:

Q1 = ¼ (9 + 1)

= ¼ (10)

Q1 bus -

Q1 = 2,5 terminas

Tai reiškia, kad Q1 yra stebėjimų antrosios ir trečiosios padėties vidurkis , kuris čia yra 3 ir 4, ir tos pačios vertės vidurkis yra (3 + 4) / 2 = 3,5

Todėl Q3 apskaičiuojamas taip:

Q3 = ¾ (9 + 1)

= ¾ (10)

Q3 bus -

Q3 = 7,5 terminas

Tai reiškia, kad Q3 vidutinis iš 7 -osios ir 8 -oji iš stebėjimų poziciją, kuri yra 10 ir 11 "čia, ir vidurkis tas pats (10 + 11) / 2 = 10,5

Dabar žemų pašalinių rodiklių vertė turi būti žemesnė už Q1–1,5IQR, o aukštųjų - Q3–1,5IQR

Taigi vertės yra 3,5 - (1,5 * 7) = -7, o didesnis diapazonas yra 10,5 + (1,5 * 7) = 110,25.

Kadangi nėra jokių stebėjimų, kurie būtų virš arba žemesni už 110,25 ir -7, šioje imtyje neturime pašalinių reikšmių.

Išskirtinės formulės „Excel“ pavyzdys (su „Excel“ šablonu)

Kūrybinių koučingo užsiėmimų metu svarstoma apdovanoti studentus, patekusius į 25% geriausiųjų. Tačiau jie nori išvengti bet kokių pašalinių rezultatų. Duomenys skirti 25 studentams. Naudokite Outlier lygtį norėdami nustatyti, ar yra outlier?

Sprendimas:

Žemiau pateikiami duomenys, skirti apskaičiuoti nukrypimą.

Stebėjimų skaičius yra 25, o pirmasis žingsnis būtų aukščiau išvardytų neapdorotų duomenų konvertavimas didėjimo tvarka.

Mediana bus -

Vidutinė vertė = ½ (n + 1)

= ½ = ½ (26)

= 13 -oji kadencija

Q2 arba mediana yra 68,00

Tai yra 50% gyventojų.

Q1 bus -

Q1 = ¼ (n + 1)-asis terminas

= ¼ (25 + 1)

= ¼ (26)

= 6,5 -oji kadencija, kuri atitinka 7 -ąją kadenciją

Q1 yra 56,00, tai yra apatinė 25% dalis

Q3 bus -

Galiausiai Q3 = ¾ (n + 1)-asis terminas

= ¾ (26)

= 19,50 terminas

Čia vidutinis reikia imtis, o tai yra 19 -ojo ir 20 -ojo sąlygomis, kurios 77 ir 77, o vidurkis pats (77 + 77) / 2 = 77.00

Q3 yra 77, o tai yra 25% aukščiausių

Žemas nuotolis

Dabar žemų pašalinių rodiklių vertė turi būti žemesnė už Q1–1,5IQR, o aukštųjų - Q3–1,5IQR

Aukštas nuotolis -

Taigi vertės yra 56 - (1,5 * 68) = -46, o didesnis diapazonas yra 77 + (1,5 * 68) = 179.

Pašalinių nėra.

Aktualumas ir naudojimas

Išskirtinių formulę labai svarbu žinoti, nes gali būti duomenų, kurie iškreiptų tokią vertę. Paimkite 2, 4, 6, 101 stebėjimų pavyzdį, o dabar, jei kas nors ims šių verčių vidurkį, tai bus 28,25, bet 75% stebėjimų yra žemiau 7, taigi būtų neteisingas sprendimas dėl šį pavyzdį.

Čia galima pastebėti, kad 101 aiškiai parodo kontūrą, o jei tai bus pašalinta, tada vidurkis būtų 4, o tai apie vertes ar pastebėjimus sako, kad jie yra 4 diapazone. Todėl labai svarbu tai atlikti siekiant išvengti bet kokio piktnaudžiavimo pagrindine duomenų informacija. Jie yra plačiai naudojami statistikų visame pasaulyje, kai jie atlieka tyrimus.

Įdomios straipsniai...