- Výhody a nevýhody
- Nevýhody rozsahu ako miera rozptylu
- Interkartilný rozsah, kvartily a prepracovaný príklad
- - Výpočet kvartilov
- Prvý kvartil
- Druhý kvartil alebo medián
- Tretí kvartil
- Spracovaný príklad
- Riešenie
- Riešenie b
- Riešenie c
- Referencie
Rozsah , rozsah alebo amplitúdy, v štatistikách, je rozdiel (odčítanie) medzi maximálnou hodnotou a minimálnou hodnotou zo sady dát zo vzorky alebo populácie. Ak je rozsah reprezentovaný písmenom R a údaje sú reprezentované x, vzorec pre rozsah je jednoducho:
R = xmax - x min
Kde x max je maximálna hodnota údajov a x min je minimum.

Obrázok 1. Rozsah údajov zodpovedajúcich obyvateľstvu Cádizu za posledné dve storočia. Zdroj: Wikimedia Commons.
Táto koncepcia je veľmi užitočná ako jednoduchá miera rozptylu na rýchle zhodnotenie variabilnosti údajov, pretože označuje predĺženie alebo dĺžku intervalu, v ktorom sa nachádzajú.
Predpokladajme napríklad, že sa meria výška skupiny 25 študentov prvého ročníka inžinierstva na univerzite. Najvyšší študent v skupine je 1,93 ma najkratší 1,67 m. Toto sú extrémne hodnoty vzorových údajov, preto ich cesta je:
R = 1,93 - 1,67 m = 0,26 m alebo 26 cm.
Výška študentov v tejto skupine je rozdelená pozdĺž tohto rozsahu.
Výhody a nevýhody
Rozsah je, ako sme už povedali, mierou rozloženia údajov. Malý rozsah naznačuje, že údaje sú viac-menej blízko a šírenie je nízke. Na druhej strane väčší rozsah naznačuje, že údaje sú viac rozptýlené.
Výhody výpočtu rozsahu sú zrejmé: je ľahké a rýchle ich nájdenie, pretože je to jednoduchý rozdiel.
Má tiež rovnaké jednotky ako údaje, s ktorými pracuje a koncept je pre každého pozorovateľa veľmi ľahko interpretovateľný.
V príklade výšky študentov technických odborov, ak by bol dosah 5 cm, by sme povedali, že všetci študenti sú približne rovnakej veľkosti. Ale s rozsahom 26 cm okamžite predpokladáme, že vo vzorke sú študenti všetkých stredných výšok. Je tento predpoklad vždy správny?
Nevýhody rozsahu ako miera rozptylu
Ak sa pozrieme pozorne, je možné, že v našej vzorke 25 študentov inžinierstva len jeden z nich meria 1,93 a zostávajúcich 24 má výšky blízke 1,67 m.
Dosah je však stále rovnaký, aj keď opak je úplne možný: výška väčšiny je okolo 1,90 ma iba jedna je 1,67 m.
V oboch prípadoch je distribúcia údajov úplne odlišná.
Nevýhody rozsahu ako miery rozptylu sú preto, že používa iba extrémne hodnoty a ignoruje všetky ostatné. Pretože väčšina informácií sa stratí, nemáte potuchy, ako sa distribuujú vzorové údaje.
Ďalšou dôležitou charakteristikou je, že rozsah vzorky nikdy neklesá. Ak pridáme ďalšie informácie, tj zvážime viac údajov, rozsah sa zvýši alebo zostane rovnaký.
V každom prípade je to užitočné iba pri práci s malými vzorkami, jeho jediné použitie ako miera rozptylu vo veľkých vzorkách sa neodporúča.
Čo sa musí urobiť, je doplniť ho výpočtom iných mier rozptylu, ktoré zohľadňujú informácie poskytnuté celkovými údajmi: medzikvartilové rozpätie, rozptyl, štandardnú odchýlku a variačný koeficient.
Interkartilný rozsah, kvartily a prepracovaný príklad
Uvedomili sme si, že slabinou rozsahu ako miery rozptylu je to, že využíva iba extrémne hodnoty distribúcie údajov, vynecháva ostatné.
Aby sa predišlo týmto nepríjemnostiam, používajú sa kvartily: tri hodnoty známe ako ukazovatele polohy.
Rozdeľujú údaje, ktoré nie sú zoskupené, do štyroch častí (ďalšie bežne používané ukazovatele polohy sú decily a percentily). Toto sú jeho charakteristiky:
-Prvá kvartil Q 1 je hodnota údajov tak, že 25% všetkých z nich je menšia ako Q 1 .
-The druhý kvartil Q 2 je stredná distribúcia, čo znamená, že polovica (50%) z dát je menšia ako táto hodnota.
-Finally, tretí kvartil Q 3 ukazuje, že 75% z dát sú menej ako Q 3 .
Potom sa medzikvartilové rozsah alebo mezikvartilového rozsah je definovaný ako rozdiel medzi treťou kvartil Q 3 a prvým kvartilu Q 1 údajov:
Medzikvartilové rozsah = R Q = Q 3 - Q 1
Týmto spôsobom nie je hodnota rozsahu RQ tak ovplyvnená extrémnymi hodnotami. Z tohto dôvodu je vhodné použiť ho pri riešení skreslených distribúcií, ako sú distribúcie veľmi vysokých alebo veľmi krátkych študentov opísaných vyššie.
- Výpočet kvartilov
Existuje niekoľko spôsobov, ako ich vypočítať, tu navrhneme jeden, ale v každom prípade je potrebné poznať poradové číslo „N o “, čo je miesto, ktoré príslušný kvartil zaberá v distribúcii.
To znamená, že v prípade, napríklad termín, ktorý zodpovedá Q 1 je druhý, tretí alebo štvrtý a tak distribúcie.
Prvý kvartil
N alebo (Q 1 ) = (n + 1) / 4
Druhý kvartil alebo medián
N alebo (Q 2 ) = (n + 1) / 2
Tretí kvartil
N alebo (Q 3 ) = 3 (n + 1) / 4
Kde N je počet údajov.
Medián je hodnota, ktorá je priamo v strede distribúcie. Ak je počet údajov nepárny, nie je problém ich nájsť, ale ak je párny, spriemerujú sa dve stredné hodnoty, aby sa z nich stala jedna.
Po vypočítaní čísla objednávky sa riadi jedným z týchto troch pravidiel:
- Ak nie sú k dispozícii žiadne desatinné miesta, prehľadajú sa údaje uvedené v distribúcii a bude sa hľadať kvartil.
- Ak je poradové číslo na polovici medzi dvoma, potom sa údaje označené celou časťou spriemerujú s nasledujúcimi údajmi a výsledkom je zodpovedajúci kvartil.
- Vo všetkých ostatných prípadoch je zaokrúhlená na najbližšie celé číslo a to bude poloha kvartilu.
Spracovaný príklad
Na stupnici od 0 do 20 získala skupina 16 študentov matematiky I v priebežnej skúške nasledujúce body (body):
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Nájsť:
a) Rozsah alebo rozsah údajov.
b) Hodnoty kvartilov Q 1 a Q 3
c) medzikvartilný rozsah.

Obrázok 2. Majú skóre v tomto matematickom teste tak veľkú variabilitu? Zdroj: Pixabay.
Riešenie
Prvým krokom na nájdenie trasy je zoradenie údajov vo vzostupnom alebo zostupnom poradí. Napríklad v rastúcom poradí máte:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Podľa vzorca uvedeného na začiatku: R = x max - x min
R = 20 - 1 bod = 19 bodov.
Podľa výsledku majú tieto hodnotenia veľký rozptyl.
Riešenie b
N = 16
N alebo (Q 1 ) = (n + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
Je to číslo s desatinnými číslami, ktorých celočíselná časť je 4. Potom ideme k distribúcii, hľadáme údaje, ktoré zaberajú štvrté miesto a jeho hodnota je spriemerovaná s piatou pozíciou. Keďže sú obaja 9, priemer je tiež 9 a tak:
Q 1 = 9
Teraz opakujeme postup na nájdenie Q 3 :
N alebo (Q 3 ) = 3 (n + 1) / 4 = 3 (16 + 1) / 4 = 12.75
Opäť je to desatinné miesto, ale keďže to nie je na polceste, je zaokrúhlené na 13. Hľadané kvartil zaujíma trináste miesto a je:
Q 3 = 16
Riešenie c
R Q = Q 3 - Q 1 = 16 - 9 = 7 bodov.
Ktoré, ako vidíme, sú oveľa menšie ako rozsah údajov vypočítaných v časti a), pretože minimálne skóre bolo 1 bod, čo je hodnota oveľa ďalej od zvyšku.
Referencie
- Berenson, M. 1985. Štatistika pre riadenie a ekonomiku. Interamericana SA
- Canavos, G. 1988. Pravdepodobnosť a štatistika: Aplikácie a metódy. McGraw Hill.
- Devore, J. 2012. Pravdepodobnosť a štatistika pre techniku a vedu. 8 .. Vydanie. ABI.
- Príklady kvartilov. Obnovené z: matematicas10.net.
- Levin, R. 1988. Štatistika pre správcov. 2 .. Vydanie. Prentice Hall.
- Walpole, R. 2007. Pravdepodobnosť a štatistika pre strojárstvo a vedy. Pearson.
