- Vzorce a rovnice
- Ako vypočítať chybu vzorkovania
- Pre istotu
- Príklady
- - Príklad 1
- Riešenie
- - Príklad 2
- Riešenie
- - Príklad 3
- Riešenie
- - Príklad 4
- Riešenie
- - Cvičenie 5
- Riešenie
- Referencie
Vzorkovanie chyby alebo vzorkovania chyba v štatistikách je rozdiel medzi priemernou hodnotou vzorky a stredná hodnota z celkovej populácie. Na ilustráciu tejto myšlienky si predstavme, že celková populácia mesta je milión ľudí, z ktorých chcete dosiahnuť priemernú veľkosť obuvi, pre ktorú je odobratá náhodná vzorka tisíce ľudí.
Priemerná veľkosť, ktorá sa získa zo vzorky, sa nemusí nevyhnutne zhodovať s veľkosťou celej populácie, hoci ak vzorka nie je ovplyvnená, hodnota musí byť blízko. Tento rozdiel medzi strednou hodnotou vzorky a priemerom celkovej populácie predstavuje chybu vo vzorke.

Obrázok 1. Pretože vzorka je podskupinou celkovej populácie, priemer vzorky má medzu chyby. Zdroj: F. Zapata.
Priemerná hodnota celkovej populácie nie je všeobecne známa, existujú však techniky na zníženie tejto chyby a vzorce na odhad rozpätia chybovosti pri výbere vzoriek, o ktorom sa bude hovoriť v tomto článku.
Vzorce a rovnice
Povedzme, že chceme poznať priemernú hodnotu určitej merateľnej charakteristiky x v populácii veľkosti N, ale keďže N je veľké množstvo, nie je možné vykonať štúdiu o celkovej populácii, potom pristúpime k odberu náhodnej vzorky veľkosť n <
Stredná hodnota vzorky je označená 
Predpokladajme, že m vzorky sa odoberajú z celkovej populácie N, všetky rovnakej veľkosti n so strednými hodnotami 
Tieto stredné hodnoty nebudú navzájom identické a budú sa pohybovať okolo priemernej hodnoty μ μ. Rozpätie chyby vzorkovania E označuje očakávané oddelenie stredných hodnôt
Štandardná odchýlka chyby ε vzorky veľkosti n je:
ε = σ / √n
kde σ je štandardná odchýlka (druhá odmocnina rozptylu), ktorá sa vypočíta pomocou tohto vzorca:
σ = √
Význam štandardného chybového rozpätia ε je nasledujúci:
Priemerná hodnota 
Ako vypočítať chybu vzorkovania
V predchádzajúcej časti bol uvedený vzorec na nájdenie štandardného chybového rozpätia vzorky s veľkosťou n, kde slovo štandard naznačuje, že ide o chybovú medzeru so spoľahlivosťou 68%.
To naznačuje, že ak sa odobralo veľa vzoriek rovnakej veľkosti n, 68% z nich poskytne stredné hodnoty 
Existuje jednoduché pravidlo, nazývané pravidlo 68-95-99.7, ktoré nám umožňuje ľahko nájsť chybovú hranicu vzorkovania E pre úrovne spoľahlivosti 68%, 95% a 99,7%, pretože táto hranica je 1⋅ ε, 2 ⋅ ε a 3⋅ ε.
Pre istotu
Ak hladina spoľahlivosti γ nepatrí medzi vyššie uvedené, potom je vzorkovacia chyba štandardná odchýlka σ vynásobená faktorom Zγ, ktorý sa získa nasledujúcim postupom:
1.- Najprv sa stanoví hladina významnosti α, ktorá sa vypočíta z úrovne spoľahlivosti γ pomocou tohto vzťahu: α = 1 - γ
2.- Potom musíme vypočítať hodnotu 1 - α / 2 = (1 + γ) / 2, ktorá zodpovedá akumulovanej normálnej frekvencii medzi -∞ a Zy, v normálnom alebo gaussovskom rozdelení typizovaného F (z), ktorého definícia je vidieť na obrázku 2.
3.- Rovnica F (Zγ) = 1 - α / 2 sa rieši pomocou tabuliek normálneho rozdelenia (kumulatívne) F alebo pomocou počítačovej aplikácie, ktorá má inverznú gaussovskú funkciu F -1 .
V druhom prípade máme:
Zy = G- l (1 - a / 2).
4.- Nakoniec sa tento vzorec uplatňuje na chybu vzorkovania s úrovňou spoľahlivosti γ:
E = Zγ ⋅ (σ / √n)

Obrázok 2. Tabuľka normálneho rozdelenia. Zdroj: Wikimedia Commons.
Príklady
- Príklad 1
Vypočítajte štandardnú chybovú maržu v priemernej hmotnosti vzorky 100 novorodencov. Výpočet priemernej hmotnosti bol
Riešenie
Štandardná hranica chyby je ε = σ / √n = (1 500 kg) / 100 = 0,15 kg. To znamená, že na základe týchto údajov možno odvodiť, že hmotnosť 68% novorodencov je medzi 2 950 kg a 3,25 kg.
- Príklad 2
Ak je priemerná hmotnosť 3 100 kg pri štandardnej odchýlke σ = 1 500 kg, stanovte rozpätie chyby E a hmotnostný rozsah 100 novorodencov s 95% hladinou spoľahlivosti.
Riešenie
Ak sa uplatňuje pravidlo 68; 95; 99,7 → 1⋅ ε; 2 ε; 3 ε, máme:
E = 2⋅ε = 2–0,15 kg = 0,30 kg
Inými slovami, 95% novorodencov bude mať hmotnosť medzi 2 800 kg a 3 400 kg.
- Príklad 3
Stanovte rozsah hmotností novorodencov v príklade 1 s 99,7% hranicou spoľahlivosti.
Riešenie
Chyba vzorkovania s 99,7% spoľahlivosťou je 3 σ / √n, čo je v našom prípade E = 3 * 0,15 kg = 0,45 kg. Odtiaľ vyplýva, že 99,7% novorodencov bude mať hmotnosť medzi 2 650 kg a 3 550 kg.
- Príklad 4
Stanovte faktor Zγ pre hladinu spoľahlivosti 75%. Určite rozpätie chyby vzorkovania s touto úrovňou spoľahlivosti v prípade uvedenom v príklade 1.
Riešenie
Úroveň spoľahlivosti je γ = 75% = 0,75, ktorá súvisí s hladinou významnosti α prostredníctvom vzťahu γ = (1 - α), takže hladina významnosti je α = 1 - 0,75 = 0 25.
To znamená, že kumulatívna normálna pravdepodobnosť medzi -∞ a Zγ je:
P (Z <Zy) = 1 - 0,125 = 0,875
Čo zodpovedá hodnote Zγ 1,1503, ako je znázornené na obrázku 3.

Obrázok 3. Stanovenie faktoru Zγ, ktoré zodpovedá úrovni spoľahlivosti 75%. Zdroj: F. Zapata cez Geogebra.
Inými slovami, vzorkovacia chyba je E = Zy ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Pri použití na údaje z príkladu 1 dáva chybu:
E = 1,15 x 0,15 kg = 0,17 kg
S úrovňou spoľahlivosti 75%.
- Cvičenie 5
Aká je úroveň spoľahlivosti, ak Z α / 2 = 2,4?
Riešenie
P (Z <Z a / 2 ) = 1 - a / 2
P (Z ≤ 2,4) = 1 - a / 2 = 0,9918 → a / 2 = 1 - 0,9918 = 0,0082 → a = 0,0164
Úroveň významnosti je:
a = 0,0164 = 1,64%
A nakoniec, úroveň dôveryhodnosti zostáva:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Referencie
- Canavos, G. 1988. Pravdepodobnosť a štatistika: Aplikácie a metódy. McGraw Hill.
- Devore, J. 2012. Pravdepodobnosť a štatistika pre techniku a vedu. 8 .. Vydanie. ABI.
- Levin, R. 1988. Štatistika pre správcov. 2 .. Vydanie. Prentice Hall.
- Sudman, S. 1982. Kladenie otázok: Praktický sprievodca navrhovaním dotazníkov. San Francisco. Jossey Bass.
- Walpole, R. 2007. Pravdepodobnosť a štatistika pre strojárstvo a vedy. Pearson.
- Wonnacott, TH a RJ Wonnacott. 1990. Úvodná štatistika. 5. vydanie, Wiley
- Wikipedia. Chyba vzorkovania. Obnovené z: en.wikipedia.com
- Wikipedia. Rozpätie chyby. Obnovené z: en.wikipedia.com

