NÁHODNÝ VÝBER VZORIEK: METODIKA, VÝHODY, NEVÝHODY, PRÍKLADY - MATEMATIKA

Náhodný výber je, ako vybrať štatisticky reprezentatívnej vzorky z danej populácie. Je súčasťou zásady, že každý prvok vo vzorke musí mať rovnakú pravdepodobnosť výberu.

Remíza je príkladom náhodného výberu, pri ktorom je každému členovi účastníckej populácie pridelené číslo. Na výber čísel zodpovedajúcich tombolom (vzorka) sa používa nejaká náhodná technika, napríklad extrahovanie čísel, ktoré boli zaznamenané na rovnakých kartách, z poštovej schránky.

Obrázok 1. Pri náhodnom odbere vzoriek sa vzorka náhodne vyberie z populácie pomocou určitej techniky, ktorá zabezpečí, že všetky prvky budú mať rovnakú pravdepodobnosť výberu. Zdroj: netquest.com.

Pri náhodnom výbere vzoriek je nevyhnutné primerane zvoliť veľkosť vzorky, pretože nereprezentatívna vzorka populácie môže viesť k chybným záverom v dôsledku štatistických výkyvov.

Veľkosť vzorky

Existujú vzorce na určenie správnej veľkosti vzorky. Najdôležitejším faktorom, ktorý treba zvážiť, je, či je známa veľkosť populácie. Pozrime sa na vzorce, aby sme určili veľkosť vzorky:

Prípad 1: veľkosť populácie nie je známa

Keď nie je známa veľkosť populácie N, je možné vybrať vzorku primeranej veľkosti n, aby sa určilo, či je určitá hypotéza pravdivá alebo nepravdivá.

Na tento účel sa používa tento vzorec:

Kde:

-p je pravdepodobnosť, že hypotéza je pravdivá.

-q je pravdepodobnosť, že tomu tak nie je, preto q = 1 - p.

-E je relatívna hranica chyby, napríklad chyba 5% má maržu E = 0,05.

-Z má čo do činenia s úrovňou dôveryhodnosti, ktorú vyžaduje štúdia.

V normalizovanom (alebo normalizovanom) normálnom rozdelení má úroveň spoľahlivosti 90% Z = 1,645, pretože pravdepodobnosť, že výsledok je medzi -1,645σ a + 1,645σ, je 90%, kde σ je štandardná odchýlka ,

Úrovne spoľahlivosti a ich zodpovedajúce hodnoty Z

1.- 50% úroveň spoľahlivosti zodpovedá Z = 0,675.

2.- 68,3% úroveň spoľahlivosti zodpovedá Z = 1.

3,- 90% úroveň spoľahlivosti je ekvivalentná Z = 1645.

4 - 95% úroveň spoľahlivosti zodpovedá Z = 1,96

5 - 95,5% úroveň spoľahlivosti zodpovedá Z = 2.

6 - 99,7% úroveň spoľahlivosti je ekvivalentná Z = 3.

Príkladom, kde sa dá tento vzorec uplatniť, je štúdia, ktorá určuje priemernú hmotnosť kamienkov na pláži.

Je zrejmé, že nie je možné študovať a vážiť všetky kamienky na pláži, takže je vhodné extrahovať vzorku čo najhodnejšie as primeraným počtom prvkov.

Obrázok 2. Na štúdium charakteristík kamienkov na pláži je potrebné vybrať náhodnú vzorku s reprezentatívnym počtom z nich. (Zdroj: pixabay)

Prípad 2: veľkosť populácie je známa

Ak je známy počet N prvkov, ktoré tvoria určitú populáciu (alebo vesmír), ak chceme vybrať štatisticky významnú vzorku veľkosti n jednoduchým náhodným výberom, je to vzorec:

Kde:

-Z je koeficient spojený s úrovňou spoľahlivosti.

-p je pravdepodobnosť úspechu hypotézy.

-q je pravdepodobnosť zlyhania v hypotéze, p + q = 1.

-N je veľkosť celkovej populácie.

-E je relatívna chyba výsledku štúdie.

Príklady

Metodika extrahovania vzoriek do značnej miery závisí od typu štúdie, ktorá sa musí urobiť. Preto má náhodný odber vzoriek nekonečný počet aplikácií:

Prieskumy a dotazníky

Napríklad v telefónnych prieskumoch sa ľudia, s ktorými sa má konzultovať, vyberajú pomocou generátora náhodných čísel, ktorý je použiteľný v skúmanom regióne.

Ak chcete vyplniť dotazník pre zamestnancov veľkej spoločnosti, môžete sa uchýliť k výberu respondentov prostredníctvom ich zamestnaneckého čísla alebo čísla preukazu totožnosti.

Uvedené číslo sa musí zvoliť aj náhodne, napríklad pomocou generátora náhodných čísel.

Obrázok 3. Dotazník je možné použiť náhodným výberom účastníkov. Zdroj: Pixabay.

QA

V prípade, že sa štúdia týka častí vyrobených strojom, musia sa časti vybrať náhodne, ale z šarží vyrobených v rôznych časoch dňa alebo v rôznych dňoch alebo týždňoch.

výhoda

Jednoduchý náhodný odber vzoriek:

- Umožňuje znížiť náklady na štatistickú štúdiu, pretože nie je potrebné študovať celú populáciu, aby sa získali štatisticky spoľahlivé výsledky, s požadovanou úrovňou spoľahlivosti a úrovňou chýb vyžadovanou v štúdii.

- Vyvarujte sa zaujatosti: keďže výber prvkov, ktoré sa majú študovať, je úplne náhodný, štúdia verne odráža charakteristiky populácie, hoci sa skúmala iba jej časť.

nevýhody

- Metóda nie je primeraná v prípadoch, keď chcete poznať preferencie v rôznych skupinách alebo vrstvách obyvateľstva.

V tomto prípade je výhodné vopred určiť skupiny alebo segmenty, na ktorých sa má štúdia vykonať. Ak sú vrstvy alebo skupiny definované, potom je vhodné, aby každá z nich použila náhodný výber.

- Je veľmi nepravdepodobné, že sa získajú informácie o menšinových odvetviach, o ktorých je niekedy potrebné poznať ich charakteristiky.

Napríklad, ak ide o kampaň za drahý produkt, je potrebné poznať preferencie najbohatších menšinových odvetví.

Cvičenie bolo vyriešené

Chceme študovať preferencie populácie pre určitý nápoj z coly, ale v tejto populácii nie je žiadna predchádzajúca štúdia, jej veľkosť nie je známa.

Na druhej strane musí byť vzorka reprezentatívna s minimálnou úrovňou spoľahlivosti 90% a závery musia mať percentuálnu chybu 2%.

-Ako určiť veľkosť n vzorky?

- Aká by bola veľkosť vzorky, ak by sa miera chyby zvýšila na 5%?

Riešenie

Pretože veľkosť populácie nie je známa, na stanovenie veľkosti vzorky sa použije vyššie uvedený vzorec:

n = (Z ² p q) / (E ² )

Predpokladáme, že je rovnaká pravdepodobnosť preferencie (p) pre našu značku nealkoholických nápojov ako preferencie (q), takže p = q = 0,5.

Na druhej strane, keďže výsledkom štúdie musí byť percentuálna chyba menšia ako 2%, potom relatívna chyba E bude 0,02.

Nakoniec hodnota Z = 1645 vyvolá hladinu spoľahlivosti 90%.

V súhrne máme nasledujúce hodnoty:

Z = 1645

p = 0,5

q = 0,5

E = 0,02

S týmito údajmi sa vypočíta minimálna veľkosť vzorky:

n = (1,645 ² 0,5 0,5) / (0,02 ² ) = 1691.3

To znamená, že v štúdii s požadovanou mierou chybovosti as vybranou úrovňou spoľahlivosti musí byť vybraná vzorka respondentov s minimálne 1692 jedincami vybraná jednoduchým náhodným výberom.

Ak pôjdete z rozpätia chyby 2% až 5%, potom je nová veľkosť vzorky:

n = (1,645 ² 0,5 0,5) / (0,05 ² ) = 271

Čo je výrazne nižší počet osôb. Záverom možno povedať, že veľkosť vzorky je veľmi citlivá na požadovanú mieru chyby v štúdii.

Referencie

Berenson, M. 1985. Štatistika pre riadenie a ekonomiku, koncepty a aplikácie. Editorial Interamericana.
Štatistiky. Náhodné vzorkovanie. Prevzaté z: encyclopediaeconomica.com.
Štatistiky. Vzorkovanie. Získané z: Estadistica.mat.uson.mx.
Explorable. Náhodné vzorkovanie. Obnovené z: explorable.com.
Moore, D. 2005. Aplikované základné štatistiky. 2 .. Vydanie.
Netquest. Náhodné vzorkovanie. Obnovené z: netquest.com.
Wikipedia. Štatistické výbery. Obnovené z: en.wikipedia.org

NÁHODNÝ VÝBER VZORIEK: METODIKA, VÝHODY, NEVÝHODY, PRÍKLADY - MATEMATIKA - 2026