- Vzorce a rovnice
- Dôležité štatistické premenné
- Model a vlastnosti
- Hlavné vlastnosti hypergeometrického rozdelenia
- Aproximácia pomocou binomického rozdelenia
- Príklad 2
- Riešené cvičenia
- Cvičenie 1
- Riešenie
- Cvičenie 2
- Riešenie
- Cvičenie 3
- Riešenie
- Riešenie c
- Referencie
Hypergeometrické rozdelenie je diskrétny štatistické funkcie, vhodné pre výpočet pravdepodobnosti v randomizovaných experimentov s dvoma možnými výsledkami. Podmienkou na jej uplatnenie je, že ide o malé populácie, v ktorých sa výbery nenahrádzajú a pravdepodobnosti nie sú konštantné.
Preto, ak je niektorý z prvkov zvolený tak, aby poznal výsledok (pravdivý alebo nepravdivý) určitej charakteristiky, nemôže sa ten istý prvok znova zvoliť.

Obrázok 1. V populácii skrutiek, ako je táto, sú určite chybné vzorky. Zdroj: Pixabay.
Určite je teda pravdepodobné, že nasledujúci vybraný prvok získa skutočný výsledok, ak predchádzajúci prvok mal negatívny výsledok. To znamená, že pravdepodobnosť sa mení, keď sa prvky extrahujú zo vzorky.
Hlavnými aplikáciami hypergeometrického rozdelenia sú: kontrola kvality v procesoch s malou populáciou a výpočet pravdepodobnosti hazardných hier.
Pokiaľ ide o matematickú funkciu, ktorá definuje hypergeometrické rozdelenie, pozostáva z troch parametrov, ktoré sú:
- Počet prvkov obyvateľstva (N)
- Veľkosť vzorky (m)
- Počet udalostí v celej populácii s priaznivým (alebo nepriaznivým) výsledkom sledovanej charakteristiky (n).
Vzorce a rovnice
Vzorec pre hypergeometrické rozdelenie udáva pravdepodobnosť P, že nastanú x priaznivé prípady určitej charakteristiky. Matematický spôsob písania na základe kombinatorických čísel je:

V predchádzajúcom výraze N, n a m sú parametre a x je samotná premenná.
- Celkový počet obyvateľov je N.
- Počet pozitívnych výsledkov určitej binárnej charakteristiky vzhľadom na celkovú populáciu je n.
- Množstvo prvkov vo vzorke je m.
V tomto prípade je X náhodná premenná, ktorá berie hodnotu x a P (x) naznačuje pravdepodobnosť výskytu x priaznivých prípadov skúmanej charakteristiky.
Dôležité štatistické premenné
Ďalšie štatistické premenné pre hypergeometrické rozdelenie sú:
- priemerný μ = m * n / N
- Variant σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- smerodajná odchýlka σ, ktorá je druhou odmocninou rozptylu.
Model a vlastnosti
Aby sme dospeli k modelu hypergeometrického rozdelenia, vychádzame z pravdepodobnosti získania x priaznivých prípadov vo vzorke veľkosti m. Táto vzorka obsahuje prvky, ktoré vyhovujú skúmanej vlastnosti, a prvky, ktoré tak nie sú.
Pripomeňme, že n predstavuje počet priaznivých prípadov v celkovej populácii prvkov N. Potom by sa pravdepodobnosť vypočítala takto:
Vyjadrením vyššie uvedeného vo forme kombinatorických čísel sa dosiahne tento model rozdelenia pravdepodobnosti:

Hlavné vlastnosti hypergeometrického rozdelenia
Sú to tieto:
- Vzorka musí byť vždy malá, aj keď je populácia veľká.
- Prvky vzorky sa extrahujú jeden po druhom bez toho, aby sa začlenili späť do populácie.
- Vlastnosť, ktorá sa má študovať, je binárna, to znamená, že môže mať iba dve hodnoty: 1 alebo 0, alebo true alebo false.
V každom kroku extrakcie prvkov sa pravdepodobnosť mení v závislosti od predchádzajúcich výsledkov.
Aproximácia pomocou binomického rozdelenia
Ďalšou vlastnosťou hypergeometrického rozdelenia je to, že sa dá aproximovať binomickým rozdelením označeným Bi, pokiaľ je populácia N veľká a najmenej 10-krát väčšia ako vzorka m. V tomto prípade by to vyzeralo takto:
Pravdepodobnosť, že x = 3 skrutky vo vzorke sú chybné, je: P (500, 5, 60, 3) = 0,0129.
Pravdepodobnosť, že x = 4 skrutky zo šesťdesiatich vzoriek sú chybné, je: P (500, 5, 60; 4) = 0,0008.
Nakoniec pravdepodobnosť, že x = 5 skrutiek v tejto vzorke je chybných, je: P (500, 5, 60; 5) = 0.
Ak však chcete poznať pravdepodobnosť, že v tejto vzorke je viac ako 3 chybné skrutky, musíte získať kumulatívnu pravdepodobnosť a pridať:
Tento príklad je znázornený na obrázku 2, ktorý sa získal pri použití bezplatného softvéru GeoGebra, ktorý sa bežne používa v školách, ústavoch a na univerzitách.

Obrázok 2. Príklad hypergeometrického rozdelenia. Pripravil F. Zapata s GeoGebra.
Príklad 2
Španielska paluba má 40 kariet, z ktorých 10 má zlato a zvyšných 30 nie. Predpokladajme, že z tohto balíčka sa náhodne vyberie 7 kariet, ktoré sa do balíčka neregistrujú.
Ak X je počet zlatých prítomných na siedmich vylosovaných kartách, pravdepodobnosť, že budete mať x zlatých v remíze na 7 kartách, je daná hypergeometrickým rozdelením P (40,10,7; x).
Pozrime sa na to takto: na výpočet pravdepodobnosti, že budú mať 4 zlaty na remíze so 7 kartami, použijeme vzorec hypergeometrického rozdelenia s nasledujúcimi hodnotami:

Výsledok je: 4,57% pravdepodobnosť.
Ak však chcete poznať pravdepodobnosť získania viac ako 4 kariet, musíte pridať:
Riešené cvičenia
Nasledujúci súbor cvičení je určený na ilustráciu a prispôsobenie pojmov, ktoré boli uvedené v tomto článku. Je dôležité, aby sa ich čitateľ pokúsil vyriešiť sám pred tým, ako sa pozrie na riešenie.
Cvičenie 1
Továreň na kondóm zistila, že z každých 1000 kondómov vyrobených určitým strojom je 5 chybných. Na kontrolu kvality sa náhodne odoberie 100 kondómov a šarža sa odmietne, ak je najmenej jeden alebo viac poškodených. odpoveď:
a) Aká je možnosť, že veľa 100 bude odstránených?
b) Je toto kritérium kontroly kvality účinné?
Riešenie
V tomto prípade sa objavia veľmi veľké kombinatorické čísla. Výpočet je zložitý, pokiaľ nemáte vhodný softvérový balík.
Ale pretože ide o veľkú populáciu a vzorka je desaťkrát menšia ako celková populácia, je možné použiť aproximáciu hypergeometrického rozdelenia pomocou binomického rozdelenia:
Vo vyššie uvedenom výraze C (100, x) je kombinatorické číslo. Pravdepodobnosť výskytu viac ako jednej chyby sa potom vypočíta takto:
Je to vynikajúca aproximácia v porovnaní s hodnotou získanou použitím hypergeometrického rozdelenia: 0,4102
Dá sa povedať, že s pravdepodobnosťou 40% by sa mala zlikvidovať dávka 100 profylaktík, čo nie je príliš účinné.
Ak by však bol proces kontroly kvality o niečo menej náročný a vyradil by šaržu zo 100, iba ak by boli dva alebo viac defektov, pravdepodobnosť vyradenia šarže by klesla iba na 8%.
Cvičenie 2
Stroj na výrobu plastových blokov pracuje takým spôsobom, že z každých 10 kusov sa jeden deformuje. Ako je pravdepodobné, že vo vzorke 5 kusov je chybný iba jeden kus?
Riešenie
Obyvateľstvo: N = 10
Počet n defektov pre každé N: n = 1
Veľkosť vzorky: m = 5

Preto existuje 50% pravdepodobnosť, že vo vzorke 5 bude blok deformovaný.
Cvičenie 3
Na stretnutí mladých absolventov stredných škôl je 7 žien a 6 pánov. Medzi dievčatami študujú humanitné vedy a 3 vedy. V skupine chlapcov študuje 1 humanitné a 5 vedecké odbory. Vypočítajte nasledujúce:
a) Výber troch dievčat náhodne: ako je pravdepodobné, že všetci študujú humanitné vedy?
b) Ak sú náhodne vybraní traja účastníci stretnutia priateľov: Aká je možnosť, že traja z nich, bez ohľadu na pohlavie, študujú vedu všetci traja, alebo humanitné vedy tiež všetci traja?
c) Teraz náhodne vyberte dvoch priateľov a zavolajte x náhodnú premennú „počet tých, ktorí študujú humanitné vedy“. Medzi dvomi vybranými stanovte strednú alebo očakávanú hodnotu x a rozptyl σ ^ 2.
Riešenie
Hodnoty, ktoré sa majú teraz použiť, sú:
-Populácia: N = 14
- Množstvo na štúdium písmen je: n = 6 a
- Veľkosť vzorky: m = 3.
- Počet priateľov študujúcich humanitné vedy: x
Podľa toho x = 3 znamená, že všetky tri humanitné vedy študujú, ale x = 0 znamená, že žiadne humanitné vedy neštudujú. Pravdepodobnosť, že všetky tri štúdie sú rovnaké, je daná súčtom:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Potom máme 21% pravdepodobnosť, že traja náhodne vybraní účastníci stretnutí budú študovať to isté.
Riešenie c
Tu máme nasledujúce hodnoty:
N = 14 celková populácia priateľov, n = 6 celkový počet v populácii študujúcich humanitné vedy, veľkosť vzorky je m = 2.
Dúfam, že:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
A rozptyl:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0,4521
Referencie
- Diskrétne rozdelenie pravdepodobnosti. Získané z: biplot.usal.es
- Štatistika a pravdepodobnosť. Hypergeometrické rozdelenie. Obnovené z: projectdescartes.org
- CDPYE-UGR. Hypergeometrické rozdelenie. Získané z: ugr.es
- Geogebra. Klasická geogebra, pravdepodobnostný počet. Získané z geogebra.org
- Vyskúšajte ľahké. Riešené problémy hypergeometrického rozdelenia. Obnovené z: probafacil.com
- Minitab. Hypergeometrické rozdelenie. Obnovené z: support.minitab.com
- Univerzita Vigo. Hlavné diskrétne rozdelenia. Obnovené z: anapg.webs.uvigo.es
- Vitutor. Štatistika a kombinatorika. Obnovené z: vitutor.net
- Weisstein, Eric W. Hypergeometrická distribúcia. Obnovené z: mathworld.wolfram.com
- Wikipedia. Hypergeometrické rozdelenie. Obnovené z: es.wikipedia.com
