- Príklady
- Klasifikácia kategorických premenných
- Nominálne kategórie
- Radová kategorizácia
- Binárne kategórie
- Štatistika s kategorickými premennými
- Grafické znázornenie kategorických premenných
- Riešené cvičenia
- Cvičenie 1
- Príklad 2
- Príklad 3
- Referencie
Kategorické premenné je ten, použitý v štatistike priradiť non-numerické alebo kvalitatívny charakteristiku alebo vlastnosť nejakého objektu, individuálne, subjektu, stavu alebo postup. Je možné definovať všetky druhy kategorických premenných podľa každej potreby.
Príklady kategorických premenných sú: farba, pohlavie, krvná skupina, rodinný stav, druh materiálu, spôsob platby alebo typ bankového účtu a používajú sa veľa denne.
Obrázok 1: Farba je kategorická premenná. Zdroj: pixabay
Vyššie uvedené sú premenné, ale ich možné hodnoty sú kvalitatívne, to znamená kvality alebo charakteristiky, a nie numerického merania. Napríklad možné hodnoty pre premenlivé pohlavie sú: samec, h embra.
Ak je táto premenná uložená v počítačovom programe, je možné ju deklarovať ako textovú premennú a jedinými akceptovanými hodnotami sú tie, ktoré už boli pomenované: Male, Female.
Rovnaké variabilné pohlavie sa však dá deklarovať a uložiť ako celé číslo, ak je mužovi priradené 1 a samici je priradená hodnota 2. Z tohto dôvodu sa kategorické premenné niekedy označujú ako vymenované typy.
Hlavnou charakteristikou kategorických premenných je to, že na rozdiel od iných premenných, ako sú spojité a diskrétne premenné, nie je možné s nimi robiť aritmetiku. Štatistiky sa však môžu robiť s nimi, ako bude vidieť neskôr.
Príklady
Všimnite si nasledujúce príklady kategorických premenných a ich možných hodnôt:
- Group_Sanguíneo, Rozsah hodnôt: A, B, AB, O
- Civil_Status, Kategorické hodnoty: slobodný (A), ženatý (B), ovdovený (C), rozvedený (D).
- Tipo_de_Material, Kategórie alebo hodnoty: 1 = drevo, 2 = kov, 3 = plast
-Formálna platba, cenné papiere alebo kategórie: (1) hotovosť, (2) debet, (3) prevod, (4) kredit
V predchádzajúcich príkladoch bolo ku každej kategórii priradené číslo úplne svojvoľným spôsobom.
Potom by sa mohlo usúdiť, že toto svojvoľné numerické združenie ho robí ekvivalentom diskrétnej kvantitatívnej premennej, ale nie je to tak, pretože aritmetické operácie sa s týmito číslami nemôžu robiť.
Na ilustráciu tejto myšlienky nemá operácia súčtu v premennej Form_of_Payment zmysel:
(1) Hotovosť + (2) Debet sa nikdy nebude rovnať (3) Prevod
Klasifikácia kategorických premenných
Hodnotenie je založené na tom, či majú alebo nemajú implicitnú hierarchiu, alebo či je počet možných výsledkov viac ako dva alebo dva.
Kategorická premenná s iba jedným možným výsledkom nie je premenná, je to kategorická konštanta.
Nominálne kategórie
Ak nemôžu byť zastúpení číslom alebo akoukoľvek objednávkou. Napríklad premenná: Type_of_Material, má nominálne hodnoty (drevo, kov, plast), nemá hierarchiu ani poradie, aj keď je každej odpovedi alebo kategórii priradené ľubovoľné číslo.
Radová kategorizácia
Premenná: Academic_performance
Nominálne hodnoty: vysoká, stredná, nízka
Aj keď hodnoty tejto premennej nie sú číselné, majú implicitné poradie alebo hierarchiu.
Binárne kategórie
Toto sú nominálne premenné s dvoma možnými odpoveďami, napríklad:
-Variable: Response
- Nominálne hodnoty: pravda, nepravda
Všimnite si, že premenná Response nemá implicitnú hierarchiu a má iba dva možné výsledky, takže ide o binárnu kategorickú premennú.
Niektorí autori nazývajú tento typ binárnou premennou a nepovažujú ju za súčasť kategorických premenných, ktoré sú obmedzené na tie, ktoré majú viac ako tri možné kategórie.
Štatistika s kategorickými premennými
Štatistiku je možné robiť s kategorickými premennými, aj keď nejde o numerické alebo kvantitatívne premenné. Napríklad, aby sme poznali trend alebo najpravdepodobnejšiu hodnotu kategorickej premennej, vyberie sa režim.
Režim je v tomto prípade najopakovanejším výsledkom alebo hodnotou kategorickej premennej. Pre kategorické premenné nie je možné vypočítať ani stredný ani stredný priemer.
Priemer sa nedá vypočítať, pretože nemôžete robiť aritmetiku s kategorickými premennými. Medián nie je ani preto, lebo kvantitatívne alebo kategorické premenné nemajú poradie ani hierarchiu, takže nie je možné určiť centrálnu hodnotu.
Grafické znázornenie kategorických premenných
Vzhľadom na určitú kategorickú premennú je možné nájsť frekvenciu alebo počet opakovaní výsledku tejto premennej. Ak sa tak urobí pre každý výsledok, je možné vytvoriť graf frekvencie pre každú kategóriu alebo výsledok.
Tu je niekoľko príkladov grafického znázornenia kategorických premenných.
Riešené cvičenia
Cvičenie 1
Spoločnosť má záznamy o údajoch 170 zamestnancov. Jedna z premenných, ktorá je v týchto záznamoch, je: Estado_Civil. Táto premenná má štyri kategórie alebo možné hodnoty:
Slobodný (A), ženatý (B), ovdovený (C), rozvedený (D).
Aj keď ide o nečíselnú premennú, je možné vedieť, koľko z celkových záznamov je v určitej kategórii a môže byť zastúpená vo forme stĺpcového grafu, ako je znázornené na nasledujúcom obrázku:
Obrázok 2. Reprezentácia výsledkov kategorickej premennej. Zdroj: vlastný
Príklad 2
Predajňa obuvi sleduje svoj predaj. Medzi premenné, ktoré spravujú ich záznamy, patrí farba topánky pre každý model. Premenná:
Color_Shoe_Model_AW3
Je kategorického typu a má päť kategórií alebo možných hodnôt. Pre každú kategóriu tejto premennej sa počet predajov sčítava a určuje sa ich percentuálny podiel. Výsledky sú uvedené v grafe na nasledujúcom obrázku:
Obrázok 3. Kategorická premenná Farba _Shoe. V tejto premennej je režim biely. Zdroj: vlastný.
Dá sa povedať, že v modeli obuvi AW3, ktorý je v móde, sa najčastejšie predáva biely, za ktorým nasleduje čierna.
Dá sa tiež povedať, že s pravdepodobnosťou 70% bude ďalšou obuvou, ktorá sa predáva v tomto modeli, biela alebo čierna.
Tieto informácie môžu byť užitočné pre obchod pri zadávaní nových objednávok alebo by mohli dokonca uplatniť zľavy na najmenej predané farby z dôvodu nadmerného zásob.
Príklad 3
Pre určitú populáciu darcov krvi chcete reprezentovať počet ľudí, ktorí patria do určitej krvnej skupiny. Grafický spôsob vizualizácie výsledkov je pomocou piktogramu, ktorý je v dolnej časti tabuľky.
Prvý stĺpec predstavuje premennú group_sanguíneo a jej možné výsledky alebo kategórie. Druhý stĺpec predstavuje v ikonickej alebo obrazovej podobe počet ľudí v každej kategórii. V našom príklade sa ako ikona používa červená kvapôčka, z ktorých každá predstavuje 10 ľudí.
Obrázok 4. Piktogram. Zdroj: vlastný
Referencie
- Khan Academy. Analýza kategorických údajov. Obnovené z: khanacademy.org
- Vesmírne vzorce. Kvalitatívna premenná. Obnovené z: univesoformulas.com
- Minitab. Ide o kategorické, diskrétne a spojité premenné. Obnovené z: support.minitab.com
- Výukový program Excel. Charakterizácia premenných. Obnovené z: help.xlslat.com.
- Wikipedia. Štatistická premenná. Obnovené z wikipedia.com
- Wikipedia. Kategorická premenná. Obnovené z wikipedia.com
- Wikipedia. Kategorická premenná. Obnovené z wikipedia.com