- Typy stupňov voľnosti
- V mechanickom prípade
- V skupine náhodných hodnôt
- Príklady
- Rozdiely a stupne voľnosti
- V distribúcii na námestí Chi
- V teste hypotéz (S vyriešeným príkladom)
- Referencie
Tieto stupne voľnosti v štatistík počet nezávislých zložiek náhodného vektora. Ak vektor obsahuje n zložiek a existujú jeho lineárne rovnice, potom je stupeň voľnosti np.
Koncept stupňov voľnosti sa objavuje aj v teoretickej mechanike, kde sú zhruba rovnocenné rozmeru priestoru, v ktorom sa častica pohybuje, mínus počet väzieb.

Obrázok 1. Kyvadlo sa pohybuje v dvoch rozmeroch, má však iba jeden stupeň voľnosti, pretože je nútený pohybovať sa v oblúku s polomerom L. Zdroj: F. Zapata.
Tento článok sa bude zaoberať konceptom stupňov voľnosti aplikovaných na štatistiku, ale mechanický príklad je ľahšie vizualizovať v geometrickej podobe.
Typy stupňov voľnosti
Spôsob výpočtu počtu stupňov voľnosti sa môže líšiť v závislosti od kontextu, v ktorom sa uplatňuje, ale základná myšlienka je vždy rovnaká: celkové dimenzie znížené o počet obmedzení.
V mechanickom prípade
Uvažujme oscilujúcu časticu priviazanú k provázku (kyvadlo), ktorý sa pohybuje vo vertikálnej rovine xy (2 rozmery). Častica je však nútená pohybovať sa po obvode polomeru, ktorý sa rovná dĺžke akordu.
Pretože sa častica môže pohybovať iba po tejto krivke, počet stupňov voľnosti je 1. Toto je vidieť na obrázku 1.
Spôsob výpočtu počtu stupňov voľnosti spočíva v rozdiele počtu rozmerov mínus počet obmedzení:
stupne voľnosti: = 2 (rozmery) - 1 (ligatúra) = 1
Ďalšie vysvetlenie, ktoré nám umožňuje dospieť k výsledku, je toto:
- Vieme, že poloha v dvoch rozmeroch je reprezentovaná bodom súradníc (x, y).
Ale pretože bod musí byť v súlade s rovnicou obvodu (x 2 + y 2 = L 2 ) pre danú hodnotu premennej x je premenná y je určený spomenutou rovnicu alebo obmedzenia.
Týmto spôsobom je nezávislá iba jedna z premenných a systém má jeden (1) stupeň voľnosti.
V skupine náhodných hodnôt
Na ilustráciu toho, čo tento pojem znamená, predpokladajme vektor
x = (x 1 , x 2 , …, x n )
Predstavuje vzorku n normálne distribuovaných náhodných hodnôt. V tomto prípade má náhodný vektor x n nezávislých zložiek, a preto sa o x uvádza, že má n stupňov voľnosti.
Postavme teraz vektor r zvyškov
r = (x 1 -
Kde
Takže suma
(x 1 -
Je to rovnica, ktorá predstavuje obmedzenie (alebo väzbu) v elementoch vektora r zvyškov, pretože ak sú známe n-1 zložky vektora r , reštrikčná rovnica určuje neznámu zložku.
Preto vektor r dimenzie n s obmedzením:
∑ (x i -
Má (n - 1) stupne voľnosti.
Opäť platí, že výpočet počtu stupňov voľnosti je:
stupne voľnosti: = n (rozmery) - 1 (obmedzenia) = n-1
Príklady
Rozdiely a stupne voľnosti
Rozptyl s 2 je definovaný ako priemer druhej mocniny odchýlok (alebo zvyškov) vzorky n údajov:
s 2 = ( r • r ) / (n-1)
kde r je vektor zvyškov r = (x1 -
s 2 = ∑ (x i -
V každom prípade je potrebné poznamenať, že pri výpočte priemeru druhej mocniny zvyškov sa delí (n-1) a nie n, pretože, ako je uvedené v predchádzajúcej časti, počet stupňov voľnosti vektora r je ( n-1).
Keby bol pre výpočet rozptylu delený n namiesto (n-1), výsledok by mal zaujatosť, ktorá je veľmi významná pre hodnoty n menšie ako 50.
V literatúre sa vzorec rozptylu objavuje aj s deliteľom n namiesto (n-1), pokiaľ ide o rozptyl populácie.
Avšak množina náhodných premenných zvyškov predstavovaná vektorom r , hoci má rozmer n, má iba (n-1) stupne voľnosti. Ak je však počet údajov dostatočne veľký (n> 500), obidve vzorce sa konvergujú k rovnakému výsledku.
Kalkulačky a tabuľky poskytujú obe verzie rozptylu a štandardnú odchýlku (čo je druhá odmocnina rozptylu).
Vzhľadom na tu uvedenú analýzu odporúčame vždy zvoliť verziu s (n-1) vždy, keď je potrebné vypočítať odchýlku alebo štandardnú odchýlku, aby nedošlo k ovplyvneniu výsledkov.
V distribúcii na námestí Chi
Niektoré rozdelenia pravdepodobnosti v spojitej náhodnej premennej závisia od parametra nazývaného stupeň voľnosti, je to prípad rozdelenia Chi štvorcov (χ 2 ).
Názov tohto parametra vychádza presne zo stupňov voľnosti základného náhodného vektora, na ktorý sa toto rozdelenie vzťahuje.
Predpokladajme, že máme g populácie, z ktorých sa odoberajú vzorky veľkosti n:
X 1 = (x1 1 , x1 2 , …..x1 n )
X2 = (x2 1 , x2 2 , ….. x 2 n )
….
X j = (xj 1 , xj 2 , …..xj n )
….
Xg = (xg 1 , xg 2 , …..xg n )
Populácia j, ktorá má priemer
Štandardizovaná alebo normalizovaná premenná zj i je definovaná ako:
zj i = (xj i -
Vektor Zj je definovaný takto:
Zj = ( zj 1 , zj 2 ,…, zj i ,…, zj n ) a riadi sa normalizovaným normálnym rozdelením N (0,1).
Takže premenná:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 + … + Zg 1 ^ 2), …, (Z1 n ^ 2 + z2 n ^ 2 + …. + Zg n ^ 2))
sleduje distribúciu χ 2 (g) nazývanú distribúcia chí-kvadrát so stupňom voľnosti g.
V teste hypotéz (S vyriešeným príkladom)
Ak chcete testovať hypotézy založené na určitom súbore náhodných údajov, musíte poznať počet stupňov voľnosti g, aby ste mohli použiť test na štvorci.

Obrázok 2. Existuje vzťah medzi preferenciou zmrzliny FLAVOR a GENDER zákazníka? Zdroj: F. Zapata.
Ako príklad sa budú analyzovať údaje zozbierané o preferenciách čokoládovej alebo jahodovej zmrzliny medzi mužmi a ženami v určitej cukrárni. Frekvencia, v ktorej si muži a ženy vyberajú jahody alebo čokoládu, je zhrnutá na obrázku 2.
Najprv sa vypočíta tabuľka očakávaných frekvencií, ktorá sa pripraví vynásobením súčtu riadkov celkovým počtom stĺpcov a vydelením celkovými údajmi. Výsledok je uvedený na nasledujúcom obrázku:

Obrázok 3. Výpočet očakávaných frekvencií na základe pozorovaných frekvencií (hodnoty v modrej farbe na obrázku 2). Zdroj: F. Zapata.
Potom sa z údajov vypočíta štvorec Chi pomocou tohto vzorca:
χ 2 = ∑ (F o - F e ) 2 / F e
Kde F o sú pozorované frekvencie (obrázok 2) a F e sú očakávané frekvencie (obrázok 3). Sumácia prechádza cez všetky riadky a stĺpce, ktoré v našom príklade uvádzajú štyri výrazy.
Po vykonaní operácií získate:
χ 2 = 0,2043.
Teraz je potrebné porovnať s teoretickým Chi štvorcom, ktorý závisí od počtu stupňov voľnosti g.
V našom prípade sa toto číslo určuje takto:
g = (# riadky - 1) (# stĺpce - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1.
Ukazuje sa, že počet stupňov voľnosti g v tomto príklade je 1.
Ak chcete skontrolovať alebo odmietnuť nulovú hypotézu (H0: neexistuje žiadna korelácia medzi TASTE a GENDER) s hladinou významnosti 1%, teoretická hodnota Chi-kvadrát sa vypočíta so stupňom voľnosti g = 1.
Je požadovaná hodnota, ktorá robí akumulovanú frekvenciu (1 - 0,01) = 0,99, tj 99%. Táto hodnota (ktorú je možné získať z tabuliek) je 6 636.
Keď teoretická Chi presiahne vypočítanú, overí sa nulová hypotéza.
Inými slovami, so zhromaždenými údajmi sa nepozoruje žiadny vzťah medzi premennými TASTE a GENDER.
Referencie
- Minitab. Aké sú stupne voľnosti? Obnovené z: support.minitab.com.
- Moore, David. (2009) Základné aplikované štatistiky. Antoni Bosch editor.
- Leigh, Jennifer. Ako vypočítať stupne voľnosti v štatistických modeloch. Získané z: geniolandia.com
- Wikipedia. Stupeň slobody (štatistika). Obnovené z: es.wikipedia.com
- Wikipedia. Stupeň slobody (fyzický). Obnovené z: es.wikipedia.com
