- Vyhlásenie problému v teste Mann-Whitney U
- Kvalitatívne premenné verzus kvantitatívne premenné
- Normálny prípad
- Prípad s neobvyklým trendom
- Spárované alebo nepárové vzorky
- Charakteristiky testu Mann Whitney U.
- Mann - Whitney vzorec
- Kroky na vykonanie testu
- Praktický príklad použitia
- - Krok 1
- - Krok 2
- Región A
- Región B
- Krok 3
- Krok 4
- Porovnávacie kritériá
- Online kalkulačky pre test Mann - Whitney U
- Referencie
Test Mann - Whitney U sa používa na porovnanie dvoch nezávislých vzoriek, ak majú malé údaje alebo ak sa neriadia normálnym rozdelením. Týmto spôsobom je považovaný za neparametrický test, na rozdiel od jeho homologického Studentovho t testu, ktorý sa používa, keď je vzorka dostatočne veľká a dodržiava normálne rozdelenie.
Frank Wilcoxon to prvýkrát navrhol v roku 1945 pre vzorky rovnakých veľkostí, ale o dva roky neskôr ho rozšírili pre vzorky rôznych veľkostí Henry Mann a DR Whitney.

Obrázok 1. Na porovnanie nezávislých vzoriek sa použije Mann-Whitney U test. Zdroj: Pixabay.
Test sa často používa na kontrolu, či existuje vzťah medzi kvalitatívnou a kvantitatívnou premennou.
Ilustratívnym príkladom je vziať skupinu hypertonikov a extrahovať dve skupiny, z ktorých sa zaznamenávajú denné údaje o krvnom tlaku po dobu jedného mesiaca.
Liečba A sa aplikuje na jednu skupinu a liečba B. Na inú krvný tlak je tu kvantitatívna premenná a typ liečby je kvalitatívny.
Chceme vedieť, či je medián a nie priemer nameraných hodnôt štatisticky rovnaký alebo rôzny, aby sme zistili, či existuje rozdiel medzi oboma liečeniami. Na získanie odpovede sa použije Wilcoxonova štatistika alebo Mann - Whitney U test.
Vyhlásenie problému v teste Mann-Whitney U
Ďalším príkladom, v ktorom je možné test vykonať, je nasledujúci:
Predpokladajme, že chcete vedieť, či sa spotreba nealkoholických nápojov výrazne líši v dvoch regiónoch krajiny.
Jeden z nich sa nazýva región A a druhý región B. O litroch spotrebovaných týždenne sa vedie záznam v dvoch vzorkách: jedna z 10 ľudí v regióne A a druhá z 5 osôb v regióne B.
Údaje sú nasledujúce:
-Región A : 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Región B : 12,14, 11, 30, 10
Vynára sa táto otázka:
Kvalitatívne premenné verzus kvantitatívne premenné
- Kvalitatívna premenná X : región
- kvalitatívna premenná Y : spotreba nealkoholických nápojov
Ak je množstvo spotrebovaného litra rovnaké v oboch regiónoch, dospeje sa k záveru, že neexistuje žiadna závislosť medzi týmito dvoma premennými. Spôsob, ako to zistiť, je porovnať stredný alebo stredný trend týchto dvoch regiónov.
Normálny prípad
Ak údaje sledujú normálne rozdelenie, navrhujú sa dve hypotézy: nulová H0 a alternatívna H1 porovnaním priemerov:
- H0 : neexistuje žiadny rozdiel medzi priemerom týchto dvoch regiónov.
- H1 : prostriedky oboch regiónov sú rôzne.
Prípad s neobvyklým trendom
Naopak, ak údaje nenasledujú normálne rozdelenie alebo vzorka je jednoducho príliš malá na to, aby sme ju poznali, namiesto porovnania priemeru by sa porovnal medián týchto dvoch regiónov.
- H0 : nie je rozdiel medzi mediánom oboch regiónov.
- H1 : stredné hodnoty oboch regiónov sú odlišné.
Ak sa mediány zhodujú, potom je splnená nulová hypotéza: neexistuje súvislosť medzi konzumáciou nealkoholických nápojov a regiónom.
A ak sa stane opak, platí iná hypotéza: existuje vzťah medzi spotrebou a regiónom.
V týchto prípadoch je indikovaný test Mann - Whitney U.
Spárované alebo nepárové vzorky
Ďalšou dôležitou otázkou pri rozhodovaní, či sa má použiť test Mann Whitney U, je to, či je počet údajov v oboch vzorkách rovnaký, čo znamená, že sú na par.
Ak sú tieto dve vzorky spárované, použije sa pôvodná verzia Wilcoxonu. Ak nie, ako je to v príklade, potom sa použije modifikovaný Wilcoxonov test, čo je presne Mann Whitney U test.
Charakteristiky testu Mann Whitney U.
Test Mann - Whitney U je neparametrický test, ktorý sa dá použiť na vzorky, ktoré sa neriadia normálnym rozdelením alebo majú málo údajov. Má nasledujúce vlastnosti:
1.- Porovnajte mediány
2.- Funguje na objednaných rozsahoch
3.- Je menej výkonný, čo znamená, že sila je pravdepodobnosť odmietnutia nulovej hypotézy, keď je skutočne nepravdivá.
Berúc do úvahy tieto charakteristiky, Mann - Whitney U test sa uplatňuje, keď:
- Údaje sú nezávislé
-Nesledujú normálne rozdelenie
- Nulová hypotéza H0 je akceptovaná, ak sa mediány oboch vzoriek zhodujú: Ma = Mb
- Alternatívna hypotéza H1 je akceptovaná, ak sa mediány oboch vzoriek líšia: Ma ≠ Mb
Mann - Whitney vzorec
Premenná U je kontrastná štatistika použitá v Mann - Whitneyovom teste a je definovaná takto:
To znamená, že U je najmenšia z hodnôt medzi Ua a Ub, použitá pre každú skupinu. V našom príklade by to bolo pre každý región: A alebo B.
Premenné Ua a Ub sú definované a vypočítané podľa tohto vzorca:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb +1) / 2 - Rb
Hodnoty Na a Nb sú veľkosťami vzoriek zodpovedajúcich regiónom A a B, a Ra a Rb sú pre ich časť hodnotami súčtov, ktoré budeme definovať nižšie.
Kroky na vykonanie testu
1.- Hodnoty oboch vzoriek objednajte.
2.- Každej hodnote priraďte poradie objednávky.
3.- Opravte existujúce väzby v údajoch (opakované hodnoty).
4.- Vypočítajte Ra = súčet radov vzorky A.
5. - Nájdite Rb = súčet radov vzorky B.
6.- Určite hodnotu Ua a Ub podľa vzorcov uvedených v predchádzajúcej časti.
7. - Porovnajte Ua a Ub a menšie z nich je priradené experimentálnej štatistike U (tj údajov), ktorá je porovnaná s teoretickou alebo normálnou štatistikou U.
Praktický príklad použitia
Teraz aplikujeme vyššie uvedené na problém nealkoholických nápojov uvedených vyššie:
Oblasť A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Región B: 12,14, 11, 30, 10
V závislosti od toho, či sú prostriedky oboch vzoriek štatisticky rovnaké alebo rôzne, neplatná hypotéza je akceptovaná alebo zamietnutá: neexistuje žiadny vzťah medzi premennými Y a X, to znamená, že konzumácia nealkoholických nápojov nezávisí od regiónu:
H0: Ma = Mb
H1: Ma ≠ Mb

Obrázok 2. Údaje o spotrebe nealkoholických nápojov v regiónoch A a B. Zdroj: F. Zapata.
- Krok 1
Postupne objednávame údaje pre obidve vzorky spoločne a hodnoty usporiadame od najnižšej po najvyššiu:

Všimnite si, že hodnota 11 sa objaví 2-krát (raz v každej vzorke). Pôvodne má polohy alebo rozsahy 3 a 4, ale aby sa nepreceňovalo ani nepodceňovalo jedno alebo druhé, priemerná hodnota sa vyberie ako rozmedzie, tj 3,5.
Podobne postupujeme s hodnotou 12, ktorá sa opakuje trikrát s rozsahmi 5, 6 a 7.
No, hodnote 12 sa priradí priemerný rozsah 6 = (5 + 6 + 7) / 3. A to isté pre hodnotu 14, ktorá má ligatúru (objavuje sa v oboch vzorkách) v pozíciách 8 a 9, je jej priradený priemerný rozsah 8,5 = (8 + 9) / 2.
- Krok 2
Ďalej sú údaje pre oblasti A a B opäť oddelené, ale teraz sú ich príslušné rozsahy priradené v inom riadku:
Región A

Región B

Rozsahy Ra a Rb sa získavajú zo súčtov prvkov druhého radu pre každý prípad alebo oblasť.
Krok 3
Vypočítajú sa príslušné hodnoty Ua a Ub:
Ua = 10 x 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 -34 = 31
Experimentálna hodnota U = min (19, 31) = 19
Krok 4
Predpokladá sa, že teoretické U sa riadi normálnym rozdelením N s parametrami uvedenými výlučne podľa veľkosti vzoriek:
N (na⋅nb) / 2, √)
Aby bolo možné porovnávať premennú U získanú experimentálne, s teoretickou hodnotou U je potrebné vykonať zmenu premennej. Prejdeme z experimentálnej premennej U na jej štandardizovanú hodnotu, ktorá sa bude nazývať Z, aby sme mohli porovnávať s normalizovaným normálnym rozdelením.
Zmena ukazovateľa je nasledovná:
Z = (U - na.nb / 2) / √
Je potrebné poznamenať, že na zmenu premennej sa použili parametre teoretickej distribúcie pre U. Potom sa nová premenná Z, ktorá je hybridom medzi teoretickou U a experimentálnou U, porovná so štandardizovanou normálnou distribúciou N (0,1) ).
Porovnávacie kritériá
Ak Z ≤ Zα ⇒, akceptuje sa nulová hypotéza H0
Ak Z> Zα ⇒ odmietne nulovú hypotézu H0
Štandardizované kritické hodnoty Za závisia od požadovanej úrovne spoľahlivosti, napríklad pre hladinu spoľahlivosti a = 0,95 = 95%, čo je najbežnejšia hodnota, sa získa kritická hodnota Za = 1,96.
Tu uvedené údaje:
Z = (U - nb / 2) / √ = -0,73
Ktorá je pod kritickou hodnotou 1.96.
Konečný záver je taký, že sa akceptuje nulová hypotéza H0:
Online kalkulačky pre test Mann - Whitney U
Existujú špecifické programy na štatistické výpočty vrátane SPSS a MINITAB, ale tieto programy sú platené a ich použitie nie je vždy ľahké. Dôvodom je skutočnosť, že poskytujú toľko možností, že ich použitie je prakticky vyhradené pre odborníkov v oblasti štatistiky.
Našťastie existuje množstvo veľmi presných, bezplatných a ľahko použiteľných online programov, ktoré vám okrem iného umožňujú spustiť test Mann-Whitney U.
Ide o tieto programy:
-Sociálna vedecká štatistika (socscistatistics.com), ktorá má v prípade vyvážených alebo spárovaných vzoriek test Mann-Whitney U a test Wilcoxon.
-AI Therapy Statistics (ai-therapy.com), ktorá má niekoľko obvyklých testov popisnej štatistiky.
-Statistic to Use (physics.csbsju.edu/stats), jeden z najstarších, takže jeho rozhranie môže vyzerať datované, hoci je to veľmi efektívny bezplatný program.
Referencie
- Dietrichson. Kvantitatívne metódy: hodnotiaci test. Obnovené z: bookdown.org
- Marín J P. Sprievodca SPSS: Analýza a postupy v neparametrických testoch. Získané z: halweb.uc3m.es
- USAL MOOC. Neparametrické testy: Mann-Whitney U. Obnovené z: youtube.com
- Wikipedia. Mann-Whitney U test. Obnovené z: es.wikipedia.com
- XLSTAT. Centrum pomoci. Mann - Whitney testovací tutoriál v Exceli. Obnovené z: help.xlsat.com
