Analýza odchylky nebo ANOVA zkrátka, je statistický test, který hledá významné rozdíly mezi prostředek na konkrétní opatření. Řekněme například, že máte zájem studovat úroveň vzdělání sportovců v komunitě, takže průzkumujete lidi v různých týmech. Začnete se však ptát, zda je úroveň vzdělání mezi různými týmy různá. Pomocí ANOVA můžete určit, zda se průměrná úroveň vzdělání liší mezi softballovým týmem a ragbyovým týmem oproti týmu Ultimate Frisbee.
Klíčové cesty: Analýza variace (ANOVA)
- Vědci provádějí ANOVA, pokud mají zájem určit, zda se dvě skupiny v konkrétním opatření nebo testu výrazně liší.
- Existují čtyři základní typy modelů ANOVA: jednosměrná mezi skupinami, jednosměrná opakovaná měření, obousměrná mezi skupinami a obousměrná opakovaná měření.
- Statistické softwarové programy lze použít k usnadnění a zefektivnění provádění ANOVA.
ANOVA modely
Existují čtyři typy základních ANOVA modelů (i když je také možné provádět složitější ANOVA testy). Následuje popis a příklady každého z nich.
Jednosměrná mezi skupinami ANOVA
Jednosměrná mezi skupinami ANOVA se používá, pokud chcete testovat rozdíl mezi dvěma nebo více skupinami. Příklad výše, úrovně vzdělání mezi různými sportovními týmy, by byl příkladem tohoto typu modelu. Říká se tomu jednosměrná ANOVA, protože existuje pouze jedna proměnná (druh sportovního hraní), která se používá k rozdělení účastníků do různých skupin.
Jednosměrná opakovaná opatření ANOVA
Pokud máte zájem o posouzení jedné skupiny ve více než jednom časovém bodě, měli byste použít jednosměrná opakovaná opatření ANOVA. Pokud například chcete vyzkoušet porozumění předmětu studentům, mohli byste stejný test provést na začátku kurzu, uprostřed kurzu a na konci kurzu. Provedení jednosměrných opakovaných opatření ANOVA vám umožní zjistit, zda se výsledky testů studentů výrazně změnily od začátku do konce kurzu.
Obousměrná mezi skupinami ANOVA
Představte si nyní, že máte dva různé způsoby, jak chcete seskupit své účastníky (nebo, ve statistickém vyjádření, máte dva různé nezávislé proměnné). Představte si například, že by vás zajímalo testování toho, zda se skóre testu lišilo mezi studentskými atleti, kteří nejsou atleti, a také pro nováčky a seniory. V takovém případě byste mezi skupinami ANOVA vedli obousměrně. Z této ANOVA byste měli tři účinky - dva hlavní a interakční efekt. Hlavními účinky jsou účinek sportovce a účinek ročníku. Interakční efekt se zaměřuje na dopady toho, jak jsou sportovci a ročník třídy. Každý z hlavních účinků je jednosměrný test. Interakční efekt se jednoduše ptá, zda se dva hlavní efekty navzájem ovlivňují: například, pokud studenti sportovci skórovali rozdílně než tomu bylo u jiných sportovců, ale to byl jen případ studiem prváků, mezi třídou a existencí by byla interakce sportovec.
Obousměrná opakovaná opatření ANOVA
Pokud se chcete podívat, jak se různé skupiny mění v průběhu času, můžete použít obousměrná opakovaná opatření ANOVA. Představte si, že vás zajímá, jak se skóre testu mění v průběhu času (jako v příkladu výše pro jednosměrné opakované měření ANOVA). Tentokrát se ale také zajímáte o hodnocení pohlaví. Například zlepšují samci a samice skóre svých testů stejným tempem nebo existují rozdíly v pohlaví? K odpovědi na tyto typy otázek lze použít dvojitá opakovaná opatření ANOVA.
Předpoklady ANOVA
Při provádění analýzy rozptylu existují následující předpoklady:
- očekávané hodnoty chyb je nula.
- Rozptyly všech chyb jsou stejné.
- Chyby jsou na sobě nezávislé.
- Chyby jsou normálně distribuované.
Jak je ANOVA hotová
- Průměr se počítá pro každou z vašich skupin. Na příkladu vzdělávacích a sportovních týmů od úvodu v prvním odstavci výše se průměrná úroveň vzdělání vypočítá pro každý sportovní tým.
- Celkový průměr se pak vypočítá pro všechny skupiny dohromady.
- V každé skupině se vypočítá celková odchylka skóre každého jednotlivce od střední hodnoty skupiny. To nám říká, zda jednotlivci ve skupině mají sklon mít podobné skóre nebo zda existuje velká variabilita mezi různými lidmi ve stejné skupině. Statistici to nazývají v rámci skupinové variace.
- Dále se vypočítá, kolik průměrů se každá skupina liší od celkového průměru. Tomu se říká mezi skupinovými variantami.
- Nakonec se vypočítá statistika F, což je poměr mezi skupinovými variantami do v rámci skupinové variace.
Pokud je výrazně větší mezi skupinovými variantami než v rámci skupinové variace (jinými slovy, když je statistika F větší), je pravděpodobné, že rozdíl mezi skupinami je statisticky významný. Statistický software lze použít k výpočtu statistiky F a ke stanovení, zda je významný nebo ne.
Všechny typy ANOVA se řídí výše uvedenými základními principy. S rostoucím počtem skupin a interakčních účinků se však zdroje variací stanou složitějšími.
Provádění ANOVA
Protože provádění ANOVA ručně je časově náročný proces, většina vědců používá statistické softwarové programy, pokud mají zájem o provedení ANOVA. SPSS mohou být použity k provádění ANOVA, jak může R, bezplatný softwarový program. V aplikaci Excel můžete provést ANOVA pomocí doplňku analýzy dat. SAS, STATA, Minitab a další statistické softwarové programy které jsou vybaveny pro manipulaci s většími a složitějšími datovými soubory, lze také použít k provedení ANOVA.
Reference
Monash University. Analýza odchylky (ANOVA). http://www.csse.monash.edu.au/~smarkham/resources/anova.htm