Když studujeme skupinu, mnohokrát opravdu porovnáváme dvě populace. V závislosti na parametr z této skupiny nás zajímá a podmínky, kterými se zabýváme, existuje několik technik. Statistický odvození postupy, které se týkají srovnání dvou populací, nelze obvykle použít na tři nebo více populací. Ke studiu více než dvou populací najednou potřebujeme různé typy statistických nástrojů. Analýza rozptyluneboli ANOVA, je technika ze statistického rušení, která nám umožňuje zabývat se několika populacemi.
Porovnání prostředků
Abychom viděli, jaké problémy vyvstávají a proč potřebujeme ANOVA, vezmeme v úvahu příklad. Předpokládejme, že se snažíme zjistit, zda znamenat Hmotnosti zelených, červených, modrých a oranžových bonbónů M&M se od sebe liší. U každé z těchto populací uvedeme průměrné hmotnosti, μ1, μ2, μ3 μ4 a respektive. Můžeme použít vhodné test hypotéz několikrát a test C (4,2) nebo šest různých nulové hypotézy:
- H0: μ1 = μ2 zkontrolovat, zda je průměrná hmotnost populace červených bonbónů jiná než průměrná hmotnost populace modrých bonbónů.
- H0: μ2 = μ3 zkontrolovat, zda průměrná hmotnost populace modrých bonbónů není jiná než průměrná hmotnost populace zelených bonbónů.
- H0: μ3 = μ4 zkontrolovat, zda je průměrná hmotnost populace zelených bonbónů jiná než průměrná hmotnost populace pomerančových bonbónů.
- H0: μ4 = μ1 zkontrolovat, zda se průměrná hmotnost populace pomerančových bonbónů liší od průměrné hmotnosti populace červených bonbónů.
- H0: μ1 = μ3 zkontrolovat, zda je průměrná hmotnost populace červených bonbónů jiná než průměrná hmotnost populace zelených bonbónů.
- H0: μ2 = μ4 zkontrolovat, zda se průměrná hmotnost populace modrých bonbónů liší od průměrné hmotnosti populace pomerančových bonbónů.
S tímto druhem analýzy existuje mnoho problémů. Budeme mít šest str-hodnoty. I když můžeme každý testovat na 95% úroveň důvěry, naše důvěra v celkový proces je menší než toto, protože pravděpodobnosti se násobí: 0,95 x 0,95 x 0,95 x 0,95 x 0,95 x 0,95 je přibližně 0,74 nebo 74% úroveň spolehlivosti. Pravděpodobnost chyby typu I se tedy zvýšila.
Na základní úrovni nemůžeme porovnat tyto čtyři parametry jako celek jejich porovnáním po dvou. Prostředky červené a modré M & Ms mohou být významné, přičemž střední hmotnost červené je relativně větší než průměrná hmotnost modré. Pokud však vezmeme v úvahu průměrné hmotnosti všech čtyř druhů cukrovinek, nemusí existovat významný rozdíl.
Analýza variací
K řešení situací, ve kterých je třeba provést vícenásobná srovnání, používáme ANOVA. Tento test nám umožňuje zvážit parametry několika populací najednou, aniž bychom se dostali k některým problémům, kterým nás čelí provádění testů hypotéz na dva parametry najednou.
Pro provedení ANOVA s výše uvedeným příkladem M&M bychom testovali nulovou hypotézu H0:μ1 = μ2 = μ3= μ4. To uvádí, že neexistuje žádný rozdíl mezi střední hmotností červené, modré a zelené M & Ms. Alternativní hypotéza je, že existuje nějaký rozdíl mezi střední hmotností červené, modré, zelené a oranžové M & Ms. Tato hypotéza je skutečně kombinací několika tvrzení HA:
- Průměrná hmotnost populace červených bonbónů se nerovná průměrné hmotnosti populace modrých bonbónů, NEBO
- Průměrná hmotnost populace modrých bonbónů se nerovná průměrné hmotnosti populace zelených bonbónů, NEBO
- Průměrná hmotnost populace zelených bonbónů se nerovná průměrné hmotnosti populace pomerančových bonbónů, NEBO
- Průměrná hmotnost populace zelených bonbónů se nerovná průměrné hmotnosti populace červených bonbónů, NEBO
- Průměrná hmotnost populace modrých bonbónů se nerovná průměrné hmotnosti populace pomerančových bonbónů, NEBO
- Průměrná hmotnost populace modrých bonbónů se nerovná průměrné hmotnosti populace červených bonbónů.
V tomto konkrétním případě bychom pro získání naší p-hodnoty použili a rozdělení pravděpodobnosti známý jako F-distribuce. Výpočty zahrnující test ANOVA F lze provádět ručně, ale obvykle se počítají pomocí statistického softwaru.
Vícenásobná srovnání
ANOVA od ostatních statistických technik odděluje to, že se používá k vícenásobnému srovnání. To je běžné v celé statistice, protože mnohokrát chceme porovnat více než jen dvě skupiny. Celkový test obvykle naznačuje, že existuje určitý rozdíl mezi parametry, které studujeme. Poté následujeme tento test s nějakou jinou analýzou, abychom rozhodli, který parametr se liší.