Použití statistických tabulek je běžným tématem mnoha statistických kurzů. Přestože software provádí výpočty, dovednost čtení tabulek je stále důležitá. Uvidíme, jak použít tabulku hodnot pro distribuci chi-kvadrát k určení kritické hodnoty. Tabulka, kterou použijeme, je nachází se zde, ale jiné tabulky chi-čtverců jsou rozloženy způsoby, které jsou velmi podobné tomuto.
Kritická hodnota
Použití tabulky chi-square, kterou prozkoumáme, je stanovení kritické hodnoty. Kritické hodnoty jsou důležité v obou případech testy hypotéz a intervaly spolehlivosti. U testů hypotéz nám kritická hodnota říká hranici, jak extrémní statistiku testu musíme odmítnout nulovou hypotézu. Pro intervaly spolehlivosti je kritická hodnota jednou ze složek, která jde do výpočtu míry chyby.
Abychom určili kritickou hodnotu, musíme znát tři věci:
- Počet stupňů volnosti
- Počet a typ ocasu
- Úroveň významnosti.
Stupně svobody
První důležitou položkou je počet stupně svobody. Toto číslo nám říká, který z nespočetně nekonečně mnoho distribucí chi-square, které máme použít v našem problému. Způsob, jakým určujeme toto číslo, závisí na přesném problému, který používáme
chi-square distribuce s. Následují tři běžné příklady.- Pokud děláme test dobré kondice, pak počet stupňů volnosti je o jeden menší než počet výsledků pro náš model.
- Pokud budujeme a interval spolehlivosti pro rozptyl populace, pak počet stupňů volnosti je o jeden menší než počet hodnot v našem vzorku.
- Pro chi-square test nezávislosti ze dvou kategorických proměnných máme obousměrnou kontingenční tabulku s r řádky a C sloupce. Počet stupňů volnosti je (r - 1)(C - 1).
V této tabulce odpovídá počet stupňů volnosti řádku, který použijeme.
Pokud tabulka, se kterou pracujeme, nezobrazuje přesný počet stupňů volnosti, který náš problém vyžaduje, pak existuje pravidlo, které používáme. Zaokrouhlujeme počet stupňů volnosti na nejvyšší hodnotu v tabulce. Předpokládejme například, že máme 59 stupňů volnosti. Pokud má náš stůl řádky pouze pro 50 a 60 stupňů volnosti, použijeme tento řádek s 50 stupni volnosti.
Ocasy
Další věc, kterou musíme zvážit, je počet a typ použitých ocasů. Chí-čtvercové rozdělení je nakloněno doprava, a tak se běžně používají jednostranné testy zahrnující pravý ocas. Pokud však počítáme oboustranný interval spolehlivosti, musíme zvážit a dvoukolový test s pravým i levým ocasem v naší distribuci chi-square.
Úroveň důvěry
Poslední informací, kterou potřebujeme znát, je úroveň důvěry nebo významnosti. Toto je pravděpodobnost, kterou obvykle označuje alfa. Poté musíme tuto pravděpodobnost (spolu s informacemi o našich ocasu) převést do správného sloupce, který lze použít s naší tabulkou. Tento krok mnohokrát závisí na tom, jak je náš stůl vytvořen.
Příklad
Například vezmeme v úvahu zkoušku vhodnosti pro dvanáctistrannou matrici. Naše nulová hypotéza je taková, že všechny strany budou stejně válcovány, takže každá strana má pravděpodobnost 1/12 válcování. Protože existuje 12 výsledků, existuje 12 -1 = 11 stupňů volnosti. To znamená, že pro naše výpočty použijeme řádek označený 11.
Zkouška vhodnosti je jednostranná zkouška. Ocas, který k tomu používáme, je pravý ocas. Předpokládejme, že hladina významnosti je 0,05 = 5%. Toto je pravděpodobnost na pravém konci distribuce. Náš stůl je nastaven na pravděpodobnost v levém ocasu. Levá část naší kritické hodnoty by tedy měla být 1 - 0,05 = 0,95. To znamená, že použijeme sloupec odpovídající 0,95 a řádek 11, abychom dali kritickou hodnotu 19,675.
Pokud je statistika chí-kvadrát, kterou vypočítáme z našich dat, větší nebo rovna 19,675, odmítneme nulovou hypotézu s 5% významností. Pokud je naše statistika chí-kvadrát menší než 19,675, pak my odmítnout nulová hypotéza.