Příklad testu dvou vzorků T a intervalu spolehlivosti

click fraud protection

Někdy ve statistikách je užitečné vidět vypracované příklady problémů. Tyto příklady nám mohou pomoci při hledání podobných problémů. V tomto článku projdeme proces provádění inferenčních statistik pro výsledek týkající se dvou populačních prostředků. Uvidíme nejen, jak provést a test hypotéz o rozdílu dvou populačních prostředků budeme také konstruovat a interval spolehlivosti za tento rozdíl. Metody, které používáme, se někdy nazývají test dvou vzorků t a interval spolehlivosti dvou vzorků t.

Prohlášení problému

Předpokládejme, že si přejeme vyzkoušet matematickou způsobilost žáků základní školy. Jedna otázka, kterou můžeme mít, je, zda vyšší úrovně známky mají vyšší průměrné skóre testu.

Jednoduchý náhodný vzorek 27 srovnávačů je podroben matematickému testu, jejich odpovědi jsou skórovány a výsledky mají průměrné skóre 75 bodů s ukázat směrodatnou odchylku 3 body.

Jednoduchý náhodný vzorek 20 pater srovnávačů má stejný matematický test a jejich odpovědi jsou hodnoceny. Průměrné skóre pro páté srovnávače je 84 bodů se standardní směrodatnou odchylkou 5 bodů.

instagram viewer

Vzhledem k tomuto scénáři klademe následující otázky:

  • Poskytují údaje ze vzorku důkaz, že průměrné testovací skóre populace všech pátých grejdrů přesahuje průměrné testovací skóre populace všech třetích grejdrů?
  • Jaký je interval spolehlivosti 95% pro rozdíl v průměrném skóre testu mezi populacemi třetích srovnávačů a pátých srovnávačů?

Podmínky a postup

Musíme si vybrat, který postup použít. Přitom musíme zajistit, aby byly splněny podmínky pro tento postup. Žádáme, abychom porovnali dva prostředky populace. Jedním souborem metod, které lze k tomu použít, jsou metody pro t-postupy se dvěma vzorky.

Abychom mohli použít tyto postupy t pro dva vzorky, musíme se ujistit, že platí následující podmínky:

  • Máme dva jednoduché náhodné vzorky ze dvou sledovaných populací.
  • Naše jednoduché náhodné vzorky netvoří více než 5% populace.
  • Oba vzorky jsou na sobě nezávislé a mezi subjekty neexistuje shoda.
  • Proměnná je normálně distribuována.
  • Jak průměr populace, tak směrodatná odchylka nejsou pro obě populace neznámé.

Vidíme, že většina z těchto podmínek je splněna. Bylo nám řečeno, že máme jednoduché náhodné vzorky. Populace, které studujeme, jsou velké, protože v těchto stupních jsou miliony studentů.

Podmínkou, kterou nemůžeme automaticky předpokládat, je, že výsledky testů jsou normálně rozděleny. Protože máme dostatečně velkou velikost vzorku, vzhledem k robustnosti našich t-procedur nepotřebujeme nutně, aby byla proměnná normálně distribuována.

Protože jsou podmínky splněny, provádíme několik předběžných výpočtů.

Standardní chyba

Standardní chyba je odhad standardní odchylky. Pro tuto statistiku přidáme vzorky rozptyl vzorků a pak vezmeme druhou odmocninu. To dává vzorec:

(s1 2 / n1 + s22 / n2)1/2

Použitím výše uvedených hodnot vidíme, že hodnota standardní chyby je

(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583

Stupně svobody

Můžeme použít konzervativní aproximaci pro naši stupně svobody. To může podceňovat počet stupňů volnosti, ale je mnohem jednodušší vypočítat než pomocí Welchova vzorce. Použijeme menší ze dvou velikostí vzorku a od tohoto počtu odečteme jednu.

V našem příkladu je menší z těchto dvou vzorků 20. To znamená, že počet stupňů volnosti je 20 - 1 = 19.

Test hypotéz

Přejeme si otestovat hypotézu, že studenti pátého ročníku mají průměrné testovací skóre, které je vyšší než průměrné skóre žáků 3. ročníku. Nechť μ1 je průměrné skóre populace všech pátých srovnávačů. Podobně jsme nechali μ2 je průměrné skóre populace všech třetích srovnávačů.

Hypotézy jsou následující:

  • H0: μ1 - μ2 = 0
  • HA: μ1 - μ2 > 0

Statistika testu je rozdíl mezi průměrem vzorku, který se pak dělí standardní chybou. Protože pro odhad standardní směrodatné odchylky populace používáme standardní směrodatné odchylky, testovací statistika z t-distribuce.

Hodnota statistiky zkoušky je (84 - 75) / 1,2583. To je přibližně 7,15.

Nyní určíme, jaká je hodnota p pro tento test hypotéz. Podíváme se na hodnotu statistik testu a kde je umístěna na t-rozdělení s 19 stupni volnosti. Pro toto rozdělení máme 4,2 x 10-7 jako naše p-hodnota. (Jeden způsob, jak to zjistit, je použití funkce T.DIST.RT v Excelu.)

Protože máme tak malou hodnotu p, odmítáme nulovou hypotézu. Závěr je, že průměrné testovací skóre pro páté grejdry je vyšší než průměrné testovací skóre pro třetí grejdry.

Interval spolehlivosti

Protože jsme zjistili, že existuje rozdíl mezi průměrným skóre, nyní stanovujeme interval spolehlivosti pro rozdíl mezi těmito dvěma prostředky. Už toho máme hodně. Interval spolehlivosti rozdílu musí mít odhad i míru chyby.

Odhad rozdílu dvou průměrů se vypočítá jednoduše. Zjednodušeně zjistíme rozdíl prostředků vzorku. Tento rozdíl ve vzorku znamená odhad rozdílu v počtu obyvatel.

Pro naše data je rozdíl ve vzorcích 84 - 75 = 9.

Rozpětí chyb je o něco obtížnější spočítat. K tomu musíme znásobit příslušnou statistiku standardní chybou. Statistiky, které potřebujeme, najdete v tabulce nebo statistickém softwaru.

Opět s použitím konzervativní aproximace máme 19 stupňů volnosti. Pro 95% interval spolehlivosti vidíme, že t* = 2.09. Mohli bychom použít Funkce T.INV v Excel vypočítat tuto hodnotu.

Nyní jsme dali všechno dohromady a viděli jsme, že naše chyba je 2,09 x 1,2583, což je přibližně 2,63. Interval spolehlivosti je 9 ± 2,63. Interval je 6,37 až 11,63 bodů při testu, který vybral pátý a třetí srovnávač.

instagram story viewer