Velikost vzorku pro rozpětí chyb ve statistikách

click fraud protection

Intervaly spolehlivosti se nacházejí v tématu inferenciální statistiky. Obecná forma takového intervalu spolehlivosti je odhad plus nebo mínus míra chyby. Jedním příkladem je v průzkum veřejného mínění ve kterém je podpora problému měřena na určitém procentu plus nebo mínus dané procento.

Dalším příkladem je situace, kdy tvrdíme, že při určité úrovni důvěry je průměr x̄ +/- E, kde E je rozpětí chyby. Tento rozsah hodnot je způsoben povahou provedených statistických postupů, ale výpočet míry chyby spoléhá na poměrně jednoduchý vzorec.

I když můžeme vypočítat rozpětí chyby pouhým poznáním velikost vzorku, směrodatná odchylka populace a naše přání úroveň důvěry, můžeme otázku obrátit. Jaká by měla být naše velikost vzorku, aby byla zaručena určitá míra chyb?

Návrh experimentu

Tento druh základní otázky spadá pod myšlenku experimentálního designu. Pro konkrétní úroveň spolehlivosti můžeme mít velikost vzorku tak velkou nebo tak malou, jak chceme. Za předpokladu, že naše standardní odchylka zůstává pevná, je míra chyb přímo úměrná naší kritické hodnotě hodnota (která se spoléhá na naši úroveň důvěry) a nepřímo úměrná druhé odmocnině vzorku velikost.

instagram viewer

Vzorec rozptylu chyb má četné důsledky pro to, jak navrhujeme náš statistický experiment:

  • Čím menší je velikost vzorku, tím větší je míra chyby.
  • Abychom udrželi stejnou míru chyby na vyšší úrovni spolehlivosti, museli bychom zvýšit velikost našeho vzorku.
  • Ponecháme-li vše ostatní stejné, abychom snížili rozpětí chyb na polovinu, museli bychom čtyřnásobně zvýšit velikost vzorku. Zdvojnásobením velikosti vzorku se pouze sníží původní míra chyby o asi 30%.

Požadovaná velikost vzorku

Abychom mohli vypočítat, jaká velikost našeho vzorku musí být, můžeme jednoduše začít vzorcem pro chybu a vyřešit ji n velikost vzorku. To nám dává vzorec n = (zα/2σ/E)2.

Příklad

Následuje příklad, jak můžeme pomocí vzorce vypočítat požadované velikost vzorku.

Standardní odchylka pro populaci 11. srovnávačů pro standardizovaný test je 10 bodů. Jak velký ze vzorku studentů musíme zajistit při 95% spolehlivosti, že průměr našeho vzorku je do 1 bodu průměrné populace?

Kritická hodnota této úrovně důvěry je zα/2 = 1.64. Toto číslo vynásobte směrodatnou odchylkou 10, abyste získali 16.4. Nyní na toto číslo zaokrouhlete na velikost vzorku 269.

Další úvahy

Je třeba zvážit několik praktických záležitostí. Snížení úrovně důvěry nám poskytne menší míru chyb. To však bude znamenat, že naše výsledky jsou méně jisté. Zvětšení velikosti vzorku vždy sníží míru chyby. Mohou existovat další omezení, například náklady nebo proveditelnost, které nám neumožňují zvětšit velikost vzorku.

instagram story viewer