Jak vypočítat rozpětí chyby

Mnohokrát politické průzkumy a další aplikace statistik uvádějí své výsledky s mírou chyby. Není neobvyklé, že průzkum veřejného mínění uvádí, že u určitého procenta respondentů existuje podpora pro daný problém nebo kandidáta, plus a mínus určité procento. Je to plus a mínus termín, který je okrajem chyby. Jak se však vypočítává rozpětí chyby? Pro jednoduchý náhodný vzorek U dostatečně velké populace je rozpětí nebo chyba skutečně jen přepočítáním velikosti vzorku a úrovně použité spolehlivosti.

Vzorec pro rozpětí chyby

V následujícím textu použijeme vzorec pro rozpětí chyb. Plánujeme nejhorší možný případ, kdy nemáme tušení, jaká je skutečná úroveň podpory v našem průzkumu. Pokud bychom o tomto čísle měli nějakou představu, možná prostřednictvím předchozích dotazovacích údajů, skončili bychom s menší mírou chyb.

Vzorec, který použijeme, je: E = z_α/2/ (2√ n)

Úroveň důvěry

První informace, kterou potřebujeme pro výpočet míry chyby, je určit, jakou úroveň důvěry chceme. Toto číslo může být libovolné procento menší než 100%, ale nejběžnější úrovně spolehlivosti jsou 90%, 95% a 99%. Z těchto tří se nejčastěji používá úroveň 95%.

instagram viewer

Pokud odečteme úroveň spolehlivosti od jedné, získáme hodnotu alfa, psanou jako α, potřebnou pro vzorec.

Kritická hodnota

Dalším krokem při výpočtu rezervy nebo chyby je nalezení vhodné kritické hodnoty. Toto je označeno termínem z_α/2 ve výše uvedeném vzorci. Protože jsme předpokládali jednoduchý náhodný vzorek velké populace, můžeme použít standardní normální rozdělení z z-scores.

Předpokládejme, že pracujeme s 95% důvěrou. Chceme se podívat z-skóre z *pro které je oblast mezi -z * a z * 0,95. Z tabulky vidíme, že tato kritická hodnota je 1,96.

Kritickou hodnotu jsme také mohli najít následujícím způsobem. Pokud uvažujeme ve smyslu a / 2, protože a = 1 - 0,95 = 0,05, vidíme, že a / 2 = 0,025. Nyní prohledáme tabulku a najdeme z-Score s plochou 0,025 vpravo. Skončili bychom se stejnou kritickou hodnotou 1,96.

Jiné úrovně důvěry nám poskytnou různé kritické hodnoty. Čím větší je úroveň důvěry, tím vyšší bude kritická hodnota. Kritická hodnota pro 90% úroveň spolehlivosti s odpovídající hodnotou a 0,10 je 1,64. Kritická hodnota pro 99% úroveň spolehlivosti s odpovídající hodnotou a 0,01 je 2,54.

Velikost vzorku

Jediné další číslo, které potřebujeme použít k výpočtu vzorce rozpětí chyby je velikost vzorku, označeno n ve vzorci. Potom vezmeme druhou odmocninu tohoto čísla.

Vzhledem k umístění tohoto čísla ve výše uvedeném vzorci, tím větší je velikost vzorku které používáme, tím menší bude míra chyb. Velké vzorky jsou proto výhodnější než menší. Protože však statistické vzorkování vyžaduje zdroje času a peněz, existuje omezení, jak moc můžeme velikost vzorku zvětšit. Přítomnost druhé odmocniny ve vzorci znamená, že ztrojnásobení velikosti vzorku bude pouze poloviční rozpětí chyby.

Několik příkladů

Pro pochopení vzorce se podívejme na několik příkladů.

Jaká je míra chyb pro jednoduchý náhodný vzorek 900 lidí s 95%úroveň důvěry?
Použitím tabulky máme kritickou hodnotu 1,96, takže míra chyb je 1,96 / (2 × 900 = 0,03267, nebo asi 3,3%).
Jaká je míra chyb pro jednoduchý náhodný vzorek 1600 lidí s 95% úrovní spolehlivosti?
Na stejné úrovni důvěra jako první příklad, zvětšení velikosti vzorku na 1600 nám dává chybu 0,0245 nebo asi 2,5%.