Co je interval spolehlivosti plus čtyři?

click fraud protection

v inferenciální statistika, intervaly spolehlivosti pro podíl obyvatelstva spoléhat se na standardní normální rozdělení k určení neznámých parametrů dané populace dané statistickému vzorku populace. Jedním z důvodů je to, že pro vhodné velikosti vzorků je standardní normální rozdělení dělá vynikající práci při odhadování a binomické rozdělení. To je pozoruhodné, protože ačkoli první distribuce je kontinuální, druhá je diskrétní.

Při vytváření intervalů spolehlivosti pro proporce je třeba řešit řadu problémů. Jeden z nich se týká toho, co je známo jako „plus čtyři“ interval spolehlivosti, jehož výsledkem je a zkreslený odhadce. Tento odhad neznámého podílu populace však v některých situacích funguje lépe než nezaujatí odhadci, zejména situace, kdy v EU neexistují žádné úspěchy ani neúspěchy data.

Ve většině případů je nejlepším pokusem odhadnout podíl populace použít odpovídající podíl vzorku. Předpokládáme, že existuje populace s neznámým podílem str svých jedinců obsahujících určitou vlastnost, pak vytvoříme jednoduchý náhodný vzorek velikosti

instagram viewer
n z této populace. Z nich n jednotlivci, spočítáme jejich počet Y které mají vlastnost, na kterou jsme zvědaví. Nyní odhadujeme p pomocí našeho vzorku. Poměr vzorku Y / n je nestranný odhadce str.

Kdy použít plus čtyři interval spolehlivosti

Když použijeme interval plus čtyři, upravíme odhadovač str. Děláme to tak, že k celkovému počtu pozorování přidáme čtyři, čímž vysvětlíme větu „plus čtyři“ čtyři pozorování mezi dvěma hypotetickými úspěchy a dvěma selháními, což znamená, že k celému počtu přidáme dvě úspěchy. Konečným výsledkem je, že nahradíme každou instanci Y / n s (Y + 2)/(n + 4) a někdy je tento zlomek označen str s vlnovkou nad ní.

Poměr vzorku obvykle pracuje velmi dobře při odhadu podílu populace. Existují však situace, kdy je třeba náš odhadce mírně upravit. Statistická praxe a matematická teorie ukazují, že k dosažení tohoto cíle je vhodná úprava intervalu plus čtyři.

Jedna situace, která by nás měla přimět k úvaze o plusovém intervalu, je vzorek s rozloženými oky. Mnohokrát, vzhledem k tomu, že podíl populace je tak malý nebo tak velký, je podíl vzorku také velmi blízko 0 nebo velmi blízko 1. V tomto typu situace bychom měli zvážit plus čtyři intervaly.

Dalším důvodem pro použití intervalu plus čtyři je, pokud máme malou velikost vzorku. Interval plus čtyři v této situaci poskytuje lepší odhad podílu populace než použití typického intervalu spolehlivosti pro poměr.

Pravidla pro použití intervalu spolehlivosti plus čtyři

Interval spolehlivosti plus čtyři je téměř magický způsob, jak přesněji vypočítat inferenciální statistiku tím, že jednoduše přidáte čtyři imaginární pozorování jakéhokoli daného datového souboru, dvou úspěchů a dvou selhání, je schopna přesněji předpovědět podíl datového souboru, který vyhovuje parametry.

Interval spolehlivosti plus čtyři však není vždy použitelný na každý problém. Lze jej použít pouze v případě, že interval spolehlivosti souboru údajů je nad 90% a velikost vzorku populace je nejméně 10. Soubor dat však může obsahovat libovolný počet úspěchů a neúspěchů, i když to funguje lépe, když v datech dané populace neexistují žádné úspěchy nebo žádné selhání.

Mějte na paměti, že na rozdíl od výpočtů pravidelné statistiky se výpočty inferenciální statistiky opírají o výběr dat, aby se určily nejpravděpodobnější výsledky v rámci populace. Ačkoli plus čtyři interval spolehlivosti koriguje pro větší rozpětí chyby, musí být toto rozpětí ještě zohledněno, aby bylo zajištěno co nejpřesnější statistické pozorování.

instagram story viewer