Náhodné proměnné s binomickým rozdělením je známo, že jsou diskrétní. To znamená, že v binomickém rozdělení se může vyskytnout množství výsledků, které se od sebe oddělují. Například binomická proměnná může mít hodnotu tři nebo čtyři, ale ne číslo mezi třemi a čtyřmi.
S diskrétním charakterem binomického rozdělení je poněkud překvapivé, že pro přibližné binomické rozdělení lze použít kontinuální náhodnou proměnnou. Pro mnoho binomické distribuce, můžeme použít přibližné rozdělení k přiblížení našich binomických pravděpodobností.
To je vidět při pohledu na n mince hodí a nechává X je počet hlav. V této situaci máme binomické rozdělení s pravděpodobností úspěchu jako str = 0,5. Jak zvyšujeme počet hodů, vidíme, že pravděpodobnost histogram nese větší a větší podobnost s normální distribucí.
Prohlášení o normální aproximaci
Každé normální rozdělení je zcela definováno dvěma reálná čísla. Tato čísla jsou průměrem, který měří střed distribuce a standardní odchylka, které měří šíření distribuce. Pro danou binomickou situaci musíme být schopni určit, které normální rozdělení použít.
Výběr správného normálního rozdělení je určen počtem pokusů n v binomickém prostředí a konstantní pravděpodobnost úspěchu str pro každou z těchto zkoušek. Normální aproximace pro naši binomickou proměnnou je průměrem np a standardní odchylka (np(1 - str)0.5.
Předpokládejme například, že jsme uhodli na každou ze 100 otázek testu s více možnostmi výběru, kde každá otázka měla jednu správnou odpověď ze čtyř možností. Počet správných odpovědí X je binomická náhodná proměnná s n = 100 a str = 0.25. Tato náhodná proměnná má tedy průměr 100 (0,25) = 25 a směrodatnou odchylku (100 (0,25) (0,75))0.5 = 4.33. Normální rozdělení se střední 25 a směrodatná odchylka 4,33 bude fungovat pro přiblížení tohoto binomického rozdělení.
Kdy je aproximace vhodná?
Použitím nějaké matematiky lze ukázat, že existuje několik podmínek, které potřebujeme použít normální aproximaci k binomické rozdělení. Počet pozorování n musí být dostatečně velká a hodnota str takže obě np a n(1 - str) jsou větší nebo rovno 10. Toto je pravidlo, které se řídí statistickou praxí. Normální aproximaci lze použít vždy, ale pokud tyto podmínky nejsou splněny, pak aproximace nemusí být tak dobrá aproximace.
Například, pokud n = 100 a str = 0,25, pak jsme oprávněni používat normální aproximaci. To je proto, že np = 25 a n(1 - str) = 75. Protože obě tato čísla jsou větší než 10, bude vhodné normální rozdělení dělat docela dobrou práci při odhadování binomických pravděpodobností.
Proč používat aproximaci?
Binomické pravděpodobnosti se vypočítají pomocí velmi přímého vzorce pro nalezení binomického koeficientu. Bohužel kvůli faktoriály ve vzorci může být velmi snadné narazit na výpočetní potíže s binomický vzorec. Normální aproximace nám umožňuje obejít jakýkoli z těchto problémů prací se známým přítelem, tabulkou hodnot standardního normálního rozdělení.
Mnohokrát je stanovení pravděpodobnosti, že binomická náhodná proměnná spadá do rozsahu hodnot, obtížné vypočítat. Je to proto, že zjistíme pravděpodobnost, že binomická proměnná X je větší než 3 a menší než 10, budeme muset najít pravděpodobnost, že X se rovná 4, 5, 6, 7, 8 a 9, a pak všechny tyto pravděpodobnosti sčítají. Pokud lze použít normální aproximaci, budeme muset místo toho určit z-skóre odpovídající 3 a 10 a poté použít tabulku pravděpodobností z-skóre pro standardní normální rozdělení.