Když změříme variabilitu souboru údajů, vztahují se k tomu dvě úzce související statistiky: odchylka a standardní odchylka, které ukazují, jak jsou rozprostřeny hodnoty dat, a zahrnují podobné kroky při jejich výpočtu. Hlavní rozdíl mezi těmito dvěma statistickými analýzami je v tom, že standardní odchylka je druhou odmocninou rozptylu.
Abychom porozuměli rozdílům mezi těmito dvěma pozorováními statistického šíření, musíme nejprve pochopit, co každý představuje: Variace představuje všechny datové body v sadě a vypočítá se průměrováním druhé odchylky každé střední hodnoty, zatímco standardní odchylka je míra rozptylu kolem střední hodnoty, když je střední tendence vypočítána pomocí znamenat.
Výsledkem je, že rozptyl může být vyjádřen jako průměrná druhá odchylka hodnot od prostředků nebo [kvadrát odchylka prostředků] dělená počtem pozorování a směrodatná odchylka může být vyjádřena jako druhá odmocnina odchylka.
Konstrukce varianty
Abychom plně porozuměli rozdílu mezi těmito statistikami, musíme pochopit výpočet rozptylu. Kroky pro výpočet rozptylu vzorku jsou následující:
- Vypočítá se průměrná hodnota vzorku.
- Najděte rozdíl mezi průměrem a každou z hodnot dat.
- Vyrovnejte tyto rozdíly.
- Sečtěte rozdíly na druhou.
- Vydělte tento součet o jeden menší než celkový počet datových hodnot.
Důvody každého z těchto kroků jsou následující:
- Průměr poskytuje střed nebo průměrný údajů.
- Rozdíly od průměru pomáhají určit odchylky od tohoto průměru. Hodnoty dat, které jsou daleko od průměru, způsobí větší odchylku než hodnoty, které jsou blízko průměru.
- Rozdíly jsou na druhou, protože pokud jsou rozdíly přidány bez druhé, bude tato částka nulová.
- přidání těchto hranatých odchylek poskytuje měření celkové odchylky.
- Rozdělení o méně než velikost vzorku poskytuje určitou střední odchylku. To neguje účinek toho, že mnoho datových bodů přispívá k měření rozpětí.
Jak bylo uvedeno výše, standardní odchylka se jednoduše vypočítá tak, že se najde druhá odmocnina tohoto výsledku, která poskytuje absolutní standard odchylky bez ohledu na celkový počet datových hodnot.
Variace a směrodatná odchylka
Když vezmeme v úvahu rozptyl, uvědomíme si, že existuje jedna hlavní nevýhoda jeho použití. Když postupujeme podle kroků výpočtu rozptylu, ukazuje se, že rozptyl se měří v jednotkách čtverců, protože jsme do výpočtu spočítali druhou mocninu. Například, pokud jsou naše ukázkové údaje měřeny v metrech, pak by jednotky pro rozptyl byly uvedeny v metrech čtverečních.
Abychom mohli standardizovat naši míru šíření, musíme vzít druhou odmocninu rozptylu. Tím se odstraní problém jednotek na druhou a poskytne nám míru rozpětí, které bude mít stejné jednotky jako náš původní vzorek.
Existuje mnoho vzorců v matematické statistice, které mají hezčí vyhlížející formy, když je uvádíme jako rozptyl namísto standardní odchylky.