Při zvažování směrodatných odchylek může být překvapením, že ve skutečnosti existují dvě, které lze zvážit. Existuje standardní směrodatná odchylka populace a existuje standardní směrodatná odchylka. Budeme rozlišovat mezi těmito dvěma a zdůraznit jejich rozdíly.
Kvalitativní rozdíly
Ačkoli obě směrodatné odchylky měří variabilitu, existují rozdíly mezi populací a ukázat směrodatnou odchylku. První má co do činění s rozlišením mezi statistiky a parametry. Směrodatná odchylka populace je parametr, což je pevná hodnota vypočtená od každého jedince v populaci.
Standardní směrodatná odchylka je statistika. To znamená, že se počítá pouze od některých jedinců v populaci. Protože směrodatná odchylka vzorku závisí na vzorku, má větší variabilitu. Standardní odchylka vzorku je tedy větší než u populace.
Kvantitativní rozdíl
Uvidíme, jak se tyto dva typy směrodatných odchylek od sebe liší číselně. K tomu bereme v úvahu vzorce jak pro standardní směrodatnou odchylku, tak pro směrodatnou odchylku populace.
Vzorce pro výpočet obou těchto směrodatných odchylek jsou téměř totožné:
- Vypočítejte průměr.
- Odečtěte průměr od každé hodnoty, abyste získali odchylky od střední hodnoty.
- Vyrovnejte každou z odchylek.
- Sečtěte všechny tyto hranaté odchylky.
Nyní se výpočet těchto směrodatných odchylek liší:
- Pokud počítáme směrodatnou odchylku populace, pak dělíme n, počet datových hodnot.
- Pokud počítáme standardní směrodatnou odchylku, pak dělíme n -1, jedna menší než počet datových hodnot.
Posledním krokem je v obou případech, které zvažujeme, odebrat druhou odmocninu kvocientu z předchozího kroku.
Čím větší je hodnota n je, čím blíže budou standardní odchylky populace a vzorku.
Příklad výpočtu
Pro porovnání těchto dvou výpočtů začneme stejnou sadou dat:
1, 2, 4, 5, 8
Dále provedeme všechny kroky, které jsou společné pro oba výpočty. Po tomto výpočtu se výpočty budou navzájem lišit a budeme rozlišovat mezi standardní a odchylkou vzorku a vzorku.
Průměr je (1 + 2 + 4 + 5 + 8) / 5 = 20/5 = 4.
Odchylky se zjistí odečtením střední hodnoty od každé hodnoty:
- 1 - 4 = -3
- 2 - 4 = -2
- 4 - 4 = 0
- 5 - 4 = 1
- 8 - 4 = 4.
Odchylky na druhou jsou následující:
- (-3)2 = 9
- (-2)2 = 4
- 02 = 0
- 12 = 1
- 42 = 16
Nyní přidáme tyto hranaté odchylky a zjistíme, že jejich součet je 9 + 4 + 0 + 1 + 16 = 30.
Při našem prvním výpočtu budeme s našimi údaji zacházet jako s celou populací. Dělí se počtem datových bodů, což je pět. To znamená, že populace odchylka je 30/5 = 6. Směrodatná odchylka populace je druhá odmocnina 6. To je přibližně 2,4495.
V našem druhém výpočtu budeme nakládat s našimi údaji, jako by to byl vzorek a ne celá populace. Dělíme o jeden menší než počet datových bodů. V tomto případě se tedy dělíme čtyřmi. To znamená, že rozptyl vzorku je 30/4 = 7,5. Standardní směrodatná odchylka je druhá odmocnina 7,5. To je přibližně 2,7386.
Z tohoto příkladu je velmi zřejmé, že existuje rozdíl mezi standardní odchylkou populace a vzorku.