Rozdíly mezi standardními odchylkami populace a vzorku

Při zvažování směrodatných odchylek může být překvapením, že ve skutečnosti existují dvě, které lze zvážit. Existuje standardní směrodatná odchylka populace a existuje standardní směrodatná odchylka. Budeme rozlišovat mezi těmito dvěma a zdůraznit jejich rozdíly.

Kvalitativní rozdíly

Ačkoli obě směrodatné odchylky měří variabilitu, existují rozdíly mezi populací a ukázat směrodatnou odchylku. První má co do činění s rozlišením mezi statistiky a parametry. Směrodatná odchylka populace je parametr, což je pevná hodnota vypočtená od každého jedince v populaci.

Standardní směrodatná odchylka je statistika. To znamená, že se počítá pouze od některých jedinců v populaci. Protože směrodatná odchylka vzorku závisí na vzorku, má větší variabilitu. Standardní odchylka vzorku je tedy větší než u populace.

Kvantitativní rozdíl

Uvidíme, jak se tyto dva typy směrodatných odchylek od sebe liší číselně. K tomu bereme v úvahu vzorce jak pro standardní směrodatnou odchylku, tak pro směrodatnou odchylku populace.

instagram viewer

Vzorce pro výpočet obou těchto směrodatných odchylek jsou téměř totožné:

  1. Vypočítejte průměr.
  2. Odečtěte průměr od každé hodnoty, abyste získali odchylky od střední hodnoty.
  3. Vyrovnejte každou z odchylek.
  4. Sečtěte všechny tyto hranaté odchylky.

Nyní se výpočet těchto směrodatných odchylek liší:

  • Pokud počítáme směrodatnou odchylku populace, pak dělíme n, počet datových hodnot.
  • Pokud počítáme standardní směrodatnou odchylku, pak dělíme n -1, jedna menší než počet datových hodnot.

Posledním krokem je v obou případech, které zvažujeme, odebrat druhou odmocninu kvocientu z předchozího kroku.

Čím větší je hodnota n je, čím blíže budou standardní odchylky populace a vzorku.

Příklad výpočtu

Pro porovnání těchto dvou výpočtů začneme stejnou sadou dat:

1, 2, 4, 5, 8

Dále provedeme všechny kroky, které jsou společné pro oba výpočty. Po tomto výpočtu se výpočty budou navzájem lišit a budeme rozlišovat mezi standardní a odchylkou vzorku a vzorku.

Průměr je (1 + 2 + 4 + 5 + 8) / 5 = 20/5 = 4.

Odchylky se zjistí odečtením střední hodnoty od každé hodnoty:

  • 1 - 4 = -3
  • 2 - 4 = -2
  • 4 - 4 = 0
  • 5 - 4 = 1
  • 8 - 4 = 4.

Odchylky na druhou jsou následující:

  • (-3)2 = 9
  • (-2)2 = 4
  • 02 = 0
  • 12 = 1
  • 42 = 16

Nyní přidáme tyto hranaté odchylky a zjistíme, že jejich součet je 9 + 4 + 0 + 1 + 16 = 30.

Při našem prvním výpočtu budeme s našimi údaji zacházet jako s celou populací. Dělí se počtem datových bodů, což je pět. To znamená, že populace odchylka je 30/5 = 6. Směrodatná odchylka populace je druhá odmocnina 6. To je přibližně 2,4495.

V našem druhém výpočtu budeme nakládat s našimi údaji, jako by to byl vzorek a ne celá populace. Dělíme o jeden menší než počet datových bodů. V tomto případě se tedy dělíme čtyřmi. To znamená, že rozptyl vzorku je 30/4 = 7,5. Standardní směrodatná odchylka je druhá odmocnina 7,5. To je přibližně 2,7386.

Z tohoto příkladu je velmi zřejmé, že existuje rozdíl mezi standardní odchylkou populace a vzorku.