Varianta a směrodatná odchylka jsou dvě úzce související míry variace, o kterých budete hodně slyšet ve studiích, časopisech nebo ve statistické třídě. Jsou to dva základní a základní pojmy ve statistice, které je třeba pochopit, aby bylo možné porozumět většině ostatních statistických konceptů nebo postupů. Níže se podíváme na to, co jsou a jak najít rozptyl a směrodatnou odchylku.
Klíčové cesty: odchylka a směrodatná odchylka
- Rozptyl a směrodatná odchylka nám ukazují, jak moc se skóre v distribuci liší od průměru.
- Standardní odchylka je druhá odmocnina rozptylu.
- U malých souborů dat lze rozptyl vypočítat ručně, ale statistické programy lze použít pro větší soubory dat.
Definice
Podle definice jsou rozptyl i směrodatná odchylka měřítkem variací pro proměnné interval-ratio. Popisují, kolik variací nebo rozmanitosti je v distribuci. Oba rozptyl a směrodatná odchylka zvýšit nebo snížit na základě toho, jak blízko se skóre shlukuje kolem průměru.
Varianta je definována jako průměr druhou mocninou odchylek od průměru. Chcete-li vypočítat rozptyl, nejprve odečtěte průměr od každého čísla a pak výsledky vynásobte tak, abyste našli druhou mocninu. Pak zjistíte průměr těchto hranatých rozdílů. Výsledkem je rozptyl.
Standardní odchylka je měřítkem rozložení čísel v distribuci. Ukazuje, kolik se v průměru každá z hodnot v rozdělení liší od průměru nebo středu distribuce. Vypočítá se pomocí druhé odmocniny rozptylu.
Koncepční příklad
Rozptyl a směrodatná odchylka jsou důležité, protože nám říkají věci o sadě dat, které se nemůžeme naučit pouhým pohledem průměr nebo průměr. Jako příklad si představte, že máte tři mladší sourozence: jednoho sourozence, kterému je 13, a dvojčat, které je 10. V tomto případě by průměrný věk vašich sourozenců činil 11 let. Nyní si představte, že máte tři sourozence ve věku 17, 12 a 4 let. V tomto případě by průměrný věk vašich sourozenců byl stále 11, ale rozptyl a směrodatná odchylka by byla větší.
Kvantitativní příklad
Řekněme, že chceme najít rozptyl a směrodatnou odchylku věku mezi vaší skupinou pěti blízkých přátel. Věky vás a vašich přátel jsou 25, 26, 27, 30 a 32.
Nejprve musíme najít střední věk: (25 + 26 + 27 + 30 + 32) / 5 = 28.
Pak musíme vypočítat rozdíly ze střední hodnoty pro každého z 5 přátel.
25 – 28 = -3
26 – 28 = -2
27 – 28 = -1
30 – 28 = 2
32 – 28 = 4
Dále, pro výpočet rozptylu, vezmeme každý rozdíl z průměru, zaokrouhlíme na něj a pak výsledek porovnáme.
Varianta = ((-3)2 + (-2)2 + (-1)2 + 22 + 42)/ 5
= (9 + 4 + 1 + 4 + 16 ) / 5 = 6.8
Rozdíl je tedy 6,8. A standardní odchylka je druhá odmocnina rozptylu, která je 2,61. To znamená, že v průměru jste vy a vaši přátelé ve věku 2,61 let.
Ačkoli je možné vypočítat rozptyl ručně pro menší soubory dat, jako je tento, statistické softwarové programy lze také použít pro výpočet rozptylu a směrodatné odchylky.
Ukázka versus populace
Při provádění statistických testů je důležité si uvědomit rozdíl mezi a populace a vzorek. Pro výpočet standardní odchylky (nebo rozptylu) populace je třeba shromáždit měření pro všechny ve skupině, kterou studujete; pro vzorek byste shromažďovali měření pouze z podmnožiny populace.
Ve výše uvedeném příkladu jsme předpokládali, že skupina pěti přátel byla populace; kdybychom to místo toho považovali za vzorek, výpočet směrodatné odchylky vzorku a rozptyl vzorku by se mírně lišil (namísto dělení velikostí vzorku najít rozptyl, nejprve bychom odečtili jeden z velikosti vzorku a pak ho rozdělili touto menší číslo).
Význam odchylky a směrodatné odchylky
Rozptyl a směrodatná odchylka jsou ve statistice důležité, protože slouží jako základ pro jiné typy statistických výpočtů. Například standardní směrodatná odchylka je nutná pro převod skóre testu na Z-skóre. Rozptyl a směrodatná odchylka také hrají důležitou roli při provádění statistických testů, jako je t-testy.
Reference
Frankfort-Nachmias, C. & Leon-Guerrero, A. (2006). Sociální statistiky pro rozmanitou společnost. Tisíc dubů, Kalifornie: Pine Forge Press.