Stupně svobody ve statistice a matematice

Ve statistice se stupně volnosti používají k definování počtu nezávislých veličin, které lze přiřadit statistickému rozdělení. Toto číslo se obvykle vztahuje na celé kladné číslo, které ukazuje na neexistenci omezení schopnosti člověka spočítat chybějící faktory ze statistických problémů.

Stupně svobody fungují jako proměnné v konečném výpočtu statistiky a používají se k určení výsledku různých scénáře v systému a v matematických stupních volnosti definují počet dimenzí v doméně, který je potřebný k určení plný vektor.

Pro ilustraci pojmu stupeň svobody se podíváme na základní výpočet týkající se vzorku střední, a najít průměr ze seznamu dat, přidáme všechna data a vydělíme celkovým počtem hodnoty.

Ilustrace s ukázkovým prostředkem

Na okamžik předpokládejme, že známe znamenat datové sady je 25 a že hodnoty v této sadě jsou 20, 10, 50 a jedno neznámé číslo. Vzorec pro průměr vzorku nám dává rovnici (20 + 10 + 50 + x) / 4 = 25, kde X označuje neznámý, používá některé základní algebra, pak lze zjistit, že chybějící číslo, X, se rovná 20.

instagram viewer

Pojďme mírně změnit tento scénář. Znovu předpokládáme, že víme, že průměr sady dat je 25. Tentokrát jsou však hodnoty v datové sadě 20, 10 a dvě neznámé hodnoty. Tyto neznámé by se mohly lišit, proto používáme dva různé proměnné, X, a y, označit to. Výsledná rovnice je (20 + 10 + x + y) / 4 = 25. S nějakou algebrou získáme y = 70- X. Vzorec je psán v této podobě, aby ukázal, že jakmile vybereme hodnotu X, hodnota pro y je zcela určeno. Máme na výběr, a to ukazuje, že existuje stupeň svobody.

Nyní se podíváme na velikost vzorku sto. Pokud víme, že průměr těchto vzorových dat je 20, ale neznáme hodnoty žádných z dat, existuje 99 stupňů volnosti. Všechny hodnoty musí sečíst celkem 20 x 100 = 2000. Jakmile máme v datové sadě hodnoty 99 prvků, byl určen poslední.

Studentské t-skóre a Chi-Square distribuce

Stupně svobody hrají při používání internetu důležitou roli Student t-Score tabulka. Ve skutečnosti je jich několik t-skóre distribuce. Rozlišujeme mezi těmito distribucemi pomocí stupňů volnosti.

Tady rozdělení pravděpodobnosti které používáme, závisí na velikosti našeho vzorku. Pokud je naše velikost vzorku n, pak počet stupňů volnosti je n-1. Například velikost vzorku 22 by vyžadovala, abychom použili řádek t-Score stůl s 21 stupni volnosti.

Použití a chi-square distribuce také vyžaduje použití stupně svobody. Tady, stejným způsobem jako u t-skóre distribuce, velikost vzorku určuje, kterou distribuci použít. Pokud je velikost vzorku n, pak jsou n-1 stupně svobody.

Standardní odchylky a pokročilé techniky

Další místo, kde se projevují stupně volnosti, je ve vzorci pro standardní odchylku. Tento výskyt není tak zjevný, ale můžeme to vidět, pokud víme, kam hledat. Na najděte standardní odchylku hledáme „průměrnou“ odchylku od průměru. Po odečtení střední hodnoty z každé datové hodnoty a vyrovnání rozdílů jsme nakonec vydělili n-1 spíše než n jak bychom mohli očekávat.

Přítomnost n-1 pochází z počtu stupňů volnosti. Od roku n ve vzorci jsou použity hodnoty dat a průměr vzorku, existují n-1 stupně svobody.

Pokročilejší statistické techniky používají složitější způsoby počítání stupňů volnosti. Při výpočtu statistické zkoušky pro dva prostředky s nezávislými vzorky n1 a n2 prvků, počet stupňů volnosti má poměrně komplikovaný vzorec. To lze odhadnout pomocí menší z n1-1 a n2-1

Další příklad odlišného způsobu počítání stupňů svobody přichází s F test. Při provádění F testujeme k vzorky každé velikosti n- stupně volnosti v čitateli jsou k-1 a ve jmenovateli je k(n-1).