Příklad zavádění systému do statistiky

click fraud protection

Zavádění systému je výkonná statistická technika. Je to zvláště užitečné, když vzorek velikost, se kterou pracujeme, je malá. Za obvyklých okolností nelze velikosti vzorků menší než 40 vyřešit za předpokladu a normální distribuce nebo a t distribuce. Techniky zavádění systému fungují docela dobře se vzorky, které mají méně než 40 prvků. Důvodem je to, že bootstrapping zahrnuje převzorkování. Tyto druhy technik nepředpokládají nic o rozdělení našich dat.

Bootstrapping se stal populárnějším, protože počítačové zdroje se staly dostupnější. Důvodem je to, že aby bylo zavádění systému praktické, musí být použit počítač. Uvidíme, jak to funguje v následujícím příkladu bootstrappingu.

Začínáme statistický vzorek od populace, o které nic nevíme. Naším cílem bude 90% interval spolehlivosti o průměru vzorku. Ačkoli jiné statistické techniky používané k určení intervaly spolehlivosti Předpokládejme, že známe střední nebo standardní odchylku naší populace, bootstrapping nevyžaduje nic jiného než vzorek.

instagram viewer

Pro účely našeho příkladu budeme předpokládat, že vzorek je 1, 2, 4, 4, 10.

Nyní se převracíme s nahrazením z našeho vzorku a vytváříme takzvané vzorky bootstrapu. Každý vzorek bootstrapu bude mít velikost pět, stejně jako náš původní vzorek. Protože náhodně vybíráme a poté nahrazujeme každou hodnotu, vzorky bootstrapu se mohou lišit od původního a od sebe navzájem.

Pro příklady, na které bychom narazili v reálném světě, bychom to přeinstalovali stovky, ne-li tisícekrát. V následujícím textu uvidíme příklad 20 příkladů bootstrapů:

Protože používáme bootstrapping pro výpočet intervalu spolehlivosti pro průměr populace, nyní vypočítáme průměr každého z našich bootstrap vzorků. Tyto prostředky jsou uspořádány ve vzestupném pořadí: 2, 2,4, 2,6, 2,6, 2,8, 3, 3, 3,2, 3,4, 3,6, 3,8, 4, 4, 4,2, 4,6, 5,2, 6, 6, 6,6, 7,6.

Nyní získáme z našeho seznamu vzorků bootstrapu interval spolehlivosti. Protože chceme 90% interval spolehlivosti, použijeme 95. a 5. percentily jako koncové body intervalů. Důvodem je to, že jsme rozdělili 100% - 90% = 10% na polovinu, takže budeme mít středních 90% všech prostředků bootstrapového vzorku.

instagram story viewer