v statistika, výraz robustní nebo robustnost označuje sílu statistického modelu, testů a postupů podle konkrétních podmínek statistické analýzy, kterou studie doufá. Vzhledem k tomu, že jsou tyto podmínky studie splněny, lze modely ověřit pomocí pravdivých matematických důkazů.
Mnoho modelů je založeno na ideálních situacích, které při práci s reálnými daty neexistují, a v důsledku toho může model poskytnout správné výsledky, i když podmínky nejsou přesně splněny.
Robustní statistiky jsou tedy jakékoli statistiky, které přinášejí dobrý výkon, když jsou data čerpána ze široké škály pravděpodobnostní distribuce, které jsou do velké míry nedotčeny odlehlými hodnotami nebo malými odchylkami od předpokladů modelu v daném případě dataset. Jinými slovy, robustní statistika je odolná vůči chybám ve výsledcích.
Jedním ze způsobů, jak dodržovat běžně prováděný robustní statistický postup, není potřeba hledat nic jiného než t-postupy, které využívají testy hypotéz k určení nejpřesnějších statistických předpovědí.
Dodržování T-postupů
Jako příklad robustnosti budeme uvažovat t- postupy, které zahrnují interval spolehlivosti pro průměr populace s neznámou standardní odchylkou populace, jakož i testy hypotéz o průměru populace.
Použití t-postupy předpokládají následující:
- Soubor dat, se kterým pracujeme, je jednoduchý náhodný vzorek z populace.
- Populace, ze které jsme odebrali vzorky, je normálně distribuována.
V praxi s příklady ze skutečného života mají statistici jen zřídka populaci, která je normálně distribuována, takže se místo toho stává otázkou: „Jak silné jsou naše t-postupy? “
Obecně je podmínka, že máme jednoduchý náhodný vzorek, důležitější než podmínka, že jsme odebrali vzorky z normálně distribuované populace; důvodem je to, že centrální limitní věta zajišťuje distribuci vzorkování, která je přibližně normální - čím větší je naše velikost vzorku, tím blíže má být distribuce vzorkování střední hodnoty normální.
Jak postupy T fungují jako robustní statistika
Takže robustnost pro t-procesy závisí na velikosti vzorku a distribuci našeho vzorku. Mezi úvahy patří:
- Pokud je velikost vzorků velká, znamená to, že máme 40 nebo více pozorování t-procedury mohou být použity dokonce s distribucemi, které jsou zkosené.
- Pokud je velikost vzorku mezi 15 a 40, můžeme použít t-postupy pro jakékoli tvarované rozdělení, pokud neexistují odlehlé hodnoty nebo vysoký stupeň skebosti.
- Pokud je velikost vzorku menší než 15, můžeme použít t- postupy pro údaje, které nemají odlehlé hodnoty, jediný vrchol a jsou téměř symetrické.
Ve většině případů byla robustnost prokázána technickou prací v matematické statistice a naštěstí nemusíme nutně provádět tyto pokročilé matematické výpočty, abychom správně využít je; musíme pouze pochopit, jaké jsou obecné pokyny pro robustnost naší specifické statistické metody.
T-postupy fungují jako robustní statistika, protože obvykle poskytují dobrý výkon u těchto modelů faktorováním velikosti vzorku do základu pro použití postupu.