Popisný vs. Inferenční statistika

Statistické pole je rozděleno do dvou hlavních divizí: popisné a deduktivní. Každý z těchto segmentů je důležitý a nabízí různé techniky, které dosahují různých cílů. Popisné statistiky popisují, co se děje v a populace nebo soubor dat. Inferenciální statistika naopak umožňuje vědcům brát poznatky ze skupiny vzorků a zobecnit je na větší populaci. Dva typy statistik mají některé důležité rozdíly.

Deskriptivní statistika

Popisná statistika je typ statistiky, který pravděpodobně napadne většinu lidí, když uslyší slovo „statistika“. V této oblasti statistiky je cílem popsat. Numerická měřítka se používají ke sdělování funkcí sady dat. Do této části statistiky patří řada položek, například:

  • průměrnýnebo míra středu souboru dat, sestávající z průměru, mediánu, režimu nebo středního rozsahu
  • Šíření datového souboru, který lze měřit pomocí rozsah nebo standardní odchylka
  • Celkový popis údajů, jako je shrnutí pěti čísel
  • Měření jako skewness a kurtóza
  • Zkoumání vztahů a korelace mezi spárovanými daty
  • Prezentace statistických výsledků v roce 2007 grafický formulář
instagram viewer

Tato opatření jsou důležitá a užitečná, protože umožňují vědcům vidět vzory mezi údaji, a tak jim dát smysl. Popisnou statistiku lze použít pouze k popisu populace nebo studovaných dat: Výsledky nelze zobecnit na žádnou jinou skupinu nebo populaci.

Typy popisné statistiky

Sociální vědci používají dva druhy popisných statistik:

Měření centrální tendence zachycení obecných trendů v datech a jsou vypočteny a vyjádřeny jako průměr, medián a režim. Průměr říká vědcům matematický průměr všech datových souborů, jako je průměrný věk při prvním sňatku; medián představuje střed distribuce dat, stejně jako věk, který sedí uprostřed rozmezí věků, kdy se lidé poprvé ožení; a režim by mohl být nejběžnějším věkem, kdy se lidé poprvé ožení.

Míra šíření popisuje, jak jsou data distribuována a vzájemně souvisí, včetně:

  • Rozsah, celý rozsah hodnot přítomných v sadě dat
  • Frekvenční distribuce, která definuje, kolikrát se konkrétní hodnota objeví v datové sadě
  • Kvartily, podskupiny vytvořené v datové sadě, když jsou všechny hodnoty rozděleny do čtyř stejných částí v celém rozsahu
  • Střední absolutní odchylka, průměr toho, jak se každá hodnota liší od průměru
  • Odchylka, což ukazuje, kolik rozpětí v datech existuje
  • Standardní odchylka, která ilustruje šíření dat vzhledem k průměru

Míra rozptylu je často vizuálně znázorněna v tabulkách, výsečových a sloupcových grafech a histogramech, aby pomohla pochopit trendy v datech.

Inferenční statistika

Inferenciální statistiky jsou vytvářeny pomocí složitých matematických výpočtů, které umožňují vědcům odvodit trendy o větší populaci na základě studie vzorku odebraného z ní. Vědci používají inferenciální statistiky ke zkoumání vztahů mezi proměnnými ve vzorku a poté provést zobecnění nebo předpovědi o tom, jak se tyto proměnné budou vztahovat k větším populace.

Obvykle není možné zkoumat každého člena populace jednotlivě. Vědci si tedy vybrali reprezentativní podskupinu populace, nazvanou statistický vzorek, a z této analýzy jsou schopni říci něco o populaci, ze které vzorek pochází. Existují dvě hlavní divize inferenčních statistik:

  • Interval spolehlivosti udává rozsah hodnot pro neznámý parametr populace měřením statistického vzorku. To je vyjádřeno jako interval a míra spolehlivosti, že parametr je v intervalu.
  • Testy významnosti nebo testování hypotéz kde vědci tvrdí o populaci analýzou statistického vzorku. Podle návrhu existuje v tomto procesu určitá nejistota. To lze vyjádřit pomocí úrovně významnosti.

Mezi techniky, které sociální vědci používají ke zkoumání vztahů mezi proměnnými, a tím k vytváření inferenciálních statistik, patří lineární regresní analýzy, logistické regresní analýzy, ANOVA, korelační analýzy, strukturální rovnice modelovánía analýza přežití. Při provádění výzkumu pomocí inferenciální statistiky provádějí vědci test významnosti, aby určili, zda mohou své výsledky zobecnit na větší populaci. Mezi běžné testy významnosti patří chi-náměstí a t-test. Tito vědci říkají pravděpodobnost, že výsledky jejich analýzy vzorku jsou reprezentativní pro populaci jako celek.

Popisný vs. Inferenční statistika

Přestože popisná statistika je užitečná při učení věcí, jako je šíření a střed dat, nic v popisné statistice nelze použít k vytváření zobecnění. V popisné statistice jsou měření jako průměr a směrodatná odchylka uvedena jako přesná čísla.

I když inferenciální statistika používá některé podobné výpočty - například střední a standardní odchylku - zaměření pro inferenciální statistiku je jiné. Inferenční statistiky začínají vzorkem a poté se zobecňují na populaci. Tato informace o populaci není uvedena jako číslo. Místo toho vědci vyjadřují tyto parametry jako řadu potenciálních čísel spolu se stupněm důvěry.