Průvodce začátečníky ke statistikám

Kolik kalorií jedl každý z nás k snídani? Jak daleko od domova dnes cestovali všichni? Jak velké je místo, které nazýváme domovem? Kolik dalších lidí to nazývá domů? Pro pochopení všech těchto informací jsou nezbytné určité nástroje a způsoby myšlení. Matematická věda zvaná statistika nám pomáhá zvládat toto přetížení informací.

Statistika je studium numerických informací, tzv. Dat. Statistici získávají, organizují a analyzují data. Každá část tohoto procesu je také podrobně zkoumána. Techniky statistiky jsou aplikovány na řadu dalších oblastí znalostí. Níže uvádíme úvod do některých hlavních témat celé statistiky.

Obyvatelstvo a vzorky

Jedním z opakujících se témat statistiky je to, že jsme schopni říct něco o velké skupině na základě studia relativně malé části této skupiny. Skupina jako celek je známá jako populace. Část skupiny, kterou studujeme, je vzorek.

Jako příklad toho lze předpokládat, že jsme chtěli znát průměrnou výšku lidí žijících ve Spojených státech. Mohli bychom se pokusit změřit přes 300 milionů lidí, ale to by nebylo možné. Bylo by logistické noční můrou provádět měření takovým způsobem, aby nikdo nezmeškal a nikdo nebyl započítán dvakrát.

instagram viewer

Kvůli nemožné povaze měření každého ve Spojených státech jsme místo toho mohli použít statistiky. Spíše než hledání výšek všech v populaci bereme a statistický vzorek pár tisíc. Pokud jsme vzorek vzorkovali správně, průměrná výška vzorku bude velmi blízko průměrné výšce populace.

Získávání dat

Abychom mohli vyvodit dobré závěry, potřebujeme dobrá data, se kterými bychom mohli pracovat. Způsob, kterým odebíráme vzorek populace, abychom získali tato data, by měl být vždy prozkoumán. Jaký typ vzorku používáme, záleží na tom, na jakou otázku se ptáme na populaci. Nejběžněji používané vzorky jsou:

  • Jednoduché náhodné
  • Rozvrstvený
  • Clustered

Stejně důležité je vědět, jak se provádí měření vzorku. Vraťme se k výše uvedenému příkladu, jak získáme výšky těch v našem vzorku?

  • Umožňujeme lidem, aby na dotazníku uvedli svou vlastní výšku?
  • Měří několik výzkumníků v celé zemi různé lidi a hlásí jejich výsledky?
  • Měří jeden výzkumný pracovník všechny ve vzorku stejným měřítkem?

Každý z těchto způsobů získávání dat má své výhody a nevýhody. Každý, kdo používá data z této studie, bude chtít vědět, jak byl získán.

Organizace dat

Někdy existuje velké množství dat a můžeme se doslova ztratit ve všech detailech. Je těžké vidět les pro stromy. Proto je důležité udržovat naše data dobře organizovaná. Pečlivá organizace a grafické displeje dat nám pomáhají zjistit vzory a trendy dříve, než skutečně provedeme výpočty.

Protože způsob, jakým graficky prezentujeme naše data, závisí na mnoha faktorech. Běžné grafy jsou:

  • Výsečové grafy nebo kruhové grafy
  • Sloupcové nebo paretové grafy
  • Rozptyl
  • Časové spiknutí
  • Stonek a listy
  • Box a graf vousů

Kromě těchto dobře známých grafů existují i ​​další, které se používají ve specializovaných situacích.

Deskriptivní statistika

Jeden způsob, jak analyzovat data, se nazývá popisná statistika. Zde je cílem spočítat veličiny, které popisují naše data. Čísla volala průměr, medián a režim se používají k označení průměrný nebo střed dat. Rozsah a standardní odchylka se používají k vyjádření toho, jak jsou data rozprostřena. Složitější techniky, například korelace a regrese popisují data, která jsou spárována.

Inferenční statistika

Když začneme vzorkem a pak se pokusíme odvodit něco o populaci, používáme inferenciální statistika. Při práci s touto oblastí statistiky je téma testování hypotéz vzniká. Zde vidíme vědeckou povahu předmětu statistiky, jak uvádíme hypotézu, pak ji použijeme statistické nástroje s naším vzorkem k určení pravděpodobnosti, že musíme hypotézu nebo hypotézu zamítnout ne. Toto vysvětlení je opravdu jen poškrábání povrchu této velmi užitečné části statistiky.

Aplikace statistik

Není přehnané říkat, že statistické nástroje používají téměř všechny oblasti vědeckého výzkumu. Zde je několik oblastí, které se silně spoléhají na statistiku:

  • Psychologie
  • Ekonomika
  • Medicína
  • Reklamní
  • Demografie

Základy statistiky

Ačkoli někteří myslí na statistiku jako odvětví matematiky, je lepší myslet na to jako na disciplínu založenou na matematice. Konkrétně je statistika vytvořena z oblasti matematiky známé jako pravděpodobnost. Pravděpodobnost nám dává způsob, jak určit pravděpodobnost výskytu události. Také nám dává způsob, jak mluvit o náhodnosti. Toto je klíč ke statistice, protože typický vzorek musí být náhodně vybrán z populace.

Pravděpodobnost byla nejprve studována v 1700s matematiky takový jako Pascal a Fermat. 1700s také označil začátek statistik. Statistika pokračovala v růstu ze svých kořenů pravděpodobnosti a skutečně vzlétla ve 20. letech 20. století. Dnes se jeho teoretický rozsah stále rozšiřuje o tzv. Matematické statistiky.