Bell Curve and Normal Distribution Definition

Termín zvonová křivka se používá k popisu matematického pojmu zvaného normální rozdělení, někdy označovaného jako Gaussovo rozdělení. „Křivka zvonku“ označuje tvar zvonku, který se vytvoří, když se čára vykreslí pomocí datových bodů pro položku, která splňuje kritéria normální distribuce.

Ve zvonové křivce střed obsahuje největší počet hodnot, a proto je nejvyšším bodem na oblouku čáry. Tento bod se označuje jako znamenat, ale v jednoduchých termínech je to nejvyšší počet výskytů prvku (ve statistických termínech režim).

Normální distribuce

Důležitá věc k poznámce o normální distribuce je to, že křivka je soustředěna ve středu a klesá na obou stranách. To je významné v tom, že data mají menší tendenci vytvářet neobvykle extrémní hodnoty, nazývané odlehlé hodnoty, ve srovnání s jinými distribucemi. Zvonková křivka také znamená, že data jsou symetrická. To znamená, že můžete vytvořit přiměřená očekávání, pokud jde o možnost, že výsledek bude ležet uvnitř a jakmile změříte velikost odchylky obsažené v datech, doleva nebo doprava od středu. To se měří v standardní odchylky.

instagram viewer

Graf křivky zvonku závisí na dvou faktorech: střední a standardní odchylce. Průměr identifikuje polohu středu a směrodatná odchylka určuje výšku a šířku zvonku. Například velká směrodatná odchylka vytváří zvonek, který je krátký a široký, zatímco malá směrodatná odchylka vytváří vysokou a úzkou křivku.

Pravděpodobnost Bell křivky a standardní odchylka

Abyste porozuměli pravděpodobnostním faktorům normálního rozdělení, musíte pochopit následující pravidla:

  1. Celková plocha pod křivkou se rovná 1 (100%)
  2. Asi 68% plochy pod křivkou spadá do jedné standardní odchylky.
  3. Přibližně 95% plochy pod křivkou spadá do dvou směrodatných odchylek.
  4. Asi 99,7% plochy pod křivkou spadá do tří směrodatných odchylek.

Položky 2, 3 a 4 výše jsou někdy označovány jako empirické pravidlo nebo pravidlo 68–95–99,7. Jakmile zjistíte, že data jsou normálně distribuována (zvonek zakřivený) a vypočítat průměr a standardní odchylka, můžete určit pravděpodobnost že jeden datový bod spadá do daného rozsahu možností.

Příklad Bell Curve

Dobrým příkladem zvonové křivky nebo normální distribuce je role dvou kostek. Distribuce je soustředěna kolem čísla sedm a pravděpodobnost klesá, když se vzdálíte od centra.

Zde je procentuální šance na různé výsledky, když hodíte dvěma kostkami.

  • Dva: (1/36) 2.78%
  • Tři: (2/36) 5.56%
  • Čtyři: (3/36) 8.33%
  • Pět: (4/36) 11.11%
  • Šest: (5/36) 13.89%
  • Sedm: (6/36) 16,67% = nejpravděpodobnější výsledek
  • Osm: (5/36) 13.89%
  • Devět: (4/36) 11.11%
  • Deset: (3/36) 8.33%
  • Jedenáct: (2/36) 5.56%
  • Dvanáct: (1/36) 2.78%

Normální rozdělení má mnoho výhodných vlastností, takže v mnoha případech, zejména v fyzika a astronomie, náhodné variace s neznámými distribucemi jsou často považovány za normální, aby bylo možné počítat pravděpodobnosti. Ačkoli to může být nebezpečný předpoklad, je to často dobrá aproximace kvůli překvapivému výsledku známému jako teorém centrálního limitu.

Tato věta říká, že průměr jakékoli sady variant s jakoukoli distribucí mající konečnou střední hodnotu a rozptyl má tendenci se vyskytovat v normální distribuci. Mnoho běžných atributů, jako jsou skóre testu nebo výška, následuje zhruba normální rozdělení, s několika členy na vysokých a nízkých koncích a mnoha uprostřed.

Když byste neměli používat Bell Curve

Existují některé typy dat, které nesledují normální distribuční vzorec. Tyto datové soubory by neměly být nuceny pokusit se přizpůsobit zvonovou křivku. Klasickým příkladem by byly studentské známky, které často mají dva režimy. Mezi další typy dat, které křivku nesledují, patří příjem, růst populace a mechanické poruchy.