Význam bimodalu ve statistice

click fraud protection

Datová sada je bimodální, pokud má dva režimy. To znamená, že při nejvyšší frekvenci nedochází k jediné datové hodnotě. Místo toho existují dvě datové hodnoty, které jsou spojeny s nejvyšší frekvencí.

Příklad bimodální sady dat

Abychom tuto definici lépe pochopili, podíváme se na příklad sady s jedním režimem a poté ji porovnáme s bimodální datovou sadou. Předpokládejme, že máme následující sadu dat:

1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 8, 10, 10

Počítáme frekvenci každého čísla v sadě dat:

  • 1 nastane v sadě třikrát
  • 2 nastane v sadě čtyřikrát
  • 3 nastane v sadě jednou
  • 4 nastane v sadě jednou
  • 5 nastane v sadě dvakrát
  • 6 nastane v sadě třikrát
  • 7 nastane v sadě třikrát
  • 8 nastane v sadě jednou
  • 9 nastává v nastavených nulových časech
  • 10 nastane v sadě dvakrát

Zde vidíme, že 2 se vyskytuje nejčastěji, a tak je to režim datové sady.

Tento příklad porovnáváme s následujícím

1, 1, 1, 2, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 7, 7, 7, 7, 7, 8, 10, 10, 10, 10, 10

Počítáme frekvenci každého čísla v sadě dat:

  • 1 nastane v sadě třikrát
  • instagram viewer
  • 2 nastane v sadě čtyřikrát
  • 3 nastane v sadě jednou
  • 4 nastane v sadě jednou
  • 5 nastane v sadě dvakrát
  • 6 nastane v sadě třikrát
  • 7 nastává v sadě pětkrát
  • 8 nastane v sadě jednou
  • 9 nastává v nastavených nulových časech
  • 10 nastane v sadě pětkrát

Zde 7 a 10 se vyskytují pětkrát. To je vyšší než kterákoli z ostatních hodnot. Říkáme tedy, že datová sada je bimodální, což znamená, že má dva režimy. Jakýkoli příklad bimodálního datového souboru bude podobný tomuto.

Důsledky bimodálního rozdělení

Režim je jedním ze způsobů, jak změřte střed souboru dat. Průměrná hodnota proměnné je někdy ta, která se vyskytuje nejčastěji. Z tohoto důvodu je důležité zjistit, zda je datová sada bimodální. Místo jednoho režimu bychom měli dva.

Jedním z hlavních důsledků bimodální datové sady je to, že nám může odhalit, že v datové sadě jsou zastoupeny dva různé typy jednotlivců. A histogram bimodálního souboru dat bude vykazovat dva vrcholy nebo hrby.

Například histogram testovacích skóre, které jsou bimodální, bude mít dva píky. Tyto vrcholy budou odpovídat místu, kde byla zaznamenána nejvyšší frekvence studentů. Pokud existují dva režimy, pak by to mohlo ukázat, že existují dva typy studentů: ti, kteří byli připraveni na test a ti, kteří nebyli připraveni.

instagram story viewer