Co je histogram a jak se používá?

click fraud protection

Histogram je typ grafu, který má rozsáhlé aplikace ve statistice. Histogramy poskytují vizuální interpretaci numerická data uvedením počtu datových bodů, které leží v rozmezí hodnot. Tyto rozsahy hodnot se nazývají třídy nebo zásobníky. Četnost dat, která spadají do každé třídy, je znázorněna pomocí sloupce. Čím vyšší je tato lišta, tím větší je frekvence datových hodnot v tomto zásobníku.

Histogramy vs. Sloupcové grafy

Na první pohled vypadají histogramy velmi podobně sloupcové grafy. Oba grafy používají svislé čáry k reprezentaci dat. Výška tyče odpovídá relativní frekvence množství dat ve třídě. Čím je sloupec vyšší, tím vyšší je frekvence dat. Čím nižší je lišta, tím nižší je frekvence dat. Ale vzhled může být klamný. Právě zde končí podobnost mezi dvěma druhy grafů.

Důvod, proč jsou tyto druhy grafů různé, souvisí s úroveň měření dat. Na jedné straně se sloupcové grafy používají pro data na nominální úrovni měření. Sloupcové grafy měří frekvenci kategorických dat a třídy pro sloupcový graf jsou tyto kategorie. Na druhé straně se histogramy používají pro data, která jsou alespoň na

instagram viewer
řadová úroveň měření. Třídy histogramu jsou rozsahy hodnot.

Další klíčový rozdíl mezi sloupcovými grafy a histogramy souvisí s uspořádáním sloupců. V sloupcovém grafu je běžnou praxí měnit uspořádání sloupců podle klesající výšky. Tyče v histogramu však nelze změnit. Musí být zobrazeny v pořadí, ve kterém se třídy vyskytují.

Příklad histogramu

Výše uvedený diagram ukazuje histogram. Předpokládejme, že se převrátí čtyři mince a výsledky se zaznamenají. Použití vhodných binomická distribuční tabulka nebo přímé výpočty s binomickým vzorcem ukazují, že pravděpodobnost, že žádné hlavy nejsou, je 1/16, pravděpodobnost, že jedna hlava ukazuje, je 4/16. Pravděpodobnost dvou hlav je 6/16. Pravděpodobnost tří hlav je 4/16. Pravděpodobnost čtyř hlav je 1/16.

Sestavili jsme celkem pět tříd, každou ze šířky jedné. Tyto třídy odpovídají možnému počtu hlav: nula, jedna, dvě, tři nebo čtyři. Nad každou třídu nakreslíme svislou čáru nebo obdélník. Výšky těchto sloupců odpovídají pravděpodobnostem uvedeným pro náš pravděpodobnostní experiment převržení čtyř mincí a počítání hlav.

Histogramy a pravděpodobnosti

Výše uvedený příklad nejen demonstruje konstrukci histogramu, ale také to ukazuje diskrétní rozdělení pravděpodobnosti může být reprezentován histogramem. Ve skutečnosti a diskrétní rozdělení pravděpodobnosti může být reprezentováno histogramem.

Abychom vytvořili histogram, který představuje rozdělení pravděpodobnosti, začneme výběrem tříd. To by měly být výsledky experimentu pravděpodobnosti. Šířka každé z těchto tříd by měla být jedna jednotka. Výška sloupců histogramu je pravděpodobnost každého z výsledků. S takto vytvořeným histogramem jsou oblasti sloupců také pravděpodobností.

Protože tento druh histogramu nám dává pravděpodobnost, je předmětem několika podmínek. Jedním ustanovením je, že pro měřítko, které nám dává výšku daného sloupce histogramu, lze použít pouze nezáporná čísla. Druhou podmínkou je, že vzhledem k tomu, že pravděpodobnost je stejná jako plocha, musí všechny oblasti prutů sečíst celkem jednu, což odpovídá 100%.

Histogramy a další aplikace

Sloupce v histogramu nemusí být pravděpodobnosti. Histogramy jsou užitečné v jiných oblastech, než je pravděpodobnost. Kdykoli chceme porovnat frekvenci výskytu kvantitativních dat, lze k zobrazení našeho souboru dat použít histogram.

instagram story viewer