v statistika, existuje mnoho výrazů, které mezi nimi jemně rozlišují. Jedním z příkladů je rozdíl mezi frekvence a relativní frekvence. Ačkoli existuje mnoho použití pro relativní frekvence, existuje jedno, které zahrnuje histogram relativní frekvence. Toto je typ grafu, který má vazby na jiná témata ve statistice a matematické statistice.
Definice
Histogramy jsou statistické grafy, které vypadají sloupcové grafy. Obvykle je však termín histogram vyhrazen kvantitativní proměnné. Vodorovná osa histogramu je číselný řádek obsahující třídy nebo koše stejné délky. Tyto zásobníky jsou intervaly číselné řady, kde mohou data padat a mohou se skládat z jediného čísla (obvykle pro oddělený datové sady, které jsou relativně malé) nebo rozsah hodnot (pro větší diskrétní datové sady a nepřetržitý data).
Například bychom mohli mít zájem zvážit rozdělení skóre na 50 bodový kvíz pro třídu studentů. Jedním z možných způsobů, jak postavit koše, by bylo mít jinou nádobu na každých 10 bodů.
Svislá osa histogramu představuje počet nebo frekvenci výskytu datové hodnoty v každém z popelnic. Čím je sloupec vyšší, tím více datových hodnot spadá do tohoto rozsahu hodnot bin. Vrátíme-li se k našemu příkladu, pokud máme pět studentů, kteří získali v kvízu více než 40 bodů, bude lišta odpovídající 40 až 50 přihrádkám vysoká pět jednotek.
Porovnání kmitočtového histogramu
Histogram relativní frekvence je malá modifikace typického frekvenčního histogramu. Spíše než použití vertikální osy pro počet hodnot dat, které spadají do daného zásobníku, používáme tuto osu k reprezentaci celkového podílu hodnot dat, které spadají do tohoto zásobníku. Protože 100% = 1, všechny sloupce musí mít výšku od 0 do 1. Kromě toho musí být výška všech sloupců v našem histogramu relativní frekvence 1.
V běžném příkladu, na který jsme se dívali, tedy předpokládejme, že v naší třídě je 25 studentů a pět získalo více než 40 bodů. Namísto toho, abychom pro tuto přihrádku vytvořili tyč s výškou pět, měli bychom tyč s výškou 5/25 = 0,2.
Při porovnání histogramu s relativním frekvenčním histogramem, každý se stejnými zásobníky, si něco všimneme. Celkový tvar histogramů bude identický. Histogram relativní frekvence nezvýrazňuje celkový počet v každém zásobníku. Místo toho se tento typ grafu zaměřuje na to, jak se počet hodnot dat v koši týká ostatních zásobníků. Tento vztah ukazuje na procenta z celkového počtu datových hodnot.
Pravděpodobnostní hromadné funkce
Můžeme se divit, jaký má smysl definovat relativní frekvenční histogram. Jedna klíčová aplikace se týká diskrétních náhodných proměnných, kde jsou naše zásobníky šířky jedna a jsou soustředěny kolem každého nezáporného celého čísla. V tomto případě můžeme definovat kusovou funkci s hodnotami odpovídajícími svislým výškám prutů v našem relativním kmitočtovém histogramu.
Tento typ funkce se nazývá pravděpodobnostní hromadná funkce. Důvod pro konstruování funkce tímto způsobem je, že křivka, která je definována funkcí, má přímé spojení s pravděpodobnost. Oblast pod křivkou z hodnot A na b je pravděpodobnost, že náhodná proměnná má hodnotu z A na b.
Souvislost mezi pravděpodobností a oblastí pod křivkou je taková, která se opakovaně zobrazuje v matematické statistice. Dalším takovým spojením je použití funkce pravděpodobnostní hmotnosti k modelování histogramu relativní frekvence.