Co je souhrn 5 čísel?

Existuje celá řada popisných statistik. Čísla, jako je průměr, medián, režim, skewness, kurtóza, standardní odchylka, první kvartil a třetí kvartil, abychom jmenovali alespoň některé, řekněte nám něco o našich datech. Spíše než se na ně dívat deskriptivní statistika individuálně, někdy jejich kombinace nám pomáhá získat úplný obrázek. Z tohoto důvodu je shrnutí pěti čísel vhodným způsobem, jak kombinovat pět popisných statistik.

Kterých pět čísel?

Je jasné, že v našem shrnutí musí být pět čísel, ale která pět? Zvolená čísla nám mají pomoci poznat centrum našich dat a zjistit, jak jsou rozloženy datové body. S ohledem na to se souhrn pěti čísel skládá z následujících:

  • Minimum - to je nejmenší hodnota v našem datovém souboru.
  • První kvartil - toto číslo je označeno Q1 a 25% našich dat klesne pod první kvartil.
  • Medián - to je polovina údajů. 50% všech údajů klesne pod medián.
  • Třetí kvartil - toto číslo je označeno Q3 a 75% našich údajů spadá pod třetí kvartil.
  • Maximum - to je největší hodnota v našem datovém souboru.
instagram viewer

Střední a směrodatná odchylka může být také použita společně k přenosu středu a šíření sady dat. Obě tyto statistiky jsou však náchylné k odlehlým hodnotám. Střední, první kvartil a třetí kvartil nejsou tak silně ovlivněny odlehlými hodnotami.

Příklad

Vzhledem k následující sadě dat uvedeme souhrn pěti čísel:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

V datovém souboru je celkem dvacet bodů. Medián je tedy průměrem desáté a jedenácté hodnoty dat nebo:

(7 + 8)/2 = 7.5.

Medián spodní poloviny dat je první kvartil. Spodní polovina je:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Takže počítámeQ1= (4 + 6)/2 = 5.

Mediánem horní poloviny původní sady dat je třetí kvartil. Musíme najít střední hodnotu:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Takže počítámeQ3= (15 + 15)/2 = 15.

Shromažďujeme všechny výše uvedené výsledky dohromady a hlásíme, že součet pěti čísel pro výše uvedenou sadu dat je 1, 5, 7,5, 12, 20.

Grafické znázornění

Porovnat lze pět souhrnů čísel. Zjistíme, že dvě sady s podobnými prostředky a směrodatnými odchylkami mohou mít velmi odlišné souhrny pěti čísel. Chcete-li snadno porovnat dva přehledy pěti čísel na první pohled, můžeme použít a boxplot, nebo graf grafu a vousů.