První a třetí kvartily jsou popisné statistiky, které jsou měřením pozice v datové sadě. Podobně jako medián označuje středový bod datové sady, první kvartil označuje čtvrtinu nebo 25% bod. Přibližně 25% datových hodnot je menší nebo rovno prvnímu kvartilu. Třetí kvartil je podobný, ale pro horních 25% datových hodnot. Tyto myšlenky se podrobněji podíváme v následujícím textu.
Medián
Existuje několik způsobů, jak měřit centrum souboru dat. Střední, střední, režim a střední rozsah mají všechny výhody a omezení při vyjádření středu dat. Ze všech těchto způsobů, jak najít průměr, medián je nejodolnější vůči odlehlým hodnotám. Označuje střed dat v tom smyslu, že polovina dat je menší než střední hodnota.
První kvartil
Není důvod, abychom museli přestat hledat jen uprostřed. Co kdybychom se rozhodli pokračovat v tomto procesu? Můžeme vypočítat střední hodnotu spodní poloviny našich dat. Polovina 50% je 25%. Takže polovina nebo čtvrtina údajů by byla pod touto hodnotou. Protože se jedná o čtvrtinu původní sady, nazývá se tato střední hodnota spodní poloviny dat prvním kvartilem a označuje se
Q1.Třetí kvartil
Neexistuje žádný důvod, proč jsme se podívali na spodní polovinu dat. Místo toho jsme se mohli podívat na horní polovinu a provést stejné kroky jako výše. Střední hodnota této poloviny, kterou označíme Q3 také rozdělí data do čtvrtin. Toto číslo však označuje horní čtvrtinu údajů. Tři čtvrtiny údajů jsou tedy pod naším číslem Q3. Proto voláme Q3 třetí kvartil.
Příklad
Abychom to objasnili, podívejme se na příklad. Může být užitečné nejprve zkontrolovat, jak vypočítat střední hodnotu některých dat. Začněte následující sadou dat:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20
V sadě je celkem dvacet datových bodů. Začneme tím, že najdeme střední hodnotu. Protože existuje sudý počet datových hodnot, je střední hodnota průměrem desáté a jedenácté hodnoty. Jinými slovy, medián je:
(7 + 8)/2 = 7.5.
Nyní se podívejte na spodní polovinu dat. Střední hodnota této poloviny se nachází mezi pátou a šestou hodnotou:
1, 2, 2, 3, 4, 6, 6, 7, 7, 7
Bylo tedy zjištěno, že první kvartil je stejný Q1 = (4 + 6)/2 = 5
Chcete-li najít třetí kvartil, podívejte se na horní polovinu původní sady dat. Musíme najít střední hodnotu:
8, 11, 12, 15, 15, 15, 17, 17, 18, 20
Zde je střední hodnota (15 + 15) / 2 = 15. Tedy třetí kvartil Q3 = 15.
Mezikvartilní rozsah a součet pěti čísel
Kvartily nám pomáhají poskytnout ucelenější obrázek o našem souboru dat jako celku. První a třetí kvartil nám poskytují informace o vnitřní struktuře našich dat. Střední polovina dat spadá mezi první a třetí kvartily a je soustředěna kolem mediánu. Rozdíl mezi prvním a třetím kvartilem, nazvaný Rozsah interkvartilní, ukazuje, jak jsou údaje uspořádány o mediánu. Malý mezikvartilní rozsah označuje data, která jsou shlukována kolem mediánu. Větší mezikvartilní rozsah ukazuje, že data jsou více rozprostřena.
Podrobnější obrázek dat lze získat poznáním nejvyšší hodnoty nazvané maximální hodnota a nejnižší hodnoty nazývané minimální hodnota. Minimální, první kvartil, medián, třetí kvartil a maximum jsou sadou pěti hodnot nazývaných shrnutí pěti čísel. Efektivní způsob zobrazení těchto pěti čísel se nazývá a Boxplot nebo box a graf vousů.