Co je pravidlo mezikvartilního rozsahu?

click fraud protection

Pravidlo mezikvartilního rozsahu je užitečné při detekci přítomnosti odlehlých hodnot. Odlehlé hodnoty jsou jednotlivé hodnoty, které nespadají do celkového vzoru datové sady. Tato definice je poněkud vágní a subjektivní, takže je užitečné mít pravidlo, kdy se má použít určující, zda je datový bod skutečně odlehlý - zde platí pravidlo mezikvartilního rozsahu přichází v.

Jakákoli sada dat může být popsána pomocí shrnutí pěti čísel. Těchto pět čísel, která vám poskytují informace, které potřebujete k nalezení vzorů a odlehlých hodnot, se skládají (ve vzestupném pořadí):

Těchto pět čísel říká člověku více o jejich datech, než kdyby se na ně mohli dívat všechna čísla najednou, nebo to alespoň usnadnilo. Například rozsah, což je minimum odečtené od maxima, je jedním z ukazatelů rozložení dat v sadě (poznámka: rozsah je vysoce citlivý na odlehlé hodnoty - pokud je odlehlý údaj také minimální nebo maximální, rozsah nebude přesným vyjádřením šířky dat soubor).

Jinak by bylo obtížné extrapolovat rozsah. Podobný rozsahu, ale méně citlivý na odlehlé hodnoty, je mezikvartilní rozsah.

instagram viewer
Rozsah interkvartilní je vypočtena téměř stejným způsobem jako rozsah. Vše, co najdete, je odečíst první kvartil od třetího kvartilu:

Mezikvartilní rozsah ukazuje, jak jsou data šířena o mediánu. To je méně citlivé než rozsah k odlehlým hodnotám, a proto může být užitečnější.

Přestože to není často ovlivněno, interquartilní rozsah lze použít k detekci odlehlých hodnot. To se provádí pomocí těchto kroků:

Pamatujte, že pravidlo mezikvartilu je pouze pravidlem, které obecně platí, ale nevztahuje se na každý případ. Obecně byste vždy měli sledovat vaši odlehlou analýzu studiem výsledných odlehlých hodnot, abyste zjistili, zda mají smysl. Jakýkoli potenciální odlehlý výsledek získaný mezikvartilovou metodou by měl být zkoumán v kontextu celého souboru údajů.

Podívejte se na pravidlo mezikvartilního rozsahu při práci s příkladem. Předpokládejme, že máte následující sadu dat: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Souhrn pěti čísel pro tento soubor dat je minimum = 1, první kvartil = 4, medián = 7, třetí kvartil = 10 a maximum = 17. Můžete se podívat na data a automaticky říci, že 17 je odlehlé, ale co říká pravidlo mezikvartilu?

Nyní znásobte svou odpověď 1,5, abyste dostali 1,5 x 6 = 9. Devět méně než první kvartil je 4 - 9 = -5. Žádná data nejsou menší. Devět více než třetí kvartil je 10 + 9 = 19. Žádná data nejsou větší než tato. Přestože maximální hodnota je o pět více než nejbližší datový bod, pravidlo mezikvartilního rozsahu ukazuje, že by pravděpodobně nemělo být považováno za odlehlé pro tento soubor dat.

instagram story viewer