Úvod do mezikvartilního rozsahu

click fraud protection

Mezikvartilový rozsah (IQR) je rozdíl mezi prvním a třetím kvartilem. Vzorec je:

IQR = Q3 - Q1

Existuje mnoho měření variability souboru dat. Oba rozsah a standardní odchylka řekněte nám, jak jsou naše data rozšířena. Problém s těmito popisnými statistikami spočívá v tom, že jsou velmi citliví na odlehlé hodnoty. Měřením šíření datového souboru, který je odolnější vůči přítomnosti odlehlých hodnot, je mezikvartilní rozsah.

Definice mezikvartilového rozsahu

Jak je vidět výše, mezikvartilní rozsah je založen na výpočtu jiných statistik. Před určením mezikvartilového rozsahu musíme nejprve znát hodnoty prvního kvartilu a třetího kvartilu. (Samozřejmě, že první a třetí kvartily závisí na hodnotě mediánu).

Jakmile jsme určili hodnoty prvního a třetího kvartilu, lze mezikvartilní rozsah snadno vypočítat. Vše, co musíme udělat, je odečíst první kvartil od třetího kvartilu. Toto vysvětluje použití termínu interquartile rozsah pro tuto statistiku.

Příklad

Abychom viděli příklad výpočtu mezikvartilového rozsahu, vezmeme v úvahu sadu dat: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9.

instagram viewer
shrnutí pěti čísel pro tuto sadu dat je:

  • Minimálně 2
  • První kvartil 3,5
  • Střední 6
  • Třetí kvartil 8
  • Maximálně 9

Vidíme tedy, že mezikvartilové rozmezí je 8 - 3,5 = 4,5.

Význam mezikvartilního rozsahu

Rozsah nám poskytuje měření toho, jak je rozložena celá naše sada dat. Mezikvartilní rozsah, který nám říká, jak daleko od sebe první a třetí kvartil jsou, označuje, jak je rozprostřeno středních 50% naší sady dat.

Odolnost vůči odlehlým hodnotám

Primární výhodou použití mezikvartilového rozsahu spíše než rozsahu pro měření šíření datové sady je to, že mezikvartilní rozsah není citlivý na odlehlé hodnoty. Abychom to viděli, podíváme se na příklad.

Z výše uvedené sady dat máme mezikvartilové rozmezí 3,5, rozmezí 9 - 2 = 7 a směrodatnou odchylku 2,34. Pokud nahradíme nejvyšší hodnotu 9 extrémní odlehlou hodnotou 100, standardní odchylka se stane 27,37 a rozsah je 98. I když máme tyto drastické posuny těchto hodnot, první a třetí kvartily nejsou ovlivněny, a proto se mezikvartilní rozsah nemění.

Použití mezikvartilového rozsahu

Kromě méně citlivé míry šíření datové sady má mezikvartilní rozsah další důležité využití. Kvůli jeho odolnosti vůči odlehlým hodnotám je mezikvartilní rozsah užitečný při určování, kdy je hodnota odlehlá.

pravidlo mezikvartilního rozsahu je to, co nás informuje, zda máme mírnou nebo silnou odlehlou hodnotu. Chcete-li hledat odlehlou hodnotu, musíme hledat pod prvním kvartilem nebo nad třetím kvartilem. Jak daleko bychom měli jít, závisí na hodnotě mezikvartilního rozsahu.

instagram story viewer