Co je statistika Skewness?

click fraud protection

Některé distribuce dat, například zvonová křivka nebo normální distribuce, jsou symetrické. To znamená, že pravá a levá část distribuce jsou dokonalými zrcadlovými obrazy navzájem. Ne každá distribuce dat je symetrická. Sady dat, které nejsou symetrické, jsou považovány za asymetrické. Míra toho, jak asymetrická může být distribuce, se nazývá skewness.

Průměr, střední hodnota a režim jsou všechny opatření centra souboru dat. Správnost údajů může být určena podle toho, jak jsou tyto veličiny ve vzájemném vztahu.

Sklonil se doprava

Data, která jsou zkosena doprava, mají dlouhý ocas, který sahá doprava. Alternativní způsob, jak mluvit o datové sadě nakloněné doprava, je říct, že je pozitivně zkosená. V této situaci průměr a medián jsou oba větší než režim. Obecně platí, že po většinu času se data zkroutila doprava, průměr bude větší než střední hodnota. Stručně řečeno, pro datovou sadu zkosenou doprava:

  • Vždy: střední hodnota větší než režim
  • Vždy: střední hodnota větší než režim
  • Většinu času znamenají větší než střední hodnotu
instagram viewer

Zkosil se doleva

Situace se obrátí, když se zabýváme údaji, které jsou šikmo vlevo. Data, která jsou zkosena doleva, mají dlouhý ocas, který sahá doleva. Alternativní způsob, jak mluvit o datové sadě zkosené doleva, je říci, že je negativně zkosená. V této situaci jsou průměr i medián menší než režim. Obecně platí, že po většinu času se data zkroutila doleva, průměr bude menší než střední hodnota. Stručně řečeno, pro datovou sadu zkosenou doleva:

  • Vždy: znamená méně než režim
  • Vždy: střední méně než režim
  • Většinu času znamenají méně než medián

Opatření Skewness

Jedna věc je podívat se na dvě sady dat a určit, že jedna je symetrická, zatímco druhá je asymetrická. Je to další, podívat se na dvě sady asymetrických dat a říci, že jeden je více zkosený než druhý. To může být velmi subjektivní určit, který je více zkosený pouhým pohledem na graf distribuce. To je důvod, proč existují způsoby, jak numericky vypočítat míru skewness.

Jedním měřítkem skewness, nazývaným Pearsonův první koeficient skewn, je odečíst střední hodnotu z módu a pak tento rozdíl vydělit standardní odchylka údajů. Důvod pro rozdělení rozdílu je tak, že máme bezrozměrné množství. To vysvětluje, proč data zkroutená doprava mají pozitivní skewness. Pokud je sada dat zkosena doprava, průměr je větší než režim, a tak odečtením režimu od průměru se získá kladné číslo. Podobný argument vysvětluje, proč data zkosená doleva mají negativní skewn.

Pearsonův druhý koeficient skewness se také používá k měření asymetrie datového souboru. Pro toto množství odečteme režim od střední hodnoty, vynásobíme toto číslo třemi a poté vydělíme standardní odchylkou.

Aplikace zkosených dat

Šikmá data vznikají zcela přirozeně v různých situacích. Příjmy jsou nakloněny doprava, protože i jen několik jedinců, kteří vydělávají miliony dolarů, může výrazně ovlivnit průměr a neexistují žádné negativní příjmy. Podobně jsou data týkající se životnosti produktu, jako je značka žárovky, zkosena doprava. Zde je nejmenší životnost nulová a žárovky s dlouhou životností propůjčují datům pozitivní skewness.

instagram story viewer