Empirické pravidlo pro střední, střední a režim

Než budeme pokračovat, je důležité porozumět tomu, o čem mluvíme, když odkazujeme na empirický vztah a porovnat to s teoretickými studiemi. Některé výsledky ve statistice a dalších oblastech znalostí lze odvodit z některých předchozích tvrzení teoretickým způsobem. Začneme tím, co víme, a pak používáme logiku, matematiku a deduktivní uvažování a uvidíte, kam nás to vede. Výsledek je přímým důsledkem jiných známých skutečností.

V kontrastu s teoretickým je empirický způsob získávání znalostí. Spíše než zdůvodnění již zavedených principů můžeme pozorovat svět kolem nás. Z těchto pozorování pak můžeme formulovat vysvětlení toho, co jsme viděli. Hodně vědy se tak děje. Experimenty nám poskytují empirická data. Cílem pak je formulovat vysvětlení, které vyhovuje všem datům.

Ve statistice existuje vztah mezi průměrem, mediánem a módem, který je empiricky založen. Pozorování bezpočtu datových souborů ukázaly, že ve většině případů je rozdíl mezi průměrem a režimem trojnásobkem rozdílu mezi průměrem a středem. Tento vztah ve formě rovnice je:

instagram viewer

Chcete-li vidět výše uvedený vztah k datům ze skutečného světa, podívejme se na populace USA v roce 2010. V milionech byly populace: Kalifornie - 36,4, Texas - 23,5, New York - 19,3, Florida - 18,1, Illinois - 12,8, Pensylvánie - 12,4, Ohio - 11,5, Michigan - 10,1, Gruzie - 9,4, Severní Karolína - 8,9, New Jersey - 8,7, Virginie - 7,6, Massachusetts - 6,4, Washington - 6,4, Indiana - 6,3, Arizona - 6,2, Tennessee - 6,0, Missouri - 5.8, Maryland - 5,6, Wisconsin - 5,6, Minnesota - 5,2, Colorado - 4,8, Alabama - 4,6, Jižní Karolína - 4,3, Louisiana - 4,3, Kentucky - 4,2, Oregon - 3,7, Oklahoma - 3,6, Connecticut - 3,5, Iowa - 3,0, Mississippi - 2,9, Arkansas - 2,8, Kansas - 2,8, Utah - 2,6, Nevada - 2,5, Nové Mexiko - 2,0, Západní Virginie - 1,8, Nebraska - 1,8, Idaho - 1,5, Maine - 1,3, New Hampshire - 1,3, Havaj - 1,3, Rhode Island - 1,1, Montana - 0,9, Delaware - 0,9, Jižní Dakota - 0,8, Aljaška - 0,7, Severní Dakota - 0,6, Vermont -. 6, Wyoming - 0,5

Například, pokud víme, že máme průměr 10, režim 4, jaký je medián našeho souboru údajů? Protože střední - režim = 3 (střední - střední), můžeme říci, že 10 - 4 = 3 (10 - střední). Podle nějaké algebry vidíme, že 2 = (10 - Medián), a tak medián našich dat je 8.

Jak je vidět výše, výše není přesný vztah. Místo toho je to dobré pravidlo, podobné pravidlu pravidlo rozsahu, který stanoví přibližné spojení mezi standardní odchylka a rozsah. Průměr, medián a režim nemusí přesně zapadat do výše uvedeného empirického vztahu, ale existuje dobrá šance, že bude přiměřeně blízko.