ukázat směrodatnou odchylku je popisná statistika, která měří šíření kvantitativního souboru dat. Toto číslo může být jakékoli nezáporné reálné číslo. Protože nula je nezáporná reálné čísloZdá se, že stojí za to se zeptat: „Kdy bude standardní směrodatná odchylka rovna nule?“ K tomu dochází ve velmi zvláštním a velmi neobvyklém případě, kdy jsou všechny naše hodnoty dat úplně stejné. Prozkoumáme důvody proč.
Popis standardní odchylky
Dvě důležité otázky, které obvykle chceme na datovou sadu odpovědět, zahrnují:
- Co je středem datového souboru?
- Jak rozložená je sada dat?
Existují různá měření nazývaná popisná statistika, která na tyto otázky odpovídají. Například střed dat, také známý jako průměrný, lze popsat z hlediska průměru, mediánu nebo režimu. Lze použít i jiné statistiky, které jsou méně známé, například midhinge nebo trimean.
Pro šíření našich dat bychom mohli použít rozsah, Rozsah interkvartilní nebo standardní odchylka. Směrodatná odchylka je spárována s průměrem pro kvantifikaci šíření našich dat. Toto číslo pak můžeme použít k porovnání více sad dat. Čím větší je naše standardní odchylka, tím větší je rozpětí.
Intuice
Z tohoto popisu tedy zvažte, co by to znamenalo mít standardní odchylku nula. To by naznačovalo, že v naší sadě dat se vůbec nerozšíří. Všechny jednotlivé hodnoty dat by byly shlukovány dohromady na jednu hodnotu. Protože by naše data mohla mít pouze jednu hodnotu, tato hodnota by představovala průměr našeho vzorku.
V této situaci, kdy jsou všechny naše hodnoty dat stejné, by nedošlo k žádné změně. Intuitivně má smysl, aby standardní odchylka takové datové sady byla nula.
Matematický důkaz
Standardní směrodatná odchylka je definována vzorcem. Jakékoli prohlášení, jako je výše uvedené, by tedy mělo být prokázáno pomocí tohoto vzorce. Začneme datovou sadou, která odpovídá výše uvedenému popisu: všechny hodnoty jsou identické a existují n hodnoty rovné X.
Vypočítáme průměr této sady dat a zjistíme, že je
X = (X + X +... + X)/n = nx/n = X.
Nyní, když vypočítáme jednotlivé odchylky od průměru, vidíme, že všechny tyto odchylky jsou nulové. V důsledku toho se rozptyl i standardní odchylka rovnají nule.
Nezbytné a dostatečné
Vidíme, že pokud datová sada nevykazuje žádnou změnu, pak je její standardní odchylka nulová. Můžeme se zeptat, zda konverzovat tohoto prohlášení je také pravda. Abychom zjistili, zda tomu tak je, použijeme vzorec pro standardní odchylku znovu. Tentokrát však nastavíme směrodatnou odchylku na nulu. Nebudeme dělat žádné předpoklady o našem datovém souboru, ale uvidíme, jaké nastavení s = 0 znamená
Předpokládejme, že směrodatná odchylka sady dat se rovná nule. To by znamenalo, že rozptyl vzorku s2 je rovna nule. Výsledkem je rovnice:
0 = (1/(n - 1)) ∑ (Xi - X )2
Násobíme obě strany rovnice n - 1 a podívejte se, že součet druhých odchylek je roven nule. Protože pracujeme s reálnými čísly, jediným způsobem, jak k tomu dojít, je, aby se každá z hranatých odchylek rovna nule. To znamená, že pro každého i, termín (Xi - X )2 = 0.
Nyní vezmeme druhou odmocninu výše uvedené rovnice a vidíme, že každá odchylka od průměru se musí rovnat nule. Protože pro všechny i,
Xi - X = 0
To znamená, že každá hodnota dat se rovná střední hodnotě. Tento výsledek spolu s výše uvedeným nám umožňuje říci, že standardní směrodatná odchylka souboru dat je nula, a to pouze tehdy, jsou-li všechny jeho hodnoty identické.