Vzorkování s nebo bez náhrady

click fraud protection

Statistické vzorkování lze provést mnoha různými způsoby. Kromě metody vzorkování, kterou používáme, existuje ještě jedna otázka týkající se toho, co se konkrétně stane jednotlivci, kterého jsme náhodně vybrali. Tato otázka, která vyvstává při vzorkování, zní: „Poté, co vybereme jednotlivce a zaznamenáme měření atributu, který studujeme, co uděláme s jednotlivcem?“

Existují dvě možnosti:

  • Můžeme nahradit jednotlivce zpět do bazénu, ze kterého odebíráme vzorky.
  • Můžeme se rozhodnout, že jednotlivce nenahradíme.

Můžeme velmi snadno vidět, že to vede ke dvěma odlišným situacím. V první variantě ponechává nahrazení otevřenou možnost, že jedinec je náhodně vybrán podruhé. U druhé možnosti, pokud pracujeme bez náhrady, není možné vybrat stejnou osobu dvakrát. Uvidíme, že tento rozdíl ovlivní výpočet pravděpodobností souvisejících s těmito vzorky.

Vliv na pravděpodobnosti

Chcete-li vidět, jak zacházíme s náhradou ovlivňuje výpočet pravděpodobnosti, zvažte následující příklad otázku. Jaká je pravděpodobnost čerpání dvou es z a standardní balíček karet?

instagram viewer

Tato otázka je dvojznačná. Co se stane, když vytáhneme první kartu? Vložíme to zpět do balíčku nebo ho necháme venku?

Začneme výpočtem pravděpodobnosti s náhradou. K dispozici jsou čtyři esa a celkem 52 karet, takže pravděpodobnost losování jednoho esa je 4/52. Pokud tuto kartu vyměníme a znovu nakreslíme, pak je pravděpodobnost opět 4/52. Tyto události jsou nezávislé, takže vynásobíme pravděpodobnosti (4/52) x (4/52) = 1/169, nebo přibližně 0,592%.

Nyní to porovnáme se stejnou situací, s tou výjimkou, že nevyměníme karty. Pravděpodobnost vylosování esa při prvním losování je stále 4/52. U druhé karty předpokládáme, že eso již bylo nakresleno. Nyní musíme vypočítat podmíněnou pravděpodobnost. Jinými slovy, musíme vědět, jaká je pravděpodobnost losování druhého esa, vzhledem k tomu, že první karta je také eso.

Z celkem 51 karet zbývají tři esa. Podmíněná pravděpodobnost druhého esa po nakreslení esa je tedy 3/51. Pravděpodobnost losování dvou es bez náhrady je (4/52) x (3/51) = 1/221, nebo asi 0,425%.

Přímo z výše uvedeného problému vidíme, že to, co se rozhodneme udělat s náhradou, má vliv na hodnoty pravděpodobností. Tyto hodnoty může významně změnit.

Velikost populace

Existují situace, kdy vzorkování s náhradou nebo bez ní podstatně nemění žádné pravděpodobnosti. Předpokládejme, že náhodně vybíráme dva lidi z města s 50 000 obyvatel, z toho 30 000 z nich jsou ženy.

Pokud vzorkujeme s náhradou, pravděpodobnost výběru ženy při prvním výběru je dána 30000/50000 = 60%. Pravděpodobnost ženy při druhém výběru je stále 60%. Pravděpodobnost, že oba lidé budou ženy, je 0,6 x 0,6 = 0,36.

Pokud vzorkujeme bez náhrady, první pravděpodobnost není ovlivněna. Druhá pravděpodobnost je nyní 29999/49999 = 0,5999919998..., což je extrémně blízko 60%. Pravděpodobnost, že jsou obě ženy, je 0,6 x 0,5999919998 = 0,359995.

Pravděpodobnosti jsou technicky odlišné, jsou však dostatečně blízké, aby byly téměř nerozeznatelné. Z tohoto důvodu mnohokrát, i když vzorkujeme bez náhrady, s výběrem každého jednotlivce zacházíme, jako by byli nezávislí na ostatních jedincích ve vzorku.

Další aplikace

Existují i ​​jiné případy, kdy musíme zvážit, zda je třeba vzorkovat s náhradou nebo bez ní. Příkladem toho je bootstrapping. Tato statistická technika spadá pod záhlaví metody převzorkování.

V bootstrappingu začínáme statistickým vzorkem populace. Poté použijeme počítačový software k výpočtu vzorků bootstrapu. Jinými slovy, počítač se převezme s nahrazením z původního vzorku.

instagram story viewer