Příklad permutačního testu

click fraud protection

Jedna otázka, na kterou je vždy důležité se zeptat statistika je: „Je pozorovaný výsledek pouze náhodou, nebo je to? statisticky významný? “ Jedna třída testy hypotéz, nazývané permutační testy, dovolte nám otestovat tuto otázku. Přehled a kroky takového testu jsou:

  • Rozdělili jsme naše subjekty na kontrolní a experimentální skupinu. Nulová hypotéza je, že mezi těmito dvěma skupinami není žádný rozdíl.
  • Aplikujte ošetření na experimentální skupinu.
  • Změřte odpověď na léčbu
  • Zvažte všechny možné konfigurace experimentální skupiny a pozorovanou odpověď.
  • Vypočtěte p-hodnotu na základě naší pozorované odpovědi ve vztahu ke všem potenciálním experimentálním skupinám.

Toto je obrys permutace. Na úvod tohoto obrysu strávíme čas podrobným zkoumáním propracovaného příkladu takového permutačního testu.

Příklad

Předpokládejme, že studujeme myši. Zajímá nás zejména to, jak rychle myši dokončí bludiště, se kterým se nikdy předtím nesetkaly. Chceme poskytnout důkaz ve prospěch experimentálního ošetření. Cílem je prokázat, že myši ve skupině léčené řeší bludiště rychleji než myši bez léčby.

instagram viewer

Začneme s našimi subjekty: šesti myší. Pro usnadnění budou myši označeny písmeny A, B, C, D, E, F. Tři z těchto myší se náhodně vyberou pro experimentální léčbu a další tři se umístí do kontrolní skupiny, ve které subjekty dostávají placebo.

Dále náhodně vybereme pořadí, ve kterém jsou myši vybrány pro běh bludiště. Bude zaznamenána doba strávená dokončením bludiště pro všechny myši a vypočte se průměr z každé skupiny.

Předpokládejme, že náš náhodný výběr obsahuje myši A, C a E v experimentální skupině, zatímco ostatní myši v placebo kontrolní skupina. Po provedení léčby jsme náhodně vybrali pořadí, ve kterém myši procházejí bludištěm.

Doby běhu pro každou z myší jsou:

  • Myš A spustí závod za 10 sekund
  • Myš B spustí závod za 12 sekund
  • Myš C spustí závod za 9 sekund
  • Myš D spustí závod za 11 sekund
  • Myš E spustí závod za 11 sekund
  • Myš F spustí závod za 13 sekund.

Průměrná doba pro dokončení bludiště u myší v experimentální skupině je 10 sekund. Průměrná doba do dokončení bludiště u kontrolních skupin je 12 sekund.

Můžeme položit pár otázek. Je léčba opravdu důvodem pro rychlejší průměrnou dobu? Nebo jsme měli jen štěstí při výběru kontrolní a experimentální skupiny? Léčba pravděpodobně neměla žádný účinek a my jsme náhodně vybrali pomalejší myši, kterým bylo podáváno placebo, a rychlejší myši, které dostaly léčbu. Na tyto otázky odpoví permutační test.

Hypotézy

Hypotézy našeho permutačního testu jsou:

  • nulová hypotéza je prohlášení o neúčinnosti. Pro tento specifický test máme H0: Mezi léčebnými skupinami není žádný rozdíl. Průměrná doba běhu bludiště pro všechny myši bez léčby je stejná jako průměrná doba pro všechny myši s léčením.
  • Alternativní hypotéza je to, co se snažíme prokázat ve prospěch. V tomto případě bychom měli HA: Průměrná doba pro všechny myši s léčbou bude rychlejší než průměrná doba pro všechny myši bez léčby.

Permutace

Existuje šest myší a v experimentální skupině jsou tři místa. To znamená, že počet možných experimentálních skupin je dán počtem kombinací C (6,3) = 6! / (3! 3!) = 20. Zbývající jednotlivci by byli součástí kontrolní skupiny. Existuje tedy 20 různých způsobů náhodného výběru jednotlivců do našich dvou skupin.

Přiřazení A, C a E experimentální skupině bylo provedeno náhodně. Protože existuje 20 takových konfigurací, má specifická konfigurace s A, C a E v experimentální skupině pravděpodobnost výskytu 1/20 = 5%.

V naší studii musíme určit všech 20 konfigurací experimentální skupiny jednotlivců.

  1. Experimentální skupina: A B C a kontrolní skupina: D E F
  2. Experimentální skupina: A B D a kontrolní skupina: C E F
  3. Experimentální skupina: A B E a kontrolní skupina: C D F
  4. Experimentální skupina: A B F a kontrolní skupina: C D E
  5. Experimentální skupina: A C D a kontrolní skupina: B E F
  6. Experimentální skupina: A C E a kontrolní skupina: B D F
  7. Experimentální skupina: A C F a kontrolní skupina: B D E
  8. Experimentální skupina: A D E a kontrolní skupina: B C F
  9. Experimentální skupina: A D F a kontrolní skupina: B C E
  10. Experimentální skupina: AEF a kontrolní skupina: B C D
  11. Experimentální skupina: B C D a kontrolní skupina: A E F
  12. Experimentální skupina: B C E a kontrolní skupina: A D F
  13. Experimentální skupina: B C F a kontrolní skupina: A D E
  14. Experimentální skupina: B D E a kontrolní skupina: A C F
  15. Experimentální skupina: B D F a kontrolní skupina: A C E
  16. Experimentální skupina: BEF a kontrolní skupina: A C D
  17. Experimentální skupina: C D E a kontrolní skupina: A B F
  18. Experimentální skupina: C D F a kontrolní skupina: A B E
  19. Experimentální skupina: C E F a kontrolní skupina: A B D
  20. Experimentální skupina: D EF a kontrolní skupina: ABB

Poté se podíváme na každou konfiguraci experimentálních a kontrolních skupin. Vypočítáme průměr pro každou z 20 permutací ve výše uvedeném seznamu. Například pro první, A, B a C mají časy 10, 12 a 9, v tomto pořadí. Průměr těchto tří čísel je 10 333. Také v této první permutaci mají D, E a F časy 11, 11 a 13, v tomto pořadí. To má v průměru 11 666.

Po výpočtu průměr každé skupiny, vypočítáme rozdíl mezi těmito prostředky. Každý z následujících odpovídá rozdílu mezi experimentální a kontrolní skupinou, které byly uvedeny výše.

  1. Placebo - Ošetření = 1,333333333 sekund
  2. Placebo - Ošetření = 0 sekund
  3. Placebo - Ošetření = 0 sekund
  4. Placebo - Ošetření = -1,333333333 sekund
  5. Placebo - Ošetření = 2 sekundy
  6. Placebo - Ošetření = 2 sekundy
  7. Placebo - Ošetření = 0,6666666667 sekund
  8. Placebo - Ošetření = 0,6666666667 sekund
  9. Placebo - Ošetření = -0,666666667 sekund
  10. Placebo - Ošetření = -0,666666667 sekund
  11. Placebo - Ošetření = 0,6666666667 sekund
  12. Placebo - Ošetření = 0,6666666667 sekund
  13. Placebo - Ošetření = -0,666666667 sekund
  14. Placebo - Ošetření = -0,666666667 sekund
  15. Placebo - ošetření = -2 sekundy
  16. Placebo - ošetření = -2 sekundy
  17. Placebo - Ošetření = 1,333333333 sekund
  18. Placebo - Ošetření = 0 sekund
  19. Placebo - Ošetření = 0 sekund
  20. Placebo - Ošetření = -1,333333333 sekund

P-hodnota

Nyní řadíme rozdíly mezi prostředky z každé skupiny, které jsme si všimli výše. Zaznamenáváme také procento našich 20 různých konfigurací, které jsou reprezentovány každým rozdílem v prostředcích. Například čtyři z 20 neměly žádný rozdíl mezi prostředky kontrolní a léčené skupiny. To představuje 20% z 20 výše uvedených konfigurací.

  • -2 za 10%
  • -1,33 pro 10%
  • -0,667 pro 20%
  • 0 pro 20%
  • 0,677 pro 20%
  • 1,33 za 10%
  • 2 pro 10%.

Zde porovnáme tento záznam s naším pozorovaným výsledkem. Náš náhodný výběr myší pro léčené a kontrolní skupiny vedl k průměrnému rozdílu 2 sekund. Vidíme také, že tento rozdíl odpovídá 10% všech možných vzorků. Výsledkem je, že pro tuto studii máme a p-hodnota 10%.

instagram story viewer