Sklon regresní přímky a korelačního koeficientu

click fraud protection

Mnohokrát ve studiu statistika je důležité propojit různá témata. Uvidíme příklad toho, kdy sklon regresní přímky přímo souvisí s korelační koeficient. Protože tyto pojmy zahrnují přímky, je přirozené položit otázku: "Jak jsou korelační koeficient a nejmenší čtvercová čára příbuzný?"

Nejprve se podíváme na některé pozadí týkající se obou těchto témat.

Podrobnosti týkající se korelace

Je důležité si pamatovat podrobnosti týkající se korelačního koeficientu, který je označen r. Tato statistika se používá, když jsme spárovali kvantitativní data. Z rozptylu spárovaná data, můžeme hledat trendy v celkové distribuci dat. Některá spárovaná data vykazují lineární nebo přímkový vzor. V praxi však data nikdy nespadají přesně podél přímky.

Několik lidí se dívá na to samé bodový diagram párových dat by nesouhlasil, jak blízko bylo tomu, aby ukazoval celkový lineární trend. Nakonec, naše kritéria mohou být poněkud subjektivní. Rozsah, který používáme, může také ovlivnit naše vnímání dat. Z těchto důvodů a více potřebujeme nějaký objektivní opatření, abychom řekli, jak blízko jsou naše spárovaná data lineární. Korelační koeficient to pro nás dosahuje.

instagram viewer

Několik základních faktů o r zahrnout:

  • Hodnota r se pohybuje mezi jakýmkoli skutečným číslem od -1 do 1.
  • Hodnoty r blízko 0 znamená, že mezi daty existuje jen malý nebo žádný lineární vztah.
  • Hodnoty r blízko 1 znamená, že mezi daty existuje pozitivní lineární vztah. To znamená, že jako X to zvyšuje y také se zvyšuje.
  • Hodnoty r blízko -1 znamená, že mezi daty existuje negativní lineární vztah. To znamená, že jako X to zvyšuje y klesá.

Svah nejmenších čtverců

Poslední dvě položky ve výše uvedeném seznamu nás směřují ke svahu nejmenších čtverců, které nejlépe padnou. Připomeňme, že sklon čáry je měření toho, kolik jednotek jde nahoru nebo dolů pro každou jednotku, kterou přesuneme doprava. Někdy se to uvádí jako vzestup linie dělený během nebo změna v y hodnoty děleno změnou v X hodnoty.

Obecně platí, že přímky mají svahy, které jsou kladné, záporné nebo nulové. Pokud bychom měli prozkoumat naše regresní přímky s nejmenším čtvercem a porovnat odpovídající hodnoty r, všimli bychom si, že pokaždé, když naše data mají negativní korelační koeficient, sklon regresní linie je záporný. Podobně pro každý čas, kdy máme kladný korelační koeficient, je sklon regresní linie kladný.

Z tohoto pozorování by mělo být zřejmé, že určitě existuje souvislost mezi znaménkem korelačního koeficientu a sklonem linie nejmenších čtverců. Zbývá vysvětlit, proč je to pravda.

Vzorec pro svah

Důvod souvislosti mezi hodnotou r a sklon linie nejmenších čtverců souvisí s vzorcem, který nám dává sklon této linie. Pro párovaná data (x, y) označujeme standardní odchylka z X data od sX a standardní odchylka y data od sy.

Vzorec pro svah A regresní linie je:

  • a = r (sy/ sX)

Výpočet směrodatné odchylky zahrnuje odebrání kladné druhé odmocniny nezáporného čísla. V důsledku toho musí být obě standardní odchylky ve vzorci pro svah nezáporné. Budeme-li předpokládat, že v našich datech existují určité odchylky, nebudeme moci ignorovat možnost, že některá z těchto směrodatných odchylek je nulová. Znaménko korelačního koeficientu bude proto stejné jako znaménko sklonu regresní linie.

instagram story viewer