Hlavní komponenty a analýza faktorů

click fraud protection

Analýza hlavních složek (PCA) a faktorová analýza (FA) jsou statistické techniky používané pro redukci dat nebo detekci struktury. Tyto dvě metody se aplikují na jednu sadu proměnných, pokud se o ně vědec zajímá zjištění, které proměnné v sadě tvoří koherentní podmnožiny, které jsou relativně nezávislé na jedné další. Proměnné, které jsou ve vzájemném vztahu, ale jsou do značné míry nezávislé na jiných sadách proměnných, jsou sloučeny do faktorů. Tyto faktory vám umožňují kondenzovat počet proměnných ve vaší analýze kombinováním několika proměnných do jednoho faktoru.

Specifické cíle PCA nebo FA jsou shrnout vzorce korelace mezi pozorovanými proměnnými snížit množství pozorovaných proměnných na menší počet faktorů, a regresní rovnice pro základní proces pomocí pozorovaných proměnných nebo pro testování teorie o povaze základních procesů.

Příklad

Řekněme například, že vědec má zájem o studium charakteristik postgraduálních studentů. Výzkumník zkoumá velký vzorek postgraduálních studentů o osobnostních charakteristikách, jako je motivace, intelektuální schopnost, akademická historie, historie rodiny, zdraví, fyzické vlastnosti, atd. Každá z těchto oblastí se měří několika proměnnými. Proměnné se pak zadávají do analýzy jednotlivě a studují se korelace mezi nimi. Analýza odhaluje vzorce korelace mezi proměnnými, o nichž se předpokládá, že odrážejí základní procesy ovlivňující chování absolventů. Například několik proměnných z míry intelektuálních schopností se kombinuje s některými proměnnými z míry vědecké historie a tvoří inteligenci měření faktorů. Podobně se proměnné z míry osobnosti mohou kombinovat s některými proměnnými z motivace a scholastiky historie měří faktor, který měří míru, do jaké student preferuje samostatnou práci - nezávislost faktor.

instagram viewer

Kroky analýzy hlavních součástí a analýzy faktorů

Kroky v analýze hlavních složek a faktorové analýzy zahrnují:

  • Vyberte a změřte sadu proměnných.
  • Připravte korelační matici k provedení PCA nebo FA.
  • Extrahujte sadu faktorů z korelační matice.
  • Určete počet faktorů.
  • V případě potřeby otočte faktory, abyste zvýšili interpretovatelnost.
  • Interpretujte výsledky.
  • Ověřte strukturu faktorů stanovením konstrukční platnosti faktorů.

Rozdíl mezi analýzou hlavních komponent a analýzou faktorů

Analýza hlavních komponent a analýza faktorů jsou podobné, protože oba postupy se používají ke zjednodušení struktury sady proměnných. Analýzy se však liší několika důležitými způsoby:

  • V PCA se komponenty počítají jako lineární kombinace původních proměnných. Ve FA jsou původní proměnné definovány jako lineární kombinace faktorů.
  • V PCA je cílem účtovat co nejvíce z celkového počtu odchylka v proměnných, jak je to možné. Cílem FA je vysvětlit covariance nebo korelace mezi proměnnými.
  • PCA se používá k redukci dat na menší počet součástí. FA se používá k pochopení toho, co je základem dat.

Problémy s analýzou hlavních komponent a analýzou faktorů

Jedním z problémů s PCA a FA je to, že neexistuje žádná proměnná kritéria, podle kterých by bylo možné testovat řešení. V jiných statistických technikách, jako je analýza diskriminačních funkcí, logistická regrese, analýza profilu a multivariační analýza rozptylu, je řešení posuzováno podle toho, jak dobře předpovídá členství ve skupině. V PCA a FA neexistuje žádné externí kritérium, jako je členství ve skupině, vůči kterému se má testovat řešení.

Druhým problémem PCA a FA je to, že po extrakci je k dispozici nekonečný počet rotací, všechny vykazují stejné množství rozptylu v původních datech, ale s faktorem definovaným mírně odlišný. Konečný výběr je ponechán na výzkumníkovi na základě posouzení jeho interpretovatelnosti a vědecké užitečnosti. Vědci se často liší názorem na to, která volba je nejlepší.

Třetím problémem je, že FA se často používá k „záchraně“ špatně koncipovaného výzkumu. Pokud není vhodný nebo použitelný žádný jiný statistický postup, lze údaje analyzovat alespoň faktorem. Mnozí se tak domnívají, že různé formy FA jsou spojeny s nedbalým výzkumem.

instagram story viewer