Co jsou spárovaná data ve statistice?

Spárovaná data ve statistikách, často označovaná jako uspořádané páry, se vztahují ke dvěma proměnným v jednotlivcích populace, které jsou spojeny, aby se určila korelace mezi nimi. Aby bylo možné považovat datový soubor za párovaný, musí být obě tyto datové hodnoty připojeny nebo propojeny navzájem a nesmí být posuzovány samostatně.

Myšlenka spárovaných dat je v kontrastu s obvyklým přiřazením jednoho čísla ke každému datovému bodu jako v jiném kvantitativní data nastavuje, že každý jednotlivý datový bod je spojen se dvěma čísly, což poskytuje graf, který umožňuje statistikům pozorovat vztah mezi těmito proměnnými v populaci.

Tato metoda párovaných dat se používá, když studie doufá, že porovná dvě proměnné u jednotlivců populace, aby vyvodila nějaký druh závěru o pozorované korelaci. Při pozorování těchto datových bodů je důležité pořadí párování, protože první číslo je míra jedné věci, zatímco druhé je míra něčeho úplně jiného.

Příklad spárovaných dat

Chcete-li zobrazit příklad spárovaných dat, předpokládejme, že učitel počítá počet domácích úkolů každého studenta se obrátil na konkrétní jednotku a poté toto číslo spároval s procentem každého studenta na jednotkovém testu. Páry jsou následující:

instagram viewer

  • Jednotlivec, který splnil 10 úkolů, vydělal 95% na svém testu. (10, 95%)
  • Jednotlivec, který splnil 5 úkolů, vydělal 80% ze svého testu. (5, 80%)
  • Jednotlivec, který splnil 9 úkolů, vydělal 85% za svůj test. (9, 85%)
  • Jednotlivec, který splnil 2 úkoly, získal 50% ze svého testu. (2, 50%)
  • Jednotlivec, který splnil 5 úkolů, získal na testu 60%. (5, 60%)
  • Jednotlivec, který splnil 3 úkoly, získal na testu 70%. (3, 70%)

V každé z těchto sad párovaných dat vidíme, že počet přiřazení vždy na prvním místě objednaný pár, zatímco procento vydělané na testu je druhé, jak je vidět v prvním případě (10, 95%).

Statistická analýza těchto údajů by však mohla být použita také pro výpočet průměrného počtu domácí úkoly dokončeny nebo průměrné skóre testu, mohou být další otázky data. V tomto případě chce učitel vědět, zda existuje souvislost mezi počtem domácích úkolů zapnul se a provedl test, a učitel by musel data udržovat v páru, aby na to mohl odpovědět otázka.

Analýza spárovaných dat

statistické techniky z korelace a regrese se používají k analýze párovaných dat, kde korelační koeficient kvantifikuje, jak blízko leží data podél přímky a měří sílu lineárního vztahu.

Regrese se naproti tomu používá pro několik aplikací, včetně určení, která linka se nejlépe hodí pro naši sadu dat. Tento řádek pak lze následně použít k odhadu nebo předpovědi y hodnoty pro hodnoty X které nebyly součástí našeho původního souboru dat.

Existuje speciální typ grafu, který je zvláště vhodný pro spárovaná data zvaná scatterplot. V tomhle typ grafu, jedna souřadná osa představuje jedno množství spárovaných dat, zatímco druhá souřadná osa představuje další množství spárovaných dat.

Rozptyl pro výše uvedená data by měl osu x označovat počet přiřazených obrácených, zatímco osa y by znamenala skóre na jednotkovém testu.