Lineární regrese je statistický nástroj, který určuje, jak dobře se rovná čára hodí do sady spárovaná data. Rovná čára, která nejlépe odpovídá datům, se nazývá regresní čára nejmenších čtverců. Tento řádek lze použít několika způsoby. Jedním z těchto použití je odhadnout hodnotu proměnné odezvy pro danou hodnotu vysvětlující proměnné. S touto myšlenkou souvisí myšlenka zbytku.
(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)
Pro výpočet zbytku v bodech X = 5, odečteme předpokládanou hodnotu od naší pozorované hodnoty. Od roku y souřadnice našeho datového bodu byla 9, což dává zbytek 9 - 10 = -1.
Existuje několik použití pro zbytky. Jedním z použití je pomoci nám určit, zda máme soubor dat, který má celkový lineární trend, nebo zda bychom měli zvážit jiný model. Důvodem je to, že zbytky pomáhají zesílit jakýkoli nelineární vzorec v našich datech. To, co může být obtížné vidět při pohledu na rozptyl, lze snáze pozorovat zkoumáním zbytků a odpovídajícím zbytkovým grafem.
Dalším důvodem pro zvážení zbytků je kontrola, zda jsou splněny podmínky pro odvození pro lineární regresi. Po ověření lineárního trendu (kontrolou zbytků) zkontrolujeme také rozdělení zbytků. Abychom mohli provádět regresní inference, chceme, aby zbytky kolem naší regresní linie byly přibližně normálně rozděleny. A
histogram nebo stonek zbytků pomůže ověřit, zda byla tato podmínka splněna.