Sadržaj
Scatter-dijagram je važan dijagnostički alat u arsenalu statističara, dobiven konstruiranjem grafa s dvije varijable i formuliranjem funkcionalne hipoteze o njenom odnosu. Iz tog razloga, oni su obično dizajnirani prije nego se provede regresijska analiza. Zatim statističar testira hipotezu pomoću regresijske analize i određuje točan znak i veličinu veze. Osim toga, grafikon regresije pomaže identificirati nepodudarne podatke - vrijednosti koje su nenormalno udaljene od većine uzoraka podataka. Uklanjanje nepovezanih podataka poboljšava regresijski model.
smjerovi
Scatter dijagram prikazuje korelaciju između dvije varijable (NA / AbleStock.com / Getty Images)-
Potražite negativan odnos između dviju varijabli u dijagramu raspršenja. Ako niske vrijednosti prve varijable odgovaraju visokim vrijednostima druge varijable, postoji negativna korelacija. U tom slučaju, crta koja prolazi kroz podatke imat će negativan nagib.
-
Pregledajte grafikon za pozitivan odnos između varijabli. Ako niske vrijednosti prve varijable odgovaraju niskim vrijednostima druge varijable, a visoke vrijednosti prve varijable jednako odgovaraju visokim vrijednostima druge, varijable imaju pozitivnu korelaciju. U tom slučaju, crta koja prolazi kroz podatke imat će pozitivan nagib.
-
Pregledajte dijagram raspršenja kako biste utvrdili ne postoji li veza između varijabli. Ako su podaci u grafikonu nasumično raspodijeljeni, bez vidljive veze između varijabli, onda oni nemaju korelaciju, ili malu i statistički neznatnu korelaciju. U ovom slučaju, crta koja prolazi kroz podatke je vodoravna, s nagibom jednakim nuli.
-
Kreirajte regresijski pravac kroz podatke, ispitajte njegov oblik i procijenite prirodu odnosa između dviju varijabli. Ravna se linija interpretira linearnim odnosom, zakrivljeni oblik sugerira kvadratni odnos, a linija koja počinje relativno ravna prije porasta ili pada iznenada se tumači kao eksponencijalni odnos.
-
Potražite nepodudarne podatke u grafikonu. Vrijednosti koje su neuobičajeno daleko od skupa podataka. Odstupanja razlikuju odnos između varijabli. Uklonite ih, ali samo ako njihova prisutnost ne utječe na analizu odnosa između dviju varijabli.