Regressionsanalyse er en af de mest grundlæggende analyseformer i databehandling.
Nogle vil måske lede forgæves efter den statistiske metode variansanalyse. Som det bliver nærmere forklaret i gennemgangen, er variansanalyse imidlertid blot en særlig udgave af regressionsanalyse, hvor nogle af variablene er kategoriale.
I grundformen består metoden i at forsøge at forklare et fænomen (afhængige variabel eller outcome) ud fra en eller flere andre fænomener (uafhængige variable, prædiktorer). De forskellige fænomener måles og man undersøger om der findes en sammenhæng mellem dem, og hvor stor betydning de forskellige prædiktorer har for outcome.
Signifikanstestning bruges til at vurdere om en prædiktor er tilstrækkelig betydningsfuld til at skulle regnes med som vigtig for forståelsen af outcome.
En trinvis gennemgang af regressionsanalyse kan ses her (som ppt-fil)
Regressionsanalyse har som udgangspunkt den forudsætning at prædiktorerne ikke korrelerer indbyrdes med hinanden. Man kan dog medtage samspil mellem prædiktorer i analysen. En anden forudsætning er at variationen i den afhængige variabel, outcome, skal være af samme størrelse for alle steder på måleskalaerne for prædiktorerne (kaldet homoscedasticitet).
Det forudsættes endvidere at prædiktorerne står i samme position i forhold til at forudsige eller bestemme outcome. Dette er anderledes ved pathanalyse, hvor nogle prædiktorer kan være ouctome for andre prædiktorer.
Jan Ivanouw
12. maj 2018