Korrelasjon beskriver retningen og styrken på sammenhengen mellom to numeriske variabler, X og Y. Enkel lineær regresjon forutsetter at det finnes en matematisk sammenheng mellom X og Y på formen Y = a + bX som kan brukes til å forutsi verdien av den avhengige variabelen (Y) basert på en kjent verdi av den uavhengige variabelen (X). Begge kvantifiserer retningen og styrken på forholdet mellom to numeriske variabler. Regresjon forsøker å finne ut hvordan X får Y til å endre seg, og resultatene av analysen vil variere hvis X og Y byttes ut. Ved korrelasjon er X- og Y-variablene ombyttbare.


Korrelasjoner og lineær regresjonsanalyse er tilgjengelig for både variabler på hovednivå og serienivå.


Korrelasjon
Korrelasjonsanalyse er en statistisk metode som brukes til å evaluere forholdet mellom to kvantitative, kontinuerlige variabler. En høy korrelasjon betyr at to eller flere variabler har en sterk sammenheng med hverandre, mens en svak korrelasjon betyr at variablene i liten grad henger sammen.
  1. I analysevinduet klikker du på "+ Ny analyse" og velger "Korrelasjoner og lineær regresjon" fra nedtrekksmenyen.
  2. Velg datamodell i "Parametre"-kortet på høyre side. Velg den aktuelle serien fra nedtrekksmenyen hvis du velger å analysere seriedata.
  3. Velg de to numeriske variablene du vil analysere, henholdsvis en X- og en Y-variabel.
  4. Hvis du vil utføre en uavhengig analyse for undergrupper, kan du velge en grupperingsvariabel under "Gruppering".
  5. Åpne kortet "Formatering" på høyre side for å velge om du vil bruke kategoriverdier eller navn, eller om du vil vise diagramforklaringer på figuren (kun et alternativ når gruppering er valgt).
  6. Du kan bruke filtre på datasettet for å analysere undergrupper (valgfritt).
  7. Eksporter resultatene dine (Valgfritt)

Korrelasjonskoeffisienter (Pearsons og Spearmans rank)
Korrelasjon passer ikke til en linje gjennom datapunktene. Korrelasjonskoeffisienten (r) anslår bare i hvilken grad to variabler har en tendens til å endre seg sammen. Korrelasjonskoeffisienten (r) varierer fra -1,0 til 1,0, og jo nærmere r er -1,0 eller 1,0, desto sterkere er sammenhengen mellom variablene. Hvis r er 0, er det ingen sammenheng i det hele tatt. En negativ r-verdi betyr at det er en negativ korrelasjon. 
Mens Pearsons korrelasjonskoeffisient ofte brukes til å evaluere det lineære forholdet mellom to kontinuerlige variabler, er Spearmans rangkorrelasjonskoeffisient basert på rangerte verdier (ordinal variabel). Ta kontakt med din lokale statistiker hvis du er usikker på hvilken korrelasjonstest som passer for din analyse. 
  1. Aktiver vippebryteren du ønsker å bruke på kortet "Parametere".
  2. r- og p-verdien vises under diagrammet.

Lineær regresjon 
I regresjonsanalyse ønsker vi å bestemme forholdet mellom den avhengige variabelen (Y) og den uavhengige variabelen (X) og bruke det til å forutsi noe. Hvis vi for eksempel er interessert i effekten av alder på høyde, kan vi forutsi høyden for en gitt alder ved å tilpasse en regresjonslinje. Analysen består i å tilpasse en passende modell ved hjelp av minste kvadraters metode.
  1. For å utføre lineær regresjon aktiverer du vippebryteren "Lineær regresjon" på kortet "Parametere".
  2. En linje tegnes i plottet, og den lineære regresjonsformelen (Y = a + bX) vises under plottet.