Kaplan Meier brukes ofte i overlevelsesanalyser, der målet er å måle hvor lang tid som går før en gitt hendelse inntreffer. Et typisk eksempel fra medisinsk forskning er å måle hvor stor andel av pasientene som lever i en viss tid etter behandling, f.eks. overlevelsesraten for kreftpasienter. Tidslinjen vises på x-aksen, og overlevelsesfunksjonen vises på y-aksen. Personer som ikke har opplevd hendelsen, blir «sensurert» når det siste observasjonstidspunktet inntreffer, og er dermed ikke «utsatt for risiko» fra dette tidspunktet. Individer der hendelsen inntreffer (f.eks. død), vises ved at kurven avtar.
For å utføre en Kaplan Meier-analyse bør datasettet inneholde en kategorisk variabel som beskriver hendelsen av interesse (f.eks. i live/død), og enten en startdatovariabel og en sluttdatovariabel (anbefalt) eller en numerisk variabel med tiden frem til hendelsen av interesse inntreffer. Denne senere analysen fjerner imidlertid oppføringer med manglende verdi, dvs. der det ikke har skjedd noen hendelse.
- I analysevinduet klikker du på «+ Ny analyse» og velger «Kaplan Meier» fra rullegardinmenyen. Velg «Datamodell»
- I «Parametere»-kortet, og angi varighetsvariabelen eller tidsintervallet. A) Tidsintervall (anbefalt): Velg en startdatovariabel og en sluttdatovariabel, som brukes til å beregne varigheten. Velg deretter tidsenhet (dager, uker osv.) for x-aksen. B) Variabel for varighet: Velg «Varighetsvariabel» hvis du har en numerisk variabel som beskriver tiden til hendelsen.
- Angi hendelsesvariabelen, og velg hvilke verdier som representerer hendelsen(e) du er interessert i, f.eks. død og sykehusinnleggelse (det er mulig å velge flere verdier som representerer en hendelse). Hvis hendelsesdataene har manglende verdier, vil disse bli fjernet fra analysen. Hvis du for eksempel er interessert i «tid til død», må du sørge for at variabelen har «død» og «i live» angitt, ikke bare «død».
- For datamodellen for tidsintervallet velger du om du vil bruke en bestemt sluttdato for sensurering ved å fylle ut «Sensurering av sluttdato» eller definere hvilken variabel som skal brukes til sensurering («Sensurvariabel»). Du finner mer informasjon om sensurering nedenfor.
- Hvis du ønsker å vise separate kurver for ulike grupper i materialet ditt, kan du velge dette under «Grupper». Grupperingsvariabelen kan være kategorisk eller numerisk (uten desimaler). Når du bruker «Enkel serie» som datamodell, kan du velge grupperingsvariabler fra hoved- eller serienivået, og de kan være kategoriske, numeriske (uten desimaler) eller unike.
- I «Formatting»-kortet kan du slå av sensureringsflått, bytte mellom kategoriværdier eller etiketter, og velge om du vil vise diagramtekster på figuren.
- Du kan bruke filter på datasettet for å analysere undergrupper (valgfritt).
- Eksportere resultatene dine (valgfritt)
Konfidensintervaller
Du kan aktivere «Konfidensintervaller»-bryteren nederst på «Parametere»-kortet hvis du vil at 95 % konfidensintervall skal vises i kurven.
Risikotall
Du kan aktivere vippebryteren «Antall i risikosonen» for å vise hvor mange forsøkspersoner som er talt med i nevneren ved ulike tidspunkter. (Forsøkspersoner som har nådd hendelsen det ble stilt spørsmål om, droppet ut eller forsvunnet fra studien av andre grunner (betyr: har ikke flere registrerte hendelser etter dette tidspunktet, men du kjenner ikke forsøkspersonens nåværende status = sensurerte data), regnes ikke som «i risikosonen»). Antall i risikosonen og tidspunkter vises under kurven.
Log-rank-test
Log-rank-testen er en hypotesetest som sammenligner overlevelsessannsynlighetene mellom to grupper. Testen er bare tilgjengelig når du har valgt en kategorisk variabel med to verdier (to grupper) i Kaplan Meier-oppsettet. Hvis du vil sammenligne to grupper innenfor en variabel som inneholder mer enn to verdier, må du bruke filterfunksjonen og bare velge de to verdiene (gruppene) du vil sammenligne (Legg til «Filter for analyse»). Den beregnede p-verdien beskriver sannsynligheten for at forskjellen mellom de to gruppenes overlevelsesrater er sammenfallende, gitt at nullhypotesen er at det ikke er noen forskjell mellom gruppene.
Aktiver vippebryteren ved siden av «Log-rank test» i «Parameters»-kortet. Resultatet vises under figuren.
Sensurering
Hvis sluttdatoen mangler for tidsintervallmodellen, kan ikke varigheten mellom start- og sluttdato beregnes. Derfor er det mulig å velge en «Sensurvariabel» eller en «Sensurering av sluttdato»-verdi. Dette eksemplet forklarer hvordan det fungerer.
Eksempel:

Startdato = Dato for operasjon
Sluttdato = Dato for reinnleggelse
Sensurvariabel = Dato for siste oppfølging Sensurering av sluttdato (dette er en verdi, ikke en variabel) = Studiens slutt
Pasient 1: Startdato og sluttdato er fylt ut. Denne pasienten vil ikke bli sensurert.
Pasient 2: Startdato er fylt ut, men sluttdato mangler. Sensurvariabelen («Dato for siste oppfølging») er imidlertid fylt ut, så denne pasienten vil ikke bli sensurert.
Pasient 3: Startdato er fylt ut, men både sluttdato og sensurvariabel mangler. Vi har imidlertid definert en sluttdato for sensurering («End of study»), så denne pasienten vil ikke bli sensurert hvis denne verdien fylles ut i Ledidi.
Pasient 4: Kun startdato er fylt ut, men alle andre variabler er tomme, og det er ikke definert noen sluttdato for sensurering. Denne pasienten vil bli sensurert.
Det er derfor viktig å bruke en sensureringsvariabel eller angi sensurdata for oppføringer der hendelsen ikke inntraff (ettersom «sluttdato»-variabelen ofte vil være tom i dette tilfellet). Ellers vil ikke analysen være i stand til å sensurere disse personene på riktig måte.