Frafallsanalyse

    ()

    sporsmal_grey_rgb
    Artikkel

    I de fleste medisinske studier vil det være frafall. Dersom de som faller fra, skiller seg vesentlig fra de som deltar, kan det gå ut over generaliserbarheten av studiens resultater.

    Frafall kan skyldes at ikke alle inviterte deltakere blir med i studien, eller at noen av de inkluderte deltakerne ikke møter opp ved oppfølgingstidspunkt.

    Deskriptiv statistikk

    Deskriptiv statistikk

    I en frafallsanalyse sammenlikner man deltakerne som falt fra studien, med de som ble inkludert i eller fullførte den. La oss se på et eksempel: Helseundersøkelsen i Barne- og ungdomspsykiatrisk klinikk ved St. Olavs hospital (Hel-BUP) er en longitudinell kohortstudie der man inviterte alle pasienter ved poliklinikker og sengeposter ved klinikken i perioden 2009–11. De som ble inkludert, ble igjen invitert til oppfølgingsstudier tre og ni år senere. I alt 1 743 ungdommer var inkluderbare, og av disse var det 717 som samtykket og ble inkludert i studien. Det viste seg at de 717 inkluderte hadde noe høyere alder, med gjennomsnitt 15,66 år (standardavvik 1,65), enn de 1 026 ikke-inkluderte, med gjennomsnitt 15,39 år (standardavvik 1,95). Andel jenter var også høyere, med 54,8 % mot 49,6 % jenter (1).

    P-verdier har liten relevans

    P-verdier har liten relevans

    Mangerud og medarbeidere rapporterte også at disse forskjellene var statistisk signifikante, med p-verdier på hhv. 0,0015 og 0,032 (1). Men det er vanskelig å se at p-verdier i frafallsanalyser kan være relevante, selv om de dessverre ofte etterspørres og rapporteres. Det vil sjelden være av betydning hvorvidt forskjellene er statistisk signifikante. En forskjell på 0,27 år var neppe av praktisk betydning i den nevnte studien, men den ble statistisk høysignifikant grunnet stort antall personer i begge grupper. Tilsvarende kan man i mindre studier se store forskjeller mellom gruppene, uten at de blir statistisk signifikante. Noe som er relevant, er om forskjellen kan anses å ha praktisk betydning. I senere publikasjoner fra Hel-BUP-studien valgte man å bare oppgi deskriptiv statistikk i frafallsanalyser, som i tabell 1, basert på Gårdvik og medarbeidere (2). Dette er i tråd med anbefalingene i «Vancouver-retningslinjene», der man nå legger mindre vekt på p-verdier enn tidligere (3). I en frafallsanalyse er det viktigste å rapportere deskriptiv statistikk separat for deltakere og ikke-deltakere. I tillegg til antall vil dette vanligvis være gjennomsnitt og standardavvik for kontinuerlige data, og antall og andeler for kategoriske data, som i tabell 1.

    Tabell 1

    Frafallsanalyse fra inklusjon til oppfølging tre år senere for Helseundersøkelsen i Barne- og ungdomspsykiatrisk klinikk ved St. Olavs hospital. Fra tabell S1 i Gårdvik og medarbeidere (2). SD = standardavvik.

    Deltakere ved inklusjon (n = 717)

    Deltakere etter tre år (n = 570)

    Ikke-deltakere etter tre år (n = 147)

    Alder i år ved inklusjon, gjennomsnitt (SD)

    15,7 (1,7)

    15,7 (1,7)

    15,5 (1,6)

    Jenter, antall (%)

    393 (54,8)

    324 (56,8)

    69 (46,9)

    Håndtering av manglende data

    Håndtering av manglende data

    I Hel-BUP-studien hadde man fått tillatelse av Regional komite for medisinsk og helsefaglig forskningsetikk til å registrere alder, kjønn og henvisningsgrunn for de som ikke ble inkludert i studien. Dermed kunne man sammenlikne de inkluderte med de ikke-inkluderte. Når slike data er tilgjengelige, kan man også redusere skjevhet ved f.eks. å vekte de etterfølgende analysene. Det er imidlertid mer et unntak enn en regel at man får en slik tillatelse.

    Ofte skyldes frafall at deltakere ikke møter til oppfølgingstidspunkt. Da kan det være aktuelt å inkludere deltakerne som har falt fra, i analysene med tilgjengelige data. Data mangler sjelden helt tilfeldig (4). Ved å inkludere deltakere med delvis manglende data vil man da unngå eller redusere skjevhet som skyldes forskjeller mellom deltakerne og ikke-deltakerne. Dessuten blir den statistiske styrken noe høyere, noe som fører til økt presisjon i resultatene. Dette kan gjøres på ulike måter. I en oppfølgingsstudie kan en lineær blandet effekt-modell være egnet (5). Ellers kan multippel imputering av manglende data være aktuelt (6). I visse tilfeller kan man benytte full-informasjon-sannsynlighetsmaksimeringsmetoden (full information maximum likelihood), men denne er svært beregningsintensiv og ikke alltid mulig (4).

    Oppsummering

    Oppsummering

    En frafallsanalyse bør baseres på deskriptiv statistikk. Deltakere med delvis manglende data kan i visse tilfeller inkluderes i analysen med de dataene som er tilgjengelige.

    Kommentarer  ( 0 )
    PDF
    Skriv ut

    Anbefalte artikler