Prosess og kobling
Vi søkte utlevering av statistikk fra Kreftregisteret og Reseptregisteret via fellesportalen for datatilgang (helsedata.no). Videre kontaktet de enkelte registrene oss for nødvendige avklaringer.
Prosessen for uthenting og sammenstilling av data var følgende:
1. Kreftregisteret trakk ut studiepopulasjonen (i vårt tilfelle kvinner registrert med brystkreft, C50, i 2017).
2. En preprosessert nøkkelfil med fødselsnummer (kryptert), løpenummer og én individspesifikk registreringsdato ble oversendt til Reseptregisteret.
3. Reseptregisteret trakk ut alle utleverte reseptlegemidler i perioden 1.2.2015–31.12.2019 til studiepopulasjonen fra Kreftregisteret og tilrettela statistikk over antall og andel kvinner med utleveringer av de valgte refusjonskodene (ICD/ICPC). I vårt tilfelle var dette refusjonskoder som indikerer behandling for hhv. hjerte- og karsykdom, diabetes og psykiske lidelser. De utvalgte refusjonskodene ble kvalitetssikret av kliniker. Refusjonskoder ansett som mindre aktuelle, ble utelatt.
4. Statistikken ble fordelt etter hvorvidt aktuell komorbiditet inntraff i periodene 1–364 dager og 365–730 dager før registreringsdato fra Kreftregisteret samt i periodene 1–364 dager og 365–730 dager etter registreringsdato. Et individ ble talt én gang per komorbiditet.
5. Vi fikk utlevert en tabell og oppdaget at tabellen ikke ga innsikt i frekvensen for hver enkelt refusjonskode.
6. Det ble derfor søkt om en tilleggstabell der frekvensen for hver refusjonskode ble oppgitt.
Tabellene vi har fått utlevert (se appendiks), gir en utvidet innsikt sammenlignet med separat innhentede data fra hvert enkelt register. Tabellene gir et grovt bilde av forekomst av komorbiditet indikert via refusjonskoder. I vårt tilfelle mener vi dette gir oss innsikt i en problemstilling som vi kan jobbe videre med i et større prosjekt.
Vi håper dette eksempelet kan være til inspirasjon for andre. Fremgangsmåten er såpass enkel at dette kanskje kan motivere andre til å bruke norske registerdata på en litt lettbeint måte. I lys av at en ny helseanalyseplattform er under utvikling, kan prosjekter som vårt kanskje kunne gjennomføres både raskere og enklere i fremtiden.
I et debattinnlegg i Tidsskriftet beskriver Solli og Halkinrud (1) hvordan data fra flere helseregistre kan benyttes som kilde til statistikk. Som eksempel presenterer forfatterne hvordan de fikk tilgang til statistikk over komorbiditet blant kvinner med brystkreft. Utvalget ble definert i data fra Kreftregisteret (kvinner med brystkreft) mens data fra Reseptregisteret ble benyttet for komorbiditet. Forfatterne fikk utlevert ferdig statistikk (anonyme opplysninger).
Forfatterne har rett i at dette er en metodikk som er lite benyttet, og vi i avdeling helseregistre i Helsedirektoratet er enige i at metoden kunne vært brukt mer. Metoden reduserer behovet for utlevering av personidentifiserbare helsedata, noe som er bra for personvernet. Helseregisterloven åpner for at opplysninger fra ulike helseregistre kan sammenstilles for utarbeidelse og tilgjengeliggjøring av statistikk, dersom statistikken skal brukes innenfor de aktuelle registrenes formål. Behandling av statistikk er ikke regulert av personvernlovgivningen og det skal derfor være enklere å få tilgang til statistikk enn til personidentifiserbare helsedata. Kapasiteten i de aktuelle registermiljøene vil imidlertid, på samme måte som for annen datatilgang, være avgjørende for hvor raskt statistikk kan tilgjengeliggjøres.
Vi mener at data fra Kommunalt pasient- og brukerregister (KPR) og Norsk pasientregister (NPR) ville vært et mer nærliggende valg som kilde til informasjon om komorbiditet i eksempelet til Solli og Halkinrud. Disse registrene dekker til sammen hele den offentlige helsetjenesten i Norge. Registrene forvaltes av Helsedirektoratet, og omfatter informasjon om tilstander pasientene har vært behandlet for (2).
Avdeling helseregistre kobler rutinemessig data fra KPR og NPR og har også tilgang til Folkeregisteret. Hauge og medarbeidere har publisert en artikkel om komorbiditet blant barn innlagt for influensa i perioden 2017-2019 basert på sammensatt statistikk (3). I dette tilfellet ble populasjonen (barn innlagt for influensa) definert i NPR mens informasjon om komorbiditet ble basert på data fra både NPR og KPR.
Metodikken er den samme om data fra flere registre skal kobles. Fødselsnummer krypteres på forskjellige måter i de ulike registrene og alle koblingsprosesser starter med å tilrettelegge nøkkelfiler slik at hver person i utvalget får samme løpenummer uavhengig av datakilde.
Som eksempel på kobling med flere datakilder ble det i pandemiens første fase tilrettelagt statistikk basert på data fra NPR, KPR, Folkeregisteret og Meldesystem for smittsomme sykdommer. Arbeidet resulterte blant annet i tre artikler publisert i Tidsskriftet (4,5,6).
Vi oppfordrer til å vurdere bruk av statistiske data fra helseregistrene til forskning og analyse. Det er positivt at det blir spredt kunnskap om muligheten til å fremstille statistikk basert på data fra flere registre. Vi håper at etableringen av Helsedataservice kan bidra til økt bruk av denne muligheten.
Litteratur
1. Solli O, Halkinrud M. Helsedata – en enkel metode for utvidet innsikt. Tidsskr Nor Legeforen 2021; 14.
2. Bakken IJ, Ariansen AMS, Knudsen GP et al. The Norwegian Patient Registry and the Norwegian Registry for Primary Health Care: Research potential of two nationwide health-care registries. Scand J Public Health 2020; 48: 49–55.
3. Hauge SH, Bakken IJ, de Blasio BF. Risk conditions in children hospitalized with influenza in Norway, 2017-2019. BMC Infect Dis. 2021;21:197.
4. Størdal K, Bakken IJ, Greve-Isdahl M et al. Sars-CoV-2 hos barn og ungdom i Norge: påvist smitte, sykehusinnleggelser og underliggende tilstander. Tidsskr Nor Legeforen 2020; 140.Nystad W, Hjellvik V, Larsen IK et al. Underliggende tilstander hos voksne med covid-19. Tidsskr Nor Legeforen 2020; 140.
5. Gulseth HL, Helland E, Johansen KI et al. Dødsfall etter påvist SARS-CoV-2 i Norge. Tidsskr Nor Legeforen 2020; 140