Artikkel
Tradisjonelle kliniske studier tester én behandling ved én bestemt diagnose. Masterprotokoller benytter i stedet en felles infrastruktur, forsøksplan og protokoll til å studere flere legemidler eller diagnoser i en rekke understudier.
Den tradisjonelle tilnærmingen til legemiddelutvikling er kostbar og utfordrende, og mange aktører ser et behov for å besvare flere forskningsspørsmål raskere og mer effektivt. Såkalte masterprotokoller er et forsøk på å dekke dette behovet (1) . Her benytter man en felles, overordnet protokoll til å forsøke å besvare flere spørsmål. Masterprotokoller kan deles i tre typer: paraply-, kurv- og plattformstudier. Slike studier blir i økende grad benyttet i legemiddelutvikling, spesielt innen onkologi.
Paraply
Paraply
I paraplystudier inkluderer man pasienter med én krefttype, men med ulike genetiske forandringer. Forskjellige behandlinger rettet mot spesifikke endringer testes i hver sin tradisjonelle understudie. Disse understudiene kan være enarmede fase 2-studier eller randomiserte fase 2- eller fase 3-studier som sammenligner aktuell behandling med standardbehandling eller placebo. Den største utfordringen er å inkludere tilstrekkelig mange pasienter i hver av disse understudiene. Et eksempel på en paraplystudie er BATTLE-studien av pasienter med ikke-småcellet lungekreft (2) .
Kurv
Kurv
I kurvstudier tester man et nytt legemiddel på pasienter med forskjellige krefttyper, men med samme mutasjon eller biomarkør. Kurvstudier består ofte av et sett enarmede studier, og den største svakheten er at de sjelden omfatter komparative studier med en kontrollgruppe. Et eksempel er en studie av effekten av vemurafenib på forskjellige krefttyper der alle pasientene har BRAF V600-mutasjon (3) . Slike studier kalles ofte tumoragnostiske, og en viktig antagelse er at molekylær profil faktisk kan erstatte histologisk tumortype.
Plattform
Plattform
Plattformstudier benyttes til å studere effekten av flere forskjellige behandlinger, ofte ved å sammenligne hver av dem med en felles kontrollgruppe. Slike studier kan i prinsippet være evigvarende gjennom at nye behandlingsarmer legges til over tid. De er gjerne fleksible med hensyn til å endre utvalgsstørrelse i en eller flere armer. Behandling med bestemte legemidler kan avsluttes i en eller flere pasientgrupper, enten på grunn av dokumentert effekt eller liten sannsynlighet for å finne effekt, og studiene kalles gjerne adaptive. Planleggingen er som regel basert på komplekse simuleringer for å forstå de statistiske konsekvensene av foreslåtte beslutningsregler og endringer underveis. Det dreier seg både om å sikre at risikoen for falskt positive funn ikke øker, og om å forsøke å unngå systematiske skjevheter (bias).
En skisse av en enkel plattformstudie er vist i figur 1. I virkeligheten kan bildet være mye mer komplekst, for eksempel hvis kontrollbehandlingen endres underveis eller nye pasientgrupper blir inkludert. En plattformstudie som har pågått over lang tid, er I-SPY 2, som inkluderer forskjellige typer neoadjuvant behandling ved lokalavansert brystkreft (4) .
Fordeler og ulemper ved adaptive forsøksplaner
Fordeler og ulemper ved adaptive forsøksplaner
Plattformstudienes styrke er fleksibiliteten, men det er nettopp den som kan gi store metodologiske utfordringer. En av utfordringene er multiple tester som kan lede til økt risiko for falskt positive funn. Et annet problem er knyttet til om sammenligningene man gjør, faktisk er rettferdige (uten bias). Det har vært diskutert om man kan utnytte hele kontrollgruppen, og ikke bare pasienter som behandles samtidig med at en bestemt behandling er under utprøving (se f.eks. behandling 4 i figur 1). Dette ville øke teststyrken, men også lede til risiko for systematiske skjevheter fordi pasienter inkludert tidlig i en studie kan skille seg fra pasienter inkludert på et senere tidspunkt. En studie av molnupiravir ved covid-19 illustrerer at en kontrollgruppe ikke nødvendigvis er stabil over tid (5) . I en planlagt interimanalyse halvveis i studien var det 7,3 % i molnupiravirgruppen og 14,1 % i placebogruppen som ble innlagt eller døde. I perioden etter interimanalysen var de tilsvarende andelene hhv. 6,2 % og 4,7 %. Dette illustrerer risikoen for systematiske skjevheter hvis man benytter kontrollgrupper som ikke sammenfaller i tid med den aktive behandlingen.
Felles infrastruktur er åpenbart en god idé, og godt planlagte masterprotokoller kan vare i mange år og gi valide resultater underveis. Nyvinninger med hensyn til både biomarkører og behandlingsalternativer kan dermed raskt evalueres slik at man kan forsøke å besvare det viktige spørsmålet: Hva er den beste behandlingen for en gitt pasient? Men suksess og troverdige resultater avhenger av at de metodologiske utfordringene håndteres på en god måte.