Hypoteser
I medisinsk forskning er det vanlig å teste hypoteser og beregne p-verdier. Den såkalte nullhypotesen er den hypotesen man ønsker å motbevise. Hvis målet er å vise forskjell mellom to behandlinger, er nullhypotesen at det ikke er forskjell. P-verdien leder enten til å forkaste eller ikke forkaste nullhypotesen.
En relativt vanlig misforståelse er at en høy p-verdi (> 5 %) kan tolkes som et uttrykk for at det ikke er forskjell i effekten av to behandlinger. Det er ikke en korrekt anvendelse av en p-verdi (1), og det er ikke slik man dokumenterer likhet (2).
Dersom man kunne hevde at to behandlinger var like gode, kun basert på en høy p-verdi, ville det innebære at man kunne «dokumentere likhet» ved hjelp av små studier med så få pasienter at det ville være tilnærmet umulig å avdekke forskjell i effekt. At en nullhypotese ikke kan forkastes betyr på ingen måte at man har vist at den er sann.
Når man ønsker å vise at to behandlinger eller behandlingsstrategier har tilnærmet like god effekt, «snur» man i stedet testsituasjonen. Da skal nullhypotesen være at den eksperimentelle behandlingen er dårligere enn standardbehandlingen, mens forskningshypotesen, som ofte kalles alternativ hypotese, er at den eksperimentelle behandlingen er like god som, eller bedre enn standardbehandlingen. I praksis gjør man altså en ensidig test. På engelsk kalles slike studier «non-inferiority studies», og det er tatt til orde for å kalle dem «ikke-underlegenhetsstudier» på norsk (3). I mer tradisjonelle studier der man ønsker å vise effektforskjell, er tommelfingerregelen for øvrig å gjøre en tosidig test.