Jo Røislien er professor i medisinsk statistikk ved Det helsevitenskapelige fakultet ved Universitetet i Stavanger, seniorforsker ved Stiftelsen Norsk Luftambulanse og profilert vitenskapsformidler.
Forfatteren har fylt ut ICMJE-skjemaet og oppgir ingen interessekonflikter.
Bennett C, Baird AA, Miller MB et al. Neural Correlates of Interspecies Perspective Taking in the Post-Mortem Atlantic Salmon: An Argument for Multiple Comparisons Correction. Journal of Serendipitous and Unexpected Results 2010; 1: 1–5.
Bennett C, Baird AA, Miller MB et al. Neural Correlates of Interspecies Perspective Taking in the Post-Mortem Atlantic Salmon: An Argument for Multiple Comparisons Correction. http://prefrontal.org/files/posters/Bennett-Salmon-2009.pdf Lest 7.7.2023.
Kommentarer
( 1 )
Dette kommentarfeltet modereres, men kommentarer blir ikke redaksjonelt behandlet ut over å sikre at de følger retningslinjer for vårt kommentarfelt.
Jo Røislien skriver at bildet av den døde laksen viste «tre statistisk signifikante prikker» (1).
Menes at bildet viste tre områder hvor det før og etter stimulering var en forskjell i signalstyrke (longitudinell studie), eller kun en forskjell i signalstyrke mellom forskjellige anatomiske områder (tversnittstudie)? Presiseringen er helt avgjørende for å vurdere dette funnet. I en tversnittstudie kan en forskjell i prikkene vise reelle kjemiske forskjeller, også hos en død laks.
Begrepet «statistisk signifikant» er vanligvis knyttet til en p-verdi. I dette tilfellet synes imidlertid ordet «signifikant» å være knyttet til en t-verdi. T-verdier er en form for kvantifisering av forskjeller, altså et litt komplisert effektestimat som er uavhengig av antall observasjoner. P-verdien derimot, er sterkt avhengig av antallet slik at ubetydelige forskjeller blir signifikante bare antallet observasjoner er stort.
Eva Skovlund skiller mellom p- og t- med følgende formulering: «Skal man vurdere klinisk relevans, gir et effektestimat … mye mer informasjon enn en p-verdi» (2). Videre vurdering av effektestimater krever biologisk og eller medisinsk innsikt.
Om man stiller mange eller kun ett spørsmål vil man kunne få svar som kan klassifiseres som falskt positive. Men skal slike svar undertrykkes med matematiske metoder, eller gis en medisinsk, biologisk vurdering? I denne diskusjonen må en også trekke inn begrunnelser for ikke å utføre korreksjon for multiple spørsmål, for eksempel hvis spørsmålene er velbegrunnede og/eller uavhengige av hverandre. En parameter kan fremtre som et falskt positivt funn i en normalbefolkning, men den kan være biologisk betydningsfull i en undergruppe. Da er det bortkastet om man med matematiske metoder har undertrykket funn.
Uansett, bruk begrepet «statistisk signifikant» konsekvent, eller aller helst; skrot p-verdien (3) og som en konsekvens, begrepet «signifikant»; men, gi oss så mange effektestimater dere har, kanskje vil en eller annen av oss se noe «biologisk signifikant». Eller som det er formulert i Epidemiology (4): «… scientists should not be so reluctant to explore leads that may turn out to be wrong that they penalize themselves by missing possibly important findings”.
Litteratur
1. Røislien J. Statistisk lærdom fra en laks. Tidsskr Nor Legeforen 2023; 143. doi: 10.4045/tidsskr.23.0471
2. Skovlund E. Spør først, regn siden. Tidsskr Nor Legeforen 2013; 133: 10. doi: 10.4045/tidsskr.12.1345
3. Kjærstd HP. Skrot p-verdiene, forskere! Forskerforum 28.5.2018. https://www.forskerforum.no/skrot-p-verdiene-forskere/ Lest 2.10.2023.
4. Rothman KJ. No adjustments are needed for multiple comparisons. Epidemiology 1990; Jan 1(1): 43-6. https://pubmed.ncbi.nlm.nih.gov/2081237/
Denne artikkelen ble publisert for mer enn 12 måneder siden, og vi har derfor stengt for nye kommentarer.
Publisert: 22. september 2023
Utgave 13, 26. september 2023
Tidsskr Nor Legeforen 22. september 2023
Vol. 143.
Får du ikke vist PDF-filen eller vil lagre filen, kan du høyreklikke på PDF-ikonet. Velg «Lagre mål/fil som..» og hent så opp PDF-filen i for eksempel Acrobat Reader.
Jo Røislien skriver at bildet av den døde laksen viste «tre statistisk signifikante prikker» (1).
Menes at bildet viste tre områder hvor det før og etter stimulering var en forskjell i signalstyrke (longitudinell studie), eller kun en forskjell i signalstyrke mellom forskjellige anatomiske områder (tversnittstudie)? Presiseringen er helt avgjørende for å vurdere dette funnet. I en tversnittstudie kan en forskjell i prikkene vise reelle kjemiske forskjeller, også hos en død laks.
Begrepet «statistisk signifikant» er vanligvis knyttet til en p-verdi. I dette tilfellet synes imidlertid ordet «signifikant» å være knyttet til en t-verdi. T-verdier er en form for kvantifisering av forskjeller, altså et litt komplisert effektestimat som er uavhengig av antall observasjoner. P-verdien derimot, er sterkt avhengig av antallet slik at ubetydelige forskjeller blir signifikante bare antallet observasjoner er stort.
Eva Skovlund skiller mellom p- og t- med følgende formulering: «Skal man vurdere klinisk relevans, gir et effektestimat … mye mer informasjon enn en p-verdi» (2). Videre vurdering av effektestimater krever biologisk og eller medisinsk innsikt.
Om man stiller mange eller kun ett spørsmål vil man kunne få svar som kan klassifiseres som falskt positive. Men skal slike svar undertrykkes med matematiske metoder, eller gis en medisinsk, biologisk vurdering? I denne diskusjonen må en også trekke inn begrunnelser for ikke å utføre korreksjon for multiple spørsmål, for eksempel hvis spørsmålene er velbegrunnede og/eller uavhengige av hverandre. En parameter kan fremtre som et falskt positivt funn i en normalbefolkning, men den kan være biologisk betydningsfull i en undergruppe. Da er det bortkastet om man med matematiske metoder har undertrykket funn.
Uansett, bruk begrepet «statistisk signifikant» konsekvent, eller aller helst; skrot p-verdien (3) og som en konsekvens, begrepet «signifikant»; men, gi oss så mange effektestimater dere har, kanskje vil en eller annen av oss se noe «biologisk signifikant». Eller som det er formulert i Epidemiology (4): «… scientists should not be so reluctant to explore leads that may turn out to be wrong that they penalize themselves by missing possibly important findings”.
Litteratur
1. Røislien J. Statistisk lærdom fra en laks. Tidsskr Nor Legeforen 2023; 143. doi: 10.4045/tidsskr.23.0471
2. Skovlund E. Spør først, regn siden. Tidsskr Nor Legeforen 2013; 133: 10. doi: 10.4045/tidsskr.12.1345
3. Kjærstd HP. Skrot p-verdiene, forskere! Forskerforum 28.5.2018. https://www.forskerforum.no/skrot-p-verdiene-forskere/ Lest 2.10.2023.
4. Rothman KJ. No adjustments are needed for multiple comparisons. Epidemiology 1990; Jan 1(1): 43-6. https://pubmed.ncbi.nlm.nih.gov/2081237/