Utvalg
Hvis vi visste de nøyaktige verdiene til forventningen og spredningen for en normalfordelt klinisk variabel i populasjonen, var «sannheten» funnet. Hvis vi derimot ikke kan si sikkert at «sannheten» er funnet, er det fornuftig å observere og analysere data fra en del av populasjonen. Denne delen av populasjonen er utvalget. Konseptet med at et utvalg kan gi oss informasjon om hele populasjon kan blant annet tilskrives den norske statistikeren og første direktøren i Statistisk sentralbyrå, Anders Nicolai Kjær (1938-1919) (3).
Et utvalg kan være allerede registrerte data. Hvis såkalte registerdata er utvalget, må vi vurdere kritisk om de gir oss valid informasjon om populasjonen vi ønsker å undersøke. Et eksempel er i hvilken grad utvalget av personer i Helseundersøkelsen i Nord-Trøndelag kan gi oss informasjon om populasjoner andre steder. Hvis det ikke finnes allerede registrerte data, må vi observere data fra et nytt utvalg. Da er det viktig å vurdere sannsynligheten for at en observasjon i populasjonen kan bli del av utvalget. Et tilfeldig utvalg betyr at alle i populasjonen har lik sannsynlighet for å bli del av utvalget. Et utvalg kan også være valgt fordi det er lett tilgjengelig. Et typisk eksempel på dette er sykehusbaserte kontrollgrupper. Da er det spesielt viktig å vurdere i hvilken grad det er et tilfeldig utvalg fra populasjonen vi vil undersøke.
Hvis vi skal undersøke effekten av en ny behandling, er det vanlig å ha et forsøksopplegg. Dataene fra forsøksopplegg er observert under kontrollerte forhold, men i hvilken grad kan de generaliseres til en større populasjon? Deltagere i en randomisert legemiddelstudie kan være annerledes enn alle som kommer til å bruke behandlingen (4). Utvalgets egenskaper er meget viktig informasjon, derfor er ofte den første tabellen i en forskningsartikkel beskrivende statistikk av utvalget.
I prinsippet vil et større utvalg inneholde en større del av populasjonen og dermed være mer representativt. Likevel - hvis det er en skjevhet i utvelgelsen, vil ikke denne skjevheten forsvinne ved kun å inkludere flere observasjoner i utvalget. Dette gjelder spesielt hvis populasjonen ikke er en definert avgrenset gruppe med individer.