Hvad betyder det at være repræsentativ, og hvordan finder man frem til en undersøgelses repræsentivitet?
Din undersøgelses repræsentativitet udregnes ved at medtage den statistiske usikkerhed(konfidensniveau), som typisk er på 95%, i din undersøgelse. På et antal af 100 respondenter, vil dervære en fejlmargin (stikprøvefejl) på 10%. Din enkelte respondent er repræsentativ for hele din population (befolkning), med en statistisk usikkerhed på 10%. Hvis dit antal af respondenter i stedet er 400, vil usikkerheden være på 5%.
Vælger du at inkludere flere respondenter i din undersøgelse, vil der være større statistisk sikkerhed. En statistisk grundregel siger, at man skal spørge fire gange antallet af respondenter, for at sikkerheden skal være dobbelt så sikker. Dog vil det ikke være muligt at undgå statistisk usikkerhed, medmindre man spørger alle respondenter i populationen.
Repræsentativitet handler om opstillingen af statistiske kriterier for din undersøgelse. Du bliver som ansvarlig for din undersøgelse, nødt til at acceptere et såkaldt signifikansniveau. Et signifikansniveau angiver om dine resultater kan accepteres som værende ikke tilfældige, og derved understøttende for din hypotese. Grænsen for politiske meningsmålinger er normalt på 5%, mens grænsen for medicinske forsøg og målinger er på 1%.
Det handler om, at være bevidst om en statistisk (u)sikkerhed for sin undersøgelse, men også være klar over, at den enkelte respondent er repræsentativ for undersøgelsens fokus, og ikke indeholder BIAS.
For at være repræsentativ bliver man ofte inddelt i en række kasser som f.eks. alder, etnicitet, nationalitet og identitet.
En anden måde at være repræsentativ på kunne være, hvis du ejer en iPhone telefon, og samtidig spiser havregrød om morgenen. På den måde repræsenterer du et bestemt udsnit af befolkningen som opfylder netop disse kriterier. Det hele afhænger af formålet med din undersøgelse, og din undersøgelses hypotese. Hvis din stikprøve derimod ikke er repræsentativ for din population, indeholder den BIAS (skævhed). Det betyder at din stikprøve og udvalg af respondenter ikke er 100% tilfældig. Det kaldes Stikprøve BIAS. Der findes 4 former for BIAS.
Lad os forestille os, at du laver en undersøgelse af pendlere, og du har besluttet at lave fysiske interviews med respondenter på gaden. Ved kun at undersøge personer du møder på gaden, er du i fare for ikke at ramme en repræsentativ stikprøve for alle pendlere, da personer som kører i bil, eller på cykel måske bliver ekskluderet fra stikprøven. Dette kaldes også stikprøve BIAS.