Vele keren politieke peilingen en andere toepassingen van statistieken vermeld hun resultaten met een foutmarge. Het is niet ongewoon om te zien dat in een opiniepeiling wordt gesteld dat er bij een bepaald percentage respondenten steun is voor een issue of kandidaat, plus en min een bepaald percentage. Het is deze plus- en min-term die de foutmarge is. Maar hoe wordt de foutmarge berekend? Voor een eenvoudige willekeurige steekproef van een voldoende grote populatie is de marge of fout eigenlijk slechts een herformulering van de omvang van de steekproef en het niveau van vertrouwen dat wordt gebruikt.
De formule voor de foutmarge
In wat volgt zullen we de formule gebruiken voor de foutmarge. We zullen plannen voor het ergste geval, waarbij we geen idee hebben wat het echte niveau van ondersteuning is van de problemen in onze peiling. Als we enig idee hadden over dit aantal, mogelijk via eerdere polling-gegevens, zouden we een kleinere foutmarge krijgen.
De formule die we zullen gebruiken is: E = zα/2/ (2√ n)
Het niveau van vertrouwen
Het eerste stuk informatie dat we nodig hebben om de foutmarge te berekenen, is om te bepalen welk niveau van vertrouwen we willen. Dit aantal kan elk percentage van minder dan 100% bedragen, maar de meest voorkomende betrouwbaarheidsniveaus zijn 90%, 95% en 99%. Van deze drie wordt het 95% -niveau het meest gebruikt.
Als we het niveau van vertrouwen van één aftrekken, krijgen we de waarde van alpha, geschreven als α, die nodig is voor de formule.
De kritische waarde
De volgende stap bij het berekenen van de marge of fout is het vinden van de juiste kritische waarde. Dit wordt aangegeven met de term zα/2 in de bovenstaande formule. Aangezien we uitgegaan zijn van een eenvoudige willekeurige steekproef van een grote populatie, kunnen we de standaard normale verdeling van z-scores.
Stel dat we werken met een vertrouwensniveau van 95%. We willen de z-score z *waarvoor het gebied tussen -z * en z * 0,95 is. Uit de tabel zien we dat deze kritische waarde 1,96 is.
We hadden de kritische waarde ook op de volgende manier kunnen vinden. Als we denken in termen van α / 2, aangezien α = 1 - 0,95 = 0,05, zien we dat α / 2 = 0,025. We doorzoeken nu de tabel om de te vinden z-score met een oppervlakte van 0,025 aan de rechterkant. We zouden eindigen met dezelfde kritische waarde van 1,96.
Andere niveaus van vertrouwen geven ons verschillende kritische waarden. Hoe groter het vertrouwen, hoe hoger de kritische waarde. De kritische waarde voor een betrouwbaarheidsniveau van 90%, met een overeenkomstige α-waarde van 0,10, is 1,64. De kritische waarde voor een betrouwbaarheidsniveau van 99%, met een overeenkomstige α-waarde van 0,01, is 2,54.
Steekproefomvang
Het enige andere getal dat we nodig hebben om de formule te gebruiken om de te berekenen foutmarge is de steekproefomvang, aangeduid met n in de formule. We nemen dan de vierkantswortel van dit getal.
Vanwege de locatie van dit nummer in de bovenstaande formule, hoe groter de steekproefomvang die we gebruiken, hoe kleiner de foutmarge zal zijn. Grote monsters hebben daarom de voorkeur boven kleinere. Aangezien statistische steekproeven echter middelen van tijd en geld vergen, zijn er beperkingen aan de mate waarin we de steekproefomvang kunnen vergroten. De aanwezigheid van de vierkantswortel in de formule betekent dat het verviervoudigen van de steekproefomvang slechts de helft van de foutmarge zal opleveren.
Een paar voorbeelden
Laten we, om de formule te begrijpen, een paar voorbeelden bekijken.
- Wat is de foutmarge voor een eenvoudige willekeurige steekproef van 900 mensen met een 95%niveau van vertrouwen?
- Door gebruik te maken van de tabel hebben we een kritische waarde van 1,96, en dus is de foutmarge 1,96 / (2 √ 900 = 0,03267, of ongeveer 3,3%.
- Wat is de foutmarge voor een eenvoudige willekeurige steekproef van 1600 mensen met een betrouwbaarheidsniveau van 95%?
- Op hetzelfde niveau van vertrouwen als eerste voorbeeld geeft het vergroten van de steekproefomvang tot 1600 ons een foutmarge van 0,0245 of ongeveer 2,5%.