In inferentiële statistieken, betrouwbaarheidsintervallen voor bevolkingsverhoudingen vertrouw op de standaard normale verdeling om onbekende parameters van een bepaalde populatie te bepalen, gegeven een statistische steekproef van de populatie. Een reden hiervoor is dat voor geschikte steekproefgroottes de standaard normale verdeling doet uitstekend werk bij het schatten van a binominale distributie. Dit is opmerkelijk omdat, hoewel de eerste distributie continu is, de tweede discreet is.
Er zijn een aantal problemen die moeten worden aangepakt bij het construeren van betrouwbaarheidsintervallen voor verhoudingen. Een daarvan betreft een zogenaamd "plus vier" -betrouwbaarheidsinterval, wat resulteert in een bevooroordeelde schatter. Deze schatter van een onbekend populatiepercentage presteert in sommige situaties echter beter dan onbevooroordeelde schatters, vooral die situaties waarin er geen successen of mislukkingen zijn in de gegevens.
In de meeste gevallen is het het beste om een populatie-aandeel te schatten door een overeenkomstige steekproefverhouding te gebruiken. We veronderstellen dat er een populatie is met een onbekende proportie
p van zijn individuen die een bepaald kenmerk bevatten, dan vormen we een eenvoudige willekeurige steekproef van grootte n van deze populatie. Van deze n individuen tellen we het aantal Y die de eigenschap bezitten waar we nieuwsgierig naar zijn. Nu schatten we p met behulp van onze steekproef. De steekproefverhouding J / n is een onbevooroordeelde schatter van p.Wanneer moet u het Plus Four Confidence Interval gebruiken?
Wanneer we een plus vier interval gebruiken, passen we de schatter van aan p. We doen dit door vier toe te voegen aan het totale aantal waarnemingen, en zo de zinsnede 'plus vier' uit te leggen. Deze delen we vervolgens op vier waarnemingen tussen twee hypothetische successen en twee mislukkingen, wat betekent dat we er twee optellen bij het totale aantal successen. Het eindresultaat is dat we elke instantie van vervangen J / n met (Y + 2)/(n + 4), en soms wordt deze breuk aangeduid met p met een tilde erboven.
De steekproefverhouding werkt doorgaans erg goed bij het schatten van een populatie-verhouding. Er zijn echter enkele situaties waarin we onze schatter enigszins moeten aanpassen. Uit de statistische praktijk en de wiskundige theorie blijkt dat de wijziging van het plus vier-interval geschikt is om dit doel te bereiken.
Een situatie die ertoe zou moeten leiden dat we een plus vier interval overwegen, is een scheve steekproef. Omdat het populatiepercentage zo klein of zo groot is, ligt het steekproefpercentage vaak ook heel dicht bij 0 of heel dicht bij 1. In dit soort situaties moeten we een plus vier interval overwegen.
Een andere reden voor het gebruik van een plus vier interval is als we een kleine steekproef hebben. Een plus vier interval in deze situatie geeft een betere schatting voor een populatie-aandeel dan het gebruik van het typische betrouwbaarheidsinterval voor een deel.
Regels voor het gebruik van het Plus Four Confidence Interval
Het plus vier betrouwbaarheidsinterval is een bijna magische manier om inferentiële statistieken nauwkeuriger te berekenen door simpelweg vier denkbeeldige toe te voegen waarnemingen aan een gegeven dataset, twee successen en twee mislukkingen, kan het nauwkeuriger het aandeel van een dataset voorspellen dat past bij de parameters.
Het betrouwbaarheidsinterval plus vier is echter niet altijd van toepassing op elk probleem. Het kan alleen worden gebruikt als het betrouwbaarheidsinterval van een dataset hoger is dan 90% en de steekproefomvang van de populatie minstens 10 is. De dataset kan echter een groot aantal successen en mislukkingen bevatten, hoewel het beter werkt wanneer er geen successen of geen mislukkingen zijn in de gegevens van een bepaalde populatie.
Houd er rekening mee dat in tegenstelling tot de berekeningen van reguliere statistieken, de berekeningen van inferentiële statistieken gebaseerd zijn op een steekproef van gegevens om de meest waarschijnlijke resultaten binnen een populatie te bepalen. Hoewel het plus vier betrouwbaarheidsinterval corrigeert voor een groter foutmargemoet deze marge nog steeds in aanmerking worden genomen om de meest nauwkeurige statistische waarneming te bieden.