Hoe betrouwbaarheidsintervallen worden gebruikt om verschillende parameters te berekenen

Inferentiële statistieken dankt zijn naam aan wat er gebeurt in deze tak van statistiek. In plaats van een verzameling gegevens te beschrijven, trachten inferentiële statistieken iets over een populatie af te leiden op basis van een statistische steekproef. Een specifiek doel in inferentiële statistieken betreft het bepalen van de waarde van een onbekende populatie parameter. Het bereik van waarden dat we gebruiken om deze parameter te schatten, wordt een betrouwbaarheidsinterval genoemd.

De vorm van een betrouwbaarheidsinterval

Een betrouwbaarheidsinterval bestaat uit twee delen. Het eerste deel is de schatting van de populatieparameter. We krijgen deze schatting door gebruik te maken van een eenvoudige willekeurige steekproef. Uit deze steekproef berekenen we de statistiek die overeenkomt met de parameter die we willen schatten. Als we bijvoorbeeld geïnteresseerd waren in de gemiddelde lengte van alle eerste klas studenten in de Verenigde Staten, zouden we dat doen gebruik een eenvoudige willekeurige steekproef van Amerikaanse eersteklassers, meet ze allemaal en bereken vervolgens de gemiddelde hoogte van onze monster.

instagram viewer

Het tweede deel van een betrouwbaarheidsinterval is de foutmarge. Dit is nodig omdat onze schatting alleen kan verschillen van de werkelijke waarde van de populatieparameter. Om andere potentiële waarden van de parameter mogelijk te maken, moeten we een reeks getallen produceren. De foutmarge doet dit en elk betrouwbaarheidsinterval heeft de volgende vorm:

Schat ± foutmarge

De schatting bevindt zich in het midden van het interval en vervolgens trekken we de foutmarge af van deze schatting en voegen we deze toe om een bereik van waarden voor de parameter te verkrijgen.

Betrouwbaarheidsniveau

Aan elk betrouwbaarheidsinterval is een betrouwbaarheidsniveau verbonden. Dit is een waarschijnlijkheid of percentage dat aangeeft hoeveel zekerheid we moeten toekennen aan ons betrouwbaarheidsinterval. Als alle andere aspecten van een situatie identiek zijn, geldt: hoe hoger het betrouwbaarheidsniveau, hoe groter het betrouwbaarheidsinterval.

Dit niveau van vertrouwen kan leiden tot enige verwarring. Het is geen verklaring over de bemonsteringsprocedure of populatie. In plaats daarvan geeft het een indicatie van het succes van het constructieproces van een betrouwbaarheidsinterval. Zo zullen betrouwbaarheidsintervallen met een vertrouwen van 80 procent op de lange termijn de echte populatieparameter één op de vijf keer missen.

Elk getal van nul tot één kan in theorie worden gebruikt voor een betrouwbaarheidsniveau. In de praktijk zijn 90 procent, 95 procent en 99 procent allemaal gebruikelijke vertrouwensniveaus.

Foutmarge

De foutmarge van een betrouwbaarheidsniveau wordt bepaald door een aantal factoren. We kunnen dit zien door de formule voor foutmarge te onderzoeken. Een foutmarge heeft de vorm:

Foutmarge = (statistiek voor betrouwbaarheidsniveau) * (standaarddeviatie / fout)

De statistiek voor het betrouwbaarheidsniveau hangt af van wat kansverdeling wordt gebruikt en welk niveau van vertrouwen we hebben gekozen. Bijvoorbeeld als Cis ons vertrouwen niveau en we werken met een normale verdeling, vervolgens C is het gebied onder de curve tussen -z^* naar z^*. Dit nummer z^* is het getal in onze formule voor foutmarge.

Standaarddeviatie of standaardfout

De andere term die nodig is in onze foutmarge is de standaarddeviatie of standaardfout. De standaarddeviatie van de distributie waar we mee werken heeft hier de voorkeur. Parameters van de populatie zijn echter meestal onbekend. Dit aantal is meestal niet beschikbaar bij het vormen van betrouwbaarheidsintervallen in de praktijk.

Om met deze onzekerheid om te gaan bij het kennen van de standaarddeviatie, gebruiken we in plaats daarvan de standaardfout. De standaardfout die overeenkomt met een standaarddeviatie is een schatting van deze standaarddeviatie. Wat de standaardfout zo krachtig maakt, is dat deze wordt berekend op basis van de eenvoudige willekeurige steekproef die wordt gebruikt om onze schatting te berekenen. Er is geen extra informatie nodig omdat de steekproef alle schattingen voor ons doet.

Verschillende betrouwbaarheidsintervallen

Er zijn verschillende situaties die vragen om betrouwbaarheidsintervallen. Deze betrouwbaarheidsintervallen worden gebruikt om een aantal verschillende parameters te schatten. Hoewel deze aspecten verschillen, zijn al deze betrouwbaarheidsintervallen verenigd in hetzelfde algemene formaat. Enkele veelvoorkomende betrouwbaarheidsintervallen zijn die voor een populatiegemiddelde, populatievariantie, populatie-aandeel, het verschil tussen twee populatiegemiddelden en het verschil tussen twee populatie-proporties.