Voorbeeld van twee steekproeven T-test en betrouwbaarheidsinterval

click fraud protection

Soms is het in statistieken nuttig om uitgewerkte voorbeelden van problemen te zien. Deze voorbeelden kunnen ons helpen bij het oplossen van vergelijkbare problemen. In dit artikel zullen we het proces van het uitvoeren van inferentiële statistieken doorlopen voor een resultaat met betrekking tot twee populatiemiddelen. We zullen niet alleen zien hoe we een hypothesetest over het verschil tussen twee populatiegemiddelden, zullen we ook een Betrouwbaarheidsinterval voor dit verschil. De methoden die we gebruiken worden soms een twee-steekproef-t-test en een twee-steekproef-t-betrouwbaarheidsinterval genoemd.

De verklaring van het probleem

Stel dat we de wiskundige geschiktheid van kinderen op de basisschool willen testen. Een vraag die we kunnen hebben, is of hogere cijfers hogere gemiddelde testscores hebben.

Een eenvoudige willekeurige steekproef van 27 derdeklassers krijgt een wiskundetest, hun antwoorden worden gescoord en de resultaten blijken een gemiddelde score van 75 punten te hebben met een standaarddeviatie van de steekproef van 3 punten.

instagram viewer

Een eenvoudige steekproef van 20 vijfde klassers krijgt dezelfde wiskundetoets en hun antwoorden worden gescoord. De gemiddelde score voor de vijfde klassers is 84 punten met een standaarddeviatie van 5 punten.

Gezien dit scenario stellen we de volgende vragen:

  • Leveren de steekproefgegevens ons het bewijs dat de gemiddelde testscore van de populatie van alle vijfde klassers hoger is dan de gemiddelde testscore van de populatie van alle derde klassers?
  • Wat is een betrouwbaarheidsinterval van 95% voor het verschil in gemiddelde testscores tussen de populaties van derde klassers en vijfde klassers?

Voorwaarden en procedure

We moeten selecteren welke procedure we moeten gebruiken. Daarbij moeten we ervoor zorgen en controleren of aan de voorwaarden voor deze procedure is voldaan. Er wordt ons gevraagd om twee populatiegemiddelden te vergelijken. Een verzameling methoden die hiervoor kan worden gebruikt, zijn die voor t-procedures met twee steekproeven.

Om deze t-procedures voor twee monsters te gebruiken, moeten we ervoor zorgen dat de volgende voorwaarden gelden:

  • We hebben twee eenvoudige willekeurige steekproeven van de twee relevante populaties.
  • Onze eenvoudige steekproeven vormen niet meer dan 5% van de bevolking.
  • De twee voorbeelden zijn onafhankelijk van elkaar en er is geen overeenkomst tussen de onderwerpen.
  • De variabele wordt normaal verdeeld.
  • Zowel het populatiegemiddelde als de standaarddeviatie zijn onbekend voor beide populaties.

We zien dat aan de meeste van deze voorwaarden is voldaan. Er werd ons verteld dat we eenvoudige willekeurige steekproeven hebben. De populaties die we bestuderen zijn groot omdat er miljoenen studenten zijn in deze leerjaren.

De voorwaarde die we niet automatisch kunnen aannemen is als de testscores normaal verdeeld zijn. Aangezien we een voldoende grote steekproefomvang hebben, hebben we door de robuustheid van onze t-procedures niet noodzakelijkerwijs nodig dat de variabele normaal wordt verdeeld.

Aangezien aan de voorwaarden is voldaan, voeren wij een aantal voorlopige berekeningen uit.

Standaardfout

De standaardfout is een schatting van een standaarddeviatie. Voor deze statistiek voegen we de steekproefvariantie van de steekproeven toe en nemen dan de vierkantswortel. Dit geeft de formule:

(s1 2 / n1 + s22 / n2)1/2

Door de bovenstaande waarden te gebruiken, zien we dat de waarde van de standaardfout is

(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583

Graden van vrijheid

We kunnen de conservatieve benadering gebruiken voor onze graden van vrijheid. Dit kan het aantal vrijheidsgraden onderschatten, maar het is veel gemakkelijker te berekenen dan met de formule van Welch. We gebruiken de kleinste van de twee steekproefgroottes en trekken er vervolgens een af ​​van dit aantal.

Voor ons voorbeeld is de kleinste van de twee monsters 20. Dit betekent dat het aantal vrijheidsgraden 20 - 1 = 19 is.

Hypothesetest

We willen de hypothese testen dat leerlingen van het vijfde leerjaar een gemiddelde toetsscore hebben die hoger is dan de gemiddelde score van leerlingen van het derde leerjaar. Laat μ1 zijn de gemiddelde score van de populatie van alle vijfde klassers. Evenzo laten we μ2 zijn de gemiddelde score van de populatie van alle derde klassers.

De hypothesen zijn als volgt:

  • H0: μ1 - μ2 = 0
  • Heen: μ1 - μ2 > 0

De teststatistiek is het verschil tussen de steekproefgemiddelden, die vervolgens wordt gedeeld door de standaardfout. Aangezien we standaarddeviaties van steekproeven gebruiken om de standaarddeviatie van de populatie te schatten, is de teststatistiek van de t-verdeling.

De waarde van de teststatistiek is (84 - 75) /1.2583. Dit is ongeveer 7.15.

We bepalen nu wat de p-waarde is voor deze hypothesetoets. We kijken naar de waarde van de teststatistiek en waar deze zich bevindt op een t-verdeling met 19 vrijheidsgraden. Voor deze distributie hebben we 4,2 x 10-7 als onze p-waarde. (Een manier om dit te bepalen, is door de functie T.VERD.RT in Excel te gebruiken.)

Omdat we zo'n kleine p-waarde hebben, verwerpen we de nulhypothese. De conclusie is dat de gemiddelde testscore voor vijfde klassers hoger is dan de gemiddelde testscore voor derde klassers.

Betrouwbaarheidsinterval

Omdat we hebben vastgesteld dat er een verschil is tussen de gemiddelde scores, bepalen we nu een betrouwbaarheidsinterval voor het verschil tussen deze twee gemiddelden. We hebben al veel van wat we nodig hebben. Het betrouwbaarheidsinterval voor het verschil moet zowel een schatting als een foutmarge hebben.

De schatting voor het verschil tussen twee gemiddelden is eenvoudig te berekenen. We vinden eenvoudig het verschil tussen de steekproefgemiddelden. Dit verschil van het steekproefgemiddelde schat het verschil van het populatiegemiddelde.

Voor onze gegevens is het verschil in steekproefgemiddelden 84 - 75 = 9.

De foutmarge is iets moeilijker te berekenen. Hiervoor moeten we de juiste statistiek vermenigvuldigen met de standaardfout. De statistiek die we nodig hebben, wordt gevonden door een tabel of statistische software te raadplegen.

Opnieuw gebruikmakend van de conservatieve benadering hebben we 19 vrijheidsgraden. Voor een betrouwbaarheidsinterval van 95% zien we dat t* = 2.09. We kunnen de T.INV-functie in Excel om deze waarde te berekenen.

We hebben nu alles in elkaar gezet en zien dat onze foutmarge 2,09 x 1,2583 is, wat ongeveer 2,63 is. Het betrouwbaarheidsinterval is 9 ± 2,63. Het interval is 6,37 tot 11,63 punten op de test die de vijfde en derde klassers hebben gekozen.

instagram story viewer