Voorbeeld van goedheid van fit-test

De Chi-kwadraat goedheid van fit-test is een handig om een te vergelijken theoretisch model geobserveerde gegevens. Deze test is een type van de meer algemene chikwadraat-test. Zoals met elk onderwerp in wiskunde of statistiek, kan het nuttig zijn om een voorbeeld te doorlopen om te begrijpen wat er gebeurt, door een voorbeeld van de chikwadraat goedheid van fit-test.

Overweeg een standaardpakket M & M's van melkchocolade. Er zijn zes verschillende kleuren: rood, oranje, geel, groen, blauw en bruin. Stel dat we nieuwsgierig zijn naar de verdeling van deze kleuren en vragen: komen alle zes kleuren in gelijke mate voor? Dit is het type vraag dat kan worden beantwoord met een goede fit-test.

Instelling

We beginnen met het vaststellen van de instelling en waarom de goedheid van fit-test geschikt is. Onze kleurvariabele is categorisch. Er zijn zes niveaus van deze variabele, die overeenkomen met de zes kleuren die mogelijk zijn. We nemen aan dat de M & M's die we tellen een eenvoudige steekproef zullen zijn van de populatie van alle M & M's.

instagram viewer

Null en alternatieve hypothesen

De nul en alternatieve hypothesen want onze goedheid van fit-test weerspiegelt de veronderstelling die we maken over de bevolking. Omdat we testen of de kleuren in gelijke verhoudingen voorkomen, is onze nulhypothese dat alle kleuren in dezelfde verhoudingen voorkomen. Meer formeel, als p₁ is het bevolkingsaandeel van rood snoep, p₂ is het bevolkingsaandeel van oranje snoepjes, enzovoort, dan is de nulhypothese dat p₁ = p₂ =... = p₆ = 1/6.

De alternatieve hypothese is dat ten minste een van de populaties niet gelijk is aan 1/6.

Werkelijke en verwachte tellingen

De werkelijke tellingen zijn het aantal snoepjes voor elk van de zes kleuren. De verwachte telling verwijst naar wat we zouden verwachten als de nulhypothese waar zou zijn. We zullen laten n wees de grootte van onze steekproef. Het verwachte aantal rode snoepjes is p₁ n of n/6. In feite is voor dit voorbeeld het verwachte aantal snoepjes voor elk van de zes kleuren eenvoudig n keer p_ikof n/6.

Chi-square Statistic for Goodness of Fit

We zullen nu een chikwadraatstatistiek berekenen voor een specifiek voorbeeld. Stel dat we een eenvoudige steekproef van 600 M & M-snoepjes hebben met de volgende verdeling:

212 van de snoepjes zijn blauw.
147 van de snoepjes zijn oranje.
103 van de snoepjes zijn groen.
50 van de snoepjes zijn rood.
46 van de snoepjes zijn geel.
42 van de snoepjes zijn bruin.

Als de nulhypothese waar was, zouden de verwachte tellingen voor elk van deze kleuren (1/6) x 600 = 100 zijn. We gebruiken dit nu in onze berekening van de chikwadraat statistiek.

We berekenen de bijdrage aan onze statistiek uit elk van de kleuren. Elk is van de vorm (werkelijk - verwacht)²/Expected.:

Voor blauw hebben we (212 - 100)²/100 = 125.44
Voor sinaasappel hebben we (147 - 100)²/100 = 22.09
Voor groen hebben we (103 - 100)²/100 = 0.09
Voor rood hebben we (50 - 100)²/100 = 25
Voor geel hebben we (46 - 100)²/100 = 29.16
Voor bruin hebben we (42 - 100)²/100 = 33.64

We tellen dan al deze bijdragen en bepalen dat onze chikwadraat statistiek 125,44 + 22,09 + 0,09 + 25 +29,16 + 33,64 = 235,42 is.

Graden van vrijheid

Het aantal graden van vrijheid want een goedheid van fit-test is gewoon een minder dan het aantal niveaus van onze variabele. Aangezien er zes kleuren waren, hebben we 6 - 1 = 5 vrijheidsgraden.

Chi-kwadraat tabel en P-waarde

De chikwadraat statistiek van 235,42 die we berekenden, komt overeen met een bepaalde locatie op een chikwadraatverdeling met vijf vrijheidsgraden. We hebben nu een nodig p-waarde, om de waarschijnlijkheid te bepalen van het verkrijgen van een teststatistiek die minstens zo extreem is als 235.42, terwijl wordt aangenomen dat de nulhypothese waar is.

Microsoft's Excel kan voor deze berekening worden gebruikt. We vinden dat onze teststatistiek met vijf vrijheidsgraden een p-waarde van 7,29 x 10 heeft^-49. Dit is een extreem kleine p-waarde.

Beslissingsregel

We nemen onze beslissing om de nulhypothese te verwerpen op basis van de grootte van de p-waarde. Omdat we een zeer minuscule p-waarde hebben, verwerpen we de nulhypothese. We concluderen dat M & M's niet gelijk verdeeld zijn over de zes verschillende kleuren. Een vervolganalyse zou kunnen worden gebruikt om een betrouwbaarheidsinterval te bepalen voor het populatiepercentage van één bepaalde kleur.