Chi-Square Goodness of Fit-test

De Chi-kwadraat goedheid van fit-test is een variatie op de meer algemene chikwadraat-test. De instelling voor deze test is een enkele categorische variabele die vele niveaus kan hebben. Vaak zullen we in deze situatie een theoretisch model in gedachten hebben voor een categorische variabele. Door dit model verwachten we dat bepaalde delen van de bevolking in elk van deze niveaus vallen. Een goedheid van fit-test bepaalt hoe goed de verwachte verhoudingen in ons theoretisch model overeenkomen met de realiteit.

We beginnen met een categorische variabele met n niveaus en laat p_ik het aandeel van de bevolking op niveau zijn ik. Ons theoretisch model heeft waarden van q_ik voor elk van de verhoudingen. De verklaring van de nul- en alternatieve hypothesen is als volgt:

Voor een goede fit-test hebben we een theoretisch model voor hoe onze gegevens moeten worden geproportioneerd. We vermenigvuldigen deze verhoudingen eenvoudig met de steekproefomvang n om onze verwachte tellingen te verkrijgen.

De chikwadraat statistiek voor goedheid van fit-test wordt bepaald door het vergelijken van de werkelijke en verwachte tellingen voor elk niveau van onze categorische variabele. De stappen voor het berekenen van de chikwadraat statistiek voor een goede fit-test zijn als volgt:

instagram viewer

Als ons theoretisch model perfect overeenkomt met de waargenomen gegevens, zullen de verwachte tellingen geen enkele afwijking vertonen van de waargenomen tellingen van onze variabele. Dit betekent dat we een chikwadraat statistiek van nul hebben. In elke andere situatie zal de chikwadraat statistiek een positief getal zijn.

De chikwadraatstatistiek die we hebben berekend, komt overeen met een bepaalde locatie op een chikwadraatverdeling met het juiste aantal vrijheidsgraden. De p-waarde bepaalt de waarschijnlijkheid om een extreme teststatistiek te verkrijgen, ervan uitgaande dat de nulhypothese waar is. We kunnen een tabel met waarden gebruiken voor een chikwadraatverdeling om de p-waarde van onze hypothesetest te bepalen. Als we statistische software beschikbaar hebben, kan deze worden gebruikt om een betere schatting van de p-waarde te verkrijgen.

We nemen onze beslissing om de nulhypothese te verwerpen op basis van een vooraf bepaald significantieniveau. Als onze p-waarde kleiner is dan of gelijk is aan dit significantieniveau, dan verwerpen we de nulhypothese. Anders wij niet afwijzen de nulhypothese.