Het gebruik van statistische tabellen is een veel voorkomend onderwerp in veel statistische cursussen. Hoewel software berekeningen uitvoert, is de vaardigheid om tabellen te lezen nog steeds een belangrijke factor. We zullen zien hoe we een tabel met waarden kunnen gebruiken voor een chi-kwadraatverdeling om een kritische waarde te bepalen. De tafel die we zullen gebruiken is hier gevestigd, maar andere chi-kwadraattafels zijn zo opgesteld dat ze erg op deze lijken.
Kritische waarde
Het gebruik van een chikwadraattabel die we zullen onderzoeken, is om een kritische waarde te bepalen. In beide zijn kritische waarden belangrijk hypothesetests en betrouwbaarheidsintervallen. Voor hypothesetests vertelt een kritische waarde ons de grens van hoe extreem een teststatistiek we nodig hebben om de nulhypothese te verwerpen. Voor betrouwbaarheidsintervallen is een kritische waarde een van de ingrediënten die wordt gebruikt bij de berekening van een foutenmarge.
Om een kritische waarde te bepalen, moeten we drie dingen weten:
- Het aantal vrijheidsgraden
- Het aantal en het type staarten
- Het niveau van betekenis.
Graden van vrijheid
Het eerste punt van belang is het aantal graden van vrijheid. Dit nummer vertelt ons welke van de oneindig veel veel chi-kwadraatverdelingen die we in ons probleem moeten gebruiken. De manier waarop we dit aantal bepalen, hangt af van het precieze probleem dat we gebruiken chikwadraatverdeling met. Drie veel voorkomende voorbeelden volgen.
- Als we een doen goedheid van fit-test, dan is het aantal vrijheidsgraden één minder dan het aantal uitkomsten voor ons model.
- Als we een betrouwbaarheidsinterval voor een populatievariantie, dan is het aantal vrijheidsgraden één minder dan het aantal waarden in onze steekproef.
- Voor een Chi-kwadraat test van de onafhankelijkheid van twee categorische variabelen hebben we een tweerichtings-contingentietabel met r rijen en c kolommen. Het aantal vrijheidsgraden is (r - 1)(c - 1).
In deze tabel komt het aantal vrijheidsgraden overeen met de rij die we zullen gebruiken.
Als de tabel waarmee we werken niet het exacte aantal vrijheidsgraden weergeeft waar ons probleem om vraagt, dan is er een vuistregel die we gebruiken. We ronden het aantal vrijheidsgraden af naar de hoogste ingediende waarde. Stel bijvoorbeeld dat we 59 vrijheidsgraden hebben. Als onze tabel alleen lijnen voor 50 en 60 vrijheidsgraden heeft, gebruiken we de lijn met 50 vrijheidsgraden.
Staarten
Het volgende dat we moeten overwegen, is het aantal en het type staarten dat wordt gebruikt. Een chi-kwadraatverdeling is scheef naar rechts, en daarom worden meestal eenzijdige tests met de juiste staart gebruikt. Als we echter een tweezijdig betrouwbaarheidsinterval berekenen, moeten we een overwegen tweezijdige test met zowel een rechter- als een linkerstaart in onze chikwadraatverdeling.
Niveau van vertrouwen
Het laatste stukje informatie dat we moeten weten, is het niveau van vertrouwen of betekenis. Dit is een waarschijnlijkheid die meestal wordt aangeduid met alpha. Vervolgens moeten we deze waarschijnlijkheid (samen met de informatie over onze staarten) vertalen in de juiste kolom voor gebruik in onze tabel. Vaak hangt deze stap af van hoe onze tafel is opgebouwd.
Voorbeeld
We zullen bijvoorbeeld een goede fit-test overwegen voor een twaalfzijdige dobbelsteen. Onze nulhypothese is dat het waarschijnlijk is dat alle kanten worden opgerold en dat elke zijde dus een kans heeft dat 1/12 wordt gerold. Omdat er 12 resultaten zijn, zijn er 12 -1 = 11 vrijheidsgraden. Dit betekent dat we de rij gemarkeerd met 11 zullen gebruiken voor onze berekeningen.
Een goedheid van fit-test is een eenzijdige test. De staart die we hiervoor gebruiken is de juiste staart. Stel dat het significantieniveau 0,05 = 5% is. Dit is de waarschijnlijkheid in de rechter staart van de verdeling. Onze tabel is ingesteld op waarschijnlijkheid in de linkerstaart. Dus links van onze kritische waarde moet 1 - 0,05 = 0,95 zijn. Dit betekent dat we de kolom gebruiken die overeenkomt met 0,95 en rij 11 om een kritische waarde van 19.675 te geven.
Als de chikwadraat statistiek die we berekenen op basis van onze gegevens groter is dan of gelijk is aan19.675, dan verwerpen we de nulhypothese met een significantie van 5%. Als onze chikwadraat statistiek minder dan 19.675 is, dan wij niet afwijzen de nulhypothese.