De formule voor Chi-Square-statistiek

De chi-kwadraat-statistiek meet het verschil tussen werkelijke en verwachte tellingen in een statistisch experiment. Deze experimenten kunnen variëren van bidirectionele tabellen tot multinomiaal experimenten. De werkelijke tellingen zijn afkomstig van waarnemingen, de verwachte tellingen worden meestal bepaald op basis van probabilistisch of andere wiskundige modellen.

In de bovenstaande formule kijken we naar n paren van verwachte en waargenomen tellingen. Het symbool ek geeft de verwachte tellingen aan, en fk geeft de waargenomen tellingen aan. Om de statistiek te berekenen, doen we de volgende stappen:

Het resultaat van dit proces is niet negatief echt nummer dat vertelt ons hoeveel verschillend de werkelijke en verwachte tellingen zijn. Als we dat berekenen χ2 = 0, dan geeft dit aan dat er geen verschillen zijn tussen onze waargenomen en verwachte tellingen. Aan de andere kant, als χ2 is een zeer groot aantal, dan is er enige onenigheid tussen de werkelijke tellingen en wat er werd verwacht.

instagram viewer

Bereken vervolgens de verschillen voor elk van deze. Omdat we deze getallen uiteindelijk gaan kwadrateren, zullen de negatieve tekens vierkant worden. Vanwege dit feit kunnen de werkelijke en verwachte bedragen van elkaar worden afgetrokken in een van de twee mogelijke opties. We blijven consistent met onze formule en dus trekken we de waargenomen tellingen af ​​van de verwachte: