Een van de doelen van statistieken is om gegevens op een zinvolle manier te ordenen. Tweerichtings tafels zijn een belangrijke manier om een bepaald type te organiseren gepaarde gegevens. Net als bij de constructie van grafieken of tabellen in statistieken, is het erg belangrijk om de soorten variabelen te kennen waarmee we werken. Als we kwantitatieve gegevens hebben, dan is een grafiek zoals een histogram of stengel en blad plot zou gebruikt moeten worden. Als we categorische gegevens hebben, dan een staafdiagram of cirkeldiagram is gepast.
Bij het werken met gepaarde gegevens moeten we voorzichtig zijn. Er bestaat een scatterplot voor gepaarde kwantitatieve gegevens, maar wat voor soort grafiek is er voor gepaarde categorisch gegevens? Wanneer we twee categorische variabelen hebben, moeten we een tweerichtings-tabel gebruiken.
Beschrijving van een bidirectionele tafel
Ten eerste herinneren we ons dat categorische gegevens betrekking hebben op eigenschappen of op categorieën. Het is niet kwantitatief en heeft geen numerieke waarden.
Bij een bidirectionele tabel worden alle waarden of niveaus voor twee categorische variabelen vermeld. Alle waarden voor een van de variabelen staan in een verticale kolom. De waarden voor de andere variabele staan in een horizontale rij. Als de eerste variabele heeft m waarden en de tweede variabele heeft n waarden, dan is er een totaal van mn vermeldingen in de tabel. Elk van deze vermeldingen komt overeen met een bepaalde waarde voor elk van de twee variabelen.
Langs elke rij en langs elke kolom worden de vermeldingen opgeteld. Deze totalen zijn belangrijk bij het bepalen van marginale en voorwaardelijke verdelingen. Deze totalen zijn ook belangrijk wanneer we een chi-kwadraattoets uitvoeren voor onafhankelijkheid.
Voorbeeld van een bidirectionele tafel
We kijken bijvoorbeeld naar een situatie waarin we kijken naar verschillende onderdelen van een statistiekcursus aan een universiteit. We willen een bidirectionele tabel maken om te bepalen welke eventuele verschillen er zijn tussen de mannen en vrouwen in de cursus. Om dit te bereiken, tellen we het aantal van elk lettercijfer dat is verdiend door leden van elk geslacht.
We merken op dat de eerste categorische variabele die van het geslacht is, en dat er twee mogelijke waarden zijn in de studie van mannelijk en vrouwelijk. De tweede categorische variabele is die van letterkwaliteit en er zijn vijf waarden die worden gegeven door A, B, C, D en F. Dit betekent dat we een tweerichtingslijst hebben met 2 x 5 = 10 items, plus een extra rij en een extra kolom die nodig is om de rij- en kolomtotalen te tabelleren.
Uit ons onderzoek blijkt dat:
- 50 mannen verdienden een A, terwijl 60 vrouwen een A verdienden.
- 60 mannen verdienden een B en 80 vrouwen verdienden een B.
- 100 mannen verdienden een C en 50 vrouwen verdienden een C.
- 40 mannen verdienden D en 50 vrouwen verdienden een D.
- 30 mannen verdienden een F en 20 vrouwen verdienden een F.
Deze informatie wordt ingevoerd in de tweerichtingslijst hieronder. Het totaal van elke rij vertelt ons hoeveel van elk soort cijfer is verdiend. De kolomtotalen vertellen ons het aantal mannetjes en het aantal vrouwtjes.
Belang van bidirectionele tabellen
Tweerichtings tabellen helpen bij het ordenen van onze gegevens als we twee categorische variabelen hebben. Deze tabel kan ons helpen bij het vergelijken van twee verschillende groepen in onze gegevens. We kunnen bijvoorbeeld de relatieve prestaties van mannen in de cursus statistieken vergelijken met de prestaties van vrouwen in de cursus.
Volgende stappen
Na het vormen van een bidirectionele tabel, kan de volgende stap zijn om de gegevens statistisch te analyseren. We kunnen ons afvragen of de variabelen in het onderzoek onafhankelijk zijn van elkaar of niet. Om deze vraag te beantwoorden, kunnen we een chi-kwadraattoets gebruiken op de tweezijdige tafel.
Tweerichtingslijst voor cijfers en geslachten
Mannetje | Vrouw | Totaal | |
EEN | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Totaal | 280 | 260 | 540 |