Er zijn veel kansverdelingen die in statistieken worden gebruikt. Bijvoorbeeld de standaard normale verdeling, of belcurve, is waarschijnlijk het meest algemeen erkend. Normale distributies zijn slechts één type distributie. Een zeer bruikbare kansverdeling voor het bestuderen van populatievarianties wordt de F-verdeling genoemd. We zullen verschillende eigenschappen van dit type distributie onderzoeken.
Basiseigenschappen
De kansdichtheidsformule voor de F-verdeling is vrij ingewikkeld. In de praktijk hoeven we ons geen zorgen te maken over deze formule. Het kan echter heel nuttig zijn om enkele details van de eigenschappen met betrekking tot de F-verdeling te kennen. Enkele van de belangrijkste kenmerken van deze distributie worden hieronder opgesomd:
- De F-distributie is een familie van distributies. Dit betekent dat er oneindig veel verschillende F-verdelingen zijn. De specifieke F-verdeling die we gebruiken voor een applicatie hangt af van het aantal graden van vrijheid die onze steekproef heeft. Dit kenmerk van de F-distributie is vergelijkbaar met zowel de t-verdeling en de chikwadraatverdeling.
- De F-verdeling is nul of positief, dus er zijn geen negatieve waarden voor F. Dit kenmerk van de F-verdeling is vergelijkbaar met de chikwadraatverdeling.
- De F-verdeling is scheef naar rechts. Deze kansverdeling is dus niet-symmetrisch. Dit kenmerk van de F-verdeling is vergelijkbaar met de chikwadraatverdeling.
Dit zijn enkele van de belangrijkste en gemakkelijk te herkennen kenmerken. We zullen de vrijheidsgraden nader bekijken.
Graden van vrijheid
Een kenmerk dat wordt gedeeld door chi-kwadraatverdelingen, t-verdelingen en F-verdelingen is dat er echt een oneindige familie is van elk van deze verdelingen. Een bepaalde verdeling wordt onderscheiden door het aantal vrijheidsgraden te kennen. Voor een t distributie, is het aantal vrijheidsgraden één minder dan onze steekproefomvang. Het aantal vrijheidsgraden voor een F-verdeling wordt op een andere manier bepaald dan voor een t-verdeling of zelfs chikwadraatverdeling.
We zullen hieronder precies zien hoe een F-verdeling ontstaat. Voorlopig zullen we alleen genoeg overwegen om het aantal vrijheidsgraden te bepalen. De F-verdeling is afgeleid van een verhouding tussen twee populaties. Er is een steekproef van elk van deze populaties en er zijn dus vrijheidsgraden voor beide steekproeven. In feite trekken we er één af van beide steekproefgroottes om onze twee aantallen vrijheidsgraden te bepalen.
Statistieken van deze populaties combineren in een fractie voor de F-statistiek. Zowel de teller als de noemer hebben vrijheidsgraden. In plaats van deze twee nummers te combineren in een ander nummer, behouden we ze allebei. Daarom vereist het gebruik van een F-verdeeltafel dat we twee verschillende vrijheidsgraden opzoeken.
Gebruik van de F-distributie
De F-verdeling komt voort uit inferentiële statistieken betreffende populatievarianties. Meer specifiek gebruiken we een F-verdeling wanneer we de verhouding van de varianties van twee normaal verdeelde populaties bestuderen.
De F-verdeling wordt niet alleen gebruikt om betrouwbaarheidsintervallen te construeren en hypothesen over populatievarianties te testen. Dit type distributie wordt ook gebruikt in een één-factor variantie-analyse (ANOVA). ANOVA houdt zich bezig met het vergelijken van de variatie tussen verschillende groepen en variatie binnen elke groep. Om dit te bereiken gebruiken we een variantie ratio. Deze variantie-verhouding heeft de F-verdeling. Met een ietwat ingewikkelde formule kunnen we een F-statistiek als teststatistiek berekenen.