Voor veel statistische inferentieproblemen moeten we het aantal vinden graden van vrijheid. Het aantal vrijheidsgraden selecteert een enkele kansverdeling van oneindig veel. Deze stap is een vaak over het hoofd gezien maar cruciaal detail in zowel de berekening vanbetrouwbaarheidsintervallen en de werking van hypothesetests.
Er is niet één algemene formule voor het aantal vrijheidsgraden. Er zijn echter specifieke formules die voor elk type procedure worden gebruikt in inferentiële statistieken. Met andere woorden, de setting waarin we werken, bepaalt het aantal vrijheidsgraden. Hieronder volgt een gedeeltelijke lijst van enkele van de meest voorkomende gevolgtrekkingen, samen met het aantal vrijheidsgraden dat in elke situatie wordt gebruikt.
Standaard normale verdeling
Procedures met betrekking tot standaard normale distributie worden vermeld voor volledigheid en om enkele misvattingen op te helderen. Deze procedures vereisen niet dat we het aantal vrijheidsgraden bepalen. De reden hiervoor is dat er één standaardnormale verdeling is. Dit soort procedures omvat procedures waarbij een populatiegemiddelde betrokken is wanneer de populatie-standaarddeviatie al bekend is, en ook procedures met betrekking tot populatie-proporties.
Een voorbeeld T-procedures
Soms vereist de statistische praktijk dat we de t-distributie van Student gebruiken. Voor deze procedures, zoals die met een populatiegemiddelde met onbekende populatiestandaarddeviatie, is het aantal vrijheidsgraden één minder dan de steekproefomvang. Dus als de steekproefomvang is n, dan zijn er n - 1 vrijheidsgraden.
T Procedures met gekoppelde gegevens
Vaak is het logisch behandel gegevens als gekoppeld. De koppeling wordt meestal uitgevoerd vanwege een verbinding tussen de eerste en tweede waarde in ons paar. Vaak koppelden we voor en na de metingen. Ons voorbeeld van gepaarde gegevens is niet onafhankelijk; het verschil tussen elk paar is echter onafhankelijk. Dus als de steekproef een totaal heeft van n paren van gegevenspunten (voor een totaal van 2n waarden) dan zijn er n - 1 vrijheidsgraden.
T Procedures voor twee onafhankelijke populaties
Voor dit soort problemen gebruiken we nog steeds een t-verdeling. Deze keer is er een steekproef van al onze populaties. Hoewel het de voorkeur heeft om deze twee monsters van dezelfde grootte te hebben, is dit niet nodig voor onze statistische procedures. We kunnen dus twee monsters van grootte hebben n1 en n2. Er zijn twee manieren om het aantal vrijheidsgraden te bepalen. De nauwkeurigere methode is om de formule van Welch te gebruiken, een rekenkundig omslachtige formule met de steekproefomvang en standaarddeviaties van de steekproef. Een andere benadering, de conservatieve benadering genoemd, kan worden gebruikt om snel de vrijheidsgraden te schatten. Dit is gewoon de kleinste van de twee cijfers n1 - 1 en n2 - 1.
Chi-Square voor onafhankelijkheid
Een gebruik van de chikwadraattoets is om te zien of twee categorische variabelen, elk met verschillende niveaus, onafhankelijkheid vertonen. De informatie over deze variabelen is vastgelegd in een tweezijdige tafel met r rijen en c kolommen. Het aantal vrijheidsgraden is het product (r - 1)(c - 1).
Chi-Square Goodness of Fit
De goede pasvorm van een chi-kwadraat begint met een enkele categorische variabele met een totaal van n niveaus. We testen de hypothese dat deze variabele overeenkomt met een vooraf bepaald model. Het aantal vrijheidsgraden is één minder dan het aantal niveaus. Met andere woorden, er zijn n - 1 vrijheidsgraden.
Een factor ANOVA
Een factor analyse van variantie (ANOVA) stelt ons in staat om vergelijkingen tussen verschillende groepen te maken, waardoor er geen noodzaak is voor meerdere paarsgewijze hypothesetests. Omdat de test vereist dat we zowel de variatie tussen verschillende groepen als de variatie binnen elke groep meten, krijgen we twee vrijheidsgraden. De F-statistiek, die wordt gebruikt voor één factor ANOVA, is een fractie. De teller en de noemer hebben elk vrijheidsgraden. Laat c het aantal groepen zijn en n is het totale aantal gegevenswaarden. Het aantal vrijheidsgraden voor de teller is één minder dan het aantal groepen, of c - 1. Het aantal vrijheidsgraden voor de noemer is het totale aantal gegevenswaarden, verminderd met het aantal groepen, of n - c.
Het is duidelijk te zien dat we heel voorzichtig moeten zijn om te weten met welke gevolgtrekkingsprocedure we werken. Deze kennis zal ons informeren over het juiste aantal vrijheidsgraden.