Excel van Microsoft is handig bij het uitvoeren van basisberekeningen in statistieken. Soms is het handig om alle functies te kennen die beschikbaar zijn om met een bepaald onderwerp te werken. Hier zullen we de functies in Excel bekijken die gerelateerd zijn aan de t-distributie van de student. Naast directe berekeningen met de t-verdeling, kan Excel ook rekenen betrouwbaarheidsintervallen en presteren hypothesetests.
Functies met betrekking tot de T-verdeling
Er zijn verschillende functies in Excel die rechtstreeks werken met de t-distributie. Gegeven een waarde langs de t-verdeling, geven de volgende functies allemaal het deel van de verdeling terug dat zich in de gespecificeerde staart bevindt.
Een deel in de staart kan ook worden geïnterpreteerd als een waarschijnlijkheid. Deze staartkansen kunnen worden gebruikt voor p-waarden in hypothesetests.
- De T.VERD-functie retourneert de linker staart van de t-verdeling van Student. Deze functie kan ook worden gebruikt om de y-waarde voor elk punt langs de dichtheidscurve.
- De T.DIST.RT-functie retourneert de rechter staart van de t-verdeling van Student.
- De T.VERD.2T-functie retourneert beide staarten van Student's t-verdeling.
Deze functies hebben allemaal vergelijkbare argumenten. Deze argumenten zijn, in volgorde:
- De waarde X, wat aangeeft waar langs de X as we zijn langs de distributie
- Het aantal graden van vrijheid.
- De T.VERD-functie heeft een derde argument, waarmee we kunnen kiezen tussen een cumulatieve verdeling (door een 1 in te voeren) of niet (door een 0 in te voeren). Als we een 1 invoeren, retourneert deze functie een p-waarde. Als we een 0 invoeren, retourneert deze functie de y-waarde van de dichtheidscurve voor het gegeven X.
Inverse functies
Alle functies T.DIST, T.DIST.RT en T.DIST.2T delen een gemeenschappelijke eigenschap. We zien hoe al deze functies beginnen met een waarde langs de t-verdeling en dan een deel teruggeven. Er zijn momenten waarop we dit proces willen omkeren. We beginnen met een proportie en willen de waarde van t weten die overeenkomt met deze proportie. In dit geval gebruiken we de juiste inverse functie in Excel.
- De functie T.INV retourneert de linkszijdige inverse van Student's T-verdeling.
- De functie T.INV.2T retourneert de tweezijdige inverse van Student's T-verdeling.
Voor elk van deze functies zijn er twee argumenten. De eerste is de waarschijnlijkheid of het deel van de verdeling. De tweede is het aantal vrijheidsgraden voor de specifieke distributie waar we nieuwsgierig naar zijn.
Voorbeeld van T.INV
We zullen een voorbeeld zien van zowel de T.INV- als de T.INV.2T-functies. Stel dat we werken met een t-verdeling met 12 vrijheidsgraden. Als we het punt langs de verdeling willen weten dat 10% van het gebied onder de curve links van dit punt uitmaakt, dan voeren we = T.INV (0.1,12) in een lege cel in. Excel retourneert de waarde -1.356.
Als we in plaats daarvan de T.INV.2T-functie gebruiken, zien we dat het invoeren van = T.INV.2T (0.1,12) de waarde 1.782 retourneert. Dit betekent dat 10% van het gebied onder de grafiek van de verdelingsfunctie links van -1.782 en rechts van 1.782 is.
Over het algemeen door de symmetrie van de t-verdeling, voor een waarschijnlijkheid P en vrijheidsgraden d we hebben T.INV.2T (P, d) = ABS (T.INV (P/2,d), waarbij ABS de absolute waarde is functie in Excel.
Betrouwbaarheidsintervallen
Een van de onderwerpen over inferentiële statistieken betreft het schatten van een populatieparameter. Deze schatting heeft de vorm van een betrouwbaarheidsinterval. De schatting van een populatiegemiddelde is bijvoorbeeld een steekproefgemiddelde. De schatting heeft ook een foutmarge, die Excel zal berekenen. Voor deze foutmarge moeten we de functie CONFIDENCE.T gebruiken.
De documentatie van Excel zegt dat de functie CONFIDENCE.T het betrouwbaarheidsinterval retourneert met behulp van Student's t-distributie. Deze functie retourneert de foutmarge. De argumenten voor deze functie zijn, in de volgorde waarin ze moeten worden ingevoerd:
- Alpha - dit is de mate van belang. Alpha is ook 1 - C, waarbij C het betrouwbaarheidsniveau aangeeft. Als we bijvoorbeeld 95% vertrouwen willen, moeten we 0,05 invoeren voor alpha.
- Standaarddeviatie - dit is de standaarddeviatie van de steekproef uit onze dataset.
- Grootte van de steekproef.
De formule die Excel gebruikt voor deze berekening is:
M = t*s/ √n
Hier is M voor marge, t* is de kritische waarde die overeenkomt met het niveau van vertrouwen, s is de standaarddeviatie van de steekproef en n is de steekproefomvang.
Voorbeeld van betrouwbaarheidsinterval
Stel dat we een eenvoudige steekproef hebben van 16 koekjes en we wegen ze. We vinden dat hun gemiddelde gewicht 3 gram is met een standaarddeviatie van 0,25 gram. Wat is een betrouwbaarheidsinterval van 90% voor het gemiddelde gewicht van alle cookies van dit merk?
Hier typen we eenvoudig het volgende in een lege cel:
= CONFIDENCE.T (0.1,0.25,16)
Excel retourneert 0,109565647. Dit is de foutmarge. We trekken dit af en voegen dit ook toe aan ons steekproefgemiddelde, en dus is ons betrouwbaarheidsinterval 2,89 gram tot 3,11 gram.
Tests van betekenis
Excel zal ook hypothesetests uitvoeren die gerelateerd zijn aan de t-verdeling. De functie T.TEST retourneert de p-waarde voor verschillende tests van betekenis. De argumenten voor de T.TEST-functie zijn:
- Array 1, die de eerste set voorbeeldgegevens geeft.
- Array 2, die de tweede set voorbeeldgegevens oplevert
- Staarten, waarin we 1 of 2 kunnen invoeren.
- Type - 1 geeft een gepaarde t-test aan, 2 een test met twee steekproeven met dezelfde populatievariantie en 3 een test met twee steekproeven met verschillende populatievarianties.