Wat zijn het eerste en derde kwartiel?

Het eerste en derde kwartiel zijn beschrijvende statistieken die metingen van de positie in een gegevensverzameling zijn. Net zoals de mediaan het midden van een gegevensset aangeeft, markeert het eerste kwartiel het kwart of 25% -punt. Ongeveer 25% van de gegevenswaarden is kleiner dan of gelijk aan het eerste kwartiel. Het derde kwartiel is vergelijkbaar, maar voor de bovenste 25% van de gegevenswaarden. We zullen deze ideeën in wat volgt nader bekijken.

De mediaan

Er zijn verschillende manieren om de centrum van een set gegevens. Het gemiddelde, mediaan, modus en middenbereik hebben allemaal hun voordelen en beperkingen bij het uitdrukken van het midden van de gegevens. Van al deze manieren om het gemiddelde te vinden, is de mediaan- is het best bestand tegen uitbijters. Het markeert het midden van de gegevens in die zin dat de helft van de gegevens kleiner is dan de mediaan.

Het eerste kwartiel

Er is geen reden om te stoppen met het vinden van alleen het midden. Wat als we besloten dit proces voort te zetten? We kunnen de mediaan van de onderste helft van onze gegevens berekenen. De helft van 50% is 25%. Dus de helft van de helft of een kwart van de gegevens zou daaronder liggen. Aangezien we te maken hebben met een kwart van de oorspronkelijke set, wordt deze mediaan van de onderste helft van de gegevens het eerste kwartiel genoemd en wordt aangegeven met

instagram viewer
Q1.

Het derde kwartiel

Er is geen reden waarom we naar de onderste helft van de gegevens hebben gekeken. In plaats daarvan hadden we naar de bovenste helft kunnen kijken en dezelfde stappen als hierboven hebben uitgevoerd. De mediaan van deze helft, die we zullen aanduiden Q3 splitst de dataset ook op in kwartalen. Dit nummer geeft echter het bovenste kwart van de gegevens aan. Driekwart van de gegevens ligt dus onder ons aantal Q3. Dit is waarom we bellen Q3 het derde kwartiel.

Een voorbeeld

Om dit allemaal duidelijk te maken, laten we een voorbeeld bekijken. Het kan nuttig zijn om eerst te bekijken hoe de mediaan van sommige gegevens moet worden berekend. Begin met de volgende dataset:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7, 8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Er zijn in totaal twintig datapunten in de set. We beginnen met het vinden van de mediaan. Aangezien er een even aantal gegevenswaarden is, is de mediaan het gemiddelde van de tiende en elfde waarden. Met andere woorden, de mediaan is:

(7 + 8)/2 = 7.5.

Kijk nu naar de onderste helft van de gegevens. De mediaan van deze helft wordt gevonden tussen de vijfde en zesde waarde van:

1, 2, 2, 3, 4, 6, 6, 7, 7, 7

Het eerste kwartiel is dus gelijk Q1 = (4 + 6)/2 = 5

Om het derde kwartiel te vinden, kijk naar de bovenste helft van de originele dataset. We moeten de mediaan vinden van:

8, 11, 12, 15, 15, 15, 17, 17, 18, 20

Hier is de mediaan (15 + 15) / 2 = 15. Dus het derde kwartiel Q3 = 15.

Interkwartielafstand en samenvatting met vijf cijfers

Kwartielen helpen ons een vollediger beeld te krijgen van onze dataset als geheel. Het eerste en derde kwartiel geven ons informatie over de interne structuur van onze data. De middelste helft van de gegevens valt tussen het eerste en derde kwartiel en is gecentreerd rond de mediaan. Het verschil tussen het eerste en derde kwartiel, de zogenaamde interkwartielbereik, laat zien hoe de gegevens zijn gerangschikt over de mediaan. Een klein interkwartielbereik geeft gegevens aan die klonterig zijn rond de mediaan. Een groter interkwartielbereik laat zien dat de gegevens meer verspreid zijn.

Een meer gedetailleerd beeld van de gegevens kan worden verkregen door de hoogste waarde te kennen, de maximale waarde genoemd, en de laagste waarde, de minimumwaarde. Het minimum, eerste kwartiel, mediaan, derde kwartiel en maximum zijn een set van vijf waarden, de samenvatting van vijf cijfers. Een effectieve manier om deze vijf cijfers weer te geven, wordt a genoemd boxplot of box en whisker-grafiek.

instagram story viewer