Een inleiding tot de interkwartielafstand

Het interkwartielbereik (IQR) is het verschil tussen het eerste kwartiel en het derde kwartiel. De formule hiervoor is:

IQR = Q3 - Q1

Er zijn veel metingen van de variabiliteit van een set gegevens. Beide bereik en standaardafwijking vertel ons hoe verspreid onze gegevens zijn. Het probleem met deze beschrijvende statistieken is dat ze behoorlijk gevoelig zijn voor uitbijters. Een meting van de verspreiding van een dataset die beter bestand is tegen de aanwezigheid van uitbijters is het interkwartielbereik.

Definitie van interkwartielafstand

Zoals hierboven te zien is, is het interkwartielbereik gebaseerd op de berekening van andere statistieken. Voordat we het interkwartielbereik bepalen, moeten we eerst de waarden van het eerste kwartiel en het derde kwartiel kennen. (Natuurlijk zijn het eerste en derde kwartiel afhankelijk van de waarde van de mediaan).

Zodra we de waarden van het eerste en derde kwartiel hebben bepaald, is het interkwartielbereik heel eenvoudig te berekenen. Alles wat we moeten doen is het eerste kwartiel aftrekken van het derde kwartiel. Dit verklaart het gebruik van de term interkwartielafstand voor deze statistiek.

instagram viewer

Voorbeeld

Om een ​​voorbeeld te zien van de berekening van een interkwartielafstand, zullen we de set gegevens beschouwen: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. De samenvatting van vijf cijfers want deze set gegevens is:

  • Minimaal 2
  • Eerste kwartiel van 3,5
  • Mediaan van 6
  • Derde kwartiel van 8
  • Maximaal 9

We zien dus dat het interkwartielbereik 8 - 3,5 = 4,5 is.

De betekenis van de interkwartielafstand

Het bereik geeft ons een maatstaf voor hoe verspreid onze gehele dataset is. Het interkwartielbereik, dat ons vertelt hoe ver uit elkaar eerste en derde kwartiel zijn, geeft aan hoe verspreid de middelste 50% van onze dataset is.

Weerstand tegen uitbijters

Het belangrijkste voordeel van het gebruik van het interkwartielbereik in plaats van het bereik voor het meten van de spreiding van een dataset, is dat het interkwartielbereik niet gevoelig is voor uitbijters. Om dit te zien, zullen we naar een voorbeeld kijken.

Uit de bovenstaande gegevensset hebben we een interkwartielbereik van 3,5, een bereik van 9-2 = 7 en een standaarddeviatie van 2,34. Als we de hoogste waarde van 9 vervangen door een extreme uitbijter van 100, wordt de standaarddeviatie 27,37 en is het bereik 98. Ook al hebben we vrij drastische verschuivingen van deze waarden, het eerste en derde kwartiel blijven onaangetast en dus verandert het interkwartielbereik niet.

Gebruik van de interkwartielafstand

Behalve dat het een minder gevoelige maatstaf is voor de verspreiding van een dataset, heeft het interkwartielbereik een ander belangrijk gebruik. Vanwege de weerstand tegen uitbijters is het interkwartielbereik nuttig om te identificeren wanneer een waarde een uitbijter is.

De interkwartielafstandsregel is wat ons informeert of we een milde of sterke uitbijter hebben. Om een ​​uitbijter te zoeken, moeten we onder het eerste kwartiel of boven het derde kwartiel kijken. Hoe ver we moeten gaan, hangt af van de waarde van het interkwartielbereik.

instagram story viewer