De standaardafwijking en het bereik zijn beide maten van de verspreiding van een gegevensset. Elk nummer vertelt ons op zijn eigen manier hoe gespreid de gegevens zijn, omdat ze allebei een maat voor variatie zijn. Hoewel er geen expliciete relatie is tussen de bereik en standaardafwijking, er is een vuistregel dat kan handig zijn om deze twee statistieken te relateren. Deze relatie wordt soms de bereikregel voor standaardafwijking genoemd.
De bereikregel vertelt ons dat de standaardafwijking van een steekproef ongeveer gelijk is aan een vierde van het bereik van de gegevens. Met andere woordens = (Maximum - Minimum) / 4. Dit is een zeer eenvoudige formule om te gebruiken en mag alleen als een zeer ruwe worden gebruikt schatting van de standaardafwijking.
Een voorbeeld
Om een voorbeeld te zien van hoe de bereikregel werkt, zullen we naar het volgende voorbeeld kijken. Stel dat we beginnen met de gegevenswaarden van 12, 12, 14, 15, 16, 18, 18, 20, 20, 25. Deze waarden hebben een gemeen van 17 en een standaarddeviatie van ongeveer 4,1. Als we in plaats daarvan eerst het bereik van onze gegevens berekenen als 25 - 12 = 13 en deel dit getal vervolgens door vier, we hebben onze schatting van de standaarddeviatie als 13/4 = 3,25. Dit aantal ligt relatief dicht bij de werkelijke standaarddeviatie en is goed voor een ruwe schatting.
Waarom werkt het?
Het lijkt misschien dat de bereikregel een beetje vreemd is. Waarom werkt het? Lijkt het niet volkomen willekeurig om het bereik gewoon door vier te delen? Waarom zouden we niet delen door een ander nummer? Er is eigenlijk een wiskundige rechtvaardiging achter de schermen.
Herinner de eigenschappen van de bel curve en de kansen van a standaard normale verdeling. Eén functie heeft te maken met de hoeveelheid gegevens die binnen een bepaald aantal standaardafwijkingen valt:
- Ongeveer 68% van de gegevens valt binnen één standaardafwijking (hoger of lager) van het gemiddelde.
- Ongeveer 95% van de gegevens valt binnen twee standaarddeviaties (hoger of lager) van het gemiddelde.
- Ongeveer 99% ligt binnen drie standaarddeviaties (hoger of lager) van het gemiddelde.
Het aantal dat we zullen gebruiken, heeft te maken met 95%. We kunnen zeggen dat 95% van twee standaardafwijkingen onder het gemiddelde tot twee standaardafwijkingen boven het gemiddelde 95% van onze gegevens hebben. Dus zou bijna al onze normale verdeling zich uitstrekken over een lijnsegment dat in totaal vier standaarddeviaties lang is.
Niet alle gegevens zijn normaal verdeeld en hebben de vorm van een klokkromme. Maar de meeste gegevens gedragen zich goed genoeg om bijna alle gegevens weg te laten als u twee standaarddeviaties verwijdert van het gemiddelde. We schatten en zeggen dat vier standaardafwijkingen ongeveer de grootte van het bereik zijn, en dus is het bereik gedeeld door vier een ruwe benadering van de standaardafwijking.
Gebruikt voor de bereikregel
De bereikregel is nuttig in een aantal instellingen. Ten eerste is het een zeer snelle schatting van de standaardafwijking. De standaardafwijking vereist dat we eerst het gemiddelde vinden en dit gemiddelde vervolgens aftrekken van elk gegevenspunt, vierkant de verschillen, voeg deze toe, deel door een minder dan het aantal gegevenspunten en neem dan (eindelijk) het vierkant wortel. Aan de andere kant vereist de bereikregel slechts één aftrekking en één deling.
Andere plaatsen waar de bereikregel nuttig is, zijn wanneer we onvolledige informatie hebben. Formules zoals die voor het bepalen van de steekproefomvang vereisen drie stukjes informatie: de gewenste foutmarge, de niveau van vertrouwen en de standaarddeviatie van de populatie die we onderzoeken. Vaak is het onmogelijk om te weten wat de bevolking is standaardafwijking is. Met de bereikregel kunnen we deze statistiek schatten en dan weten hoe groot we onze steekproef moeten maken.