In de statistiek en wiskunde is het bereik het verschil tussen de maximale en minimale waarden van een gegevensverzameling en dient het als een van de twee belangrijke kenmerken van een gegevensverzameling. De formule voor een bereik is de maximumwaarde minus de minimumwaarde in de dataset, waardoor statistici beter begrijpen hoe gevarieerd de dataset is.
Twee belangrijke kenmerken van een dataset zijn onder meer het midden van de gegevens en de verspreiding van de gegevens, en dat kan het centrum zijngemeten op een aantal manieren: de meest populaire hiervan zijn de gemiddelde, mediaan-, modus en middenbereik, maar op een vergelijkbare manier zijn er verschillende manieren om te berekenen hoe gespreid de dataset is en de gemakkelijkste en meest grove spreidingsmaat wordt het bereik genoemd.
De berekening van het bereik is heel eenvoudig. We hoeven alleen maar het verschil te vinden tussen de grootste gegevenswaarde in onze set en de kleinste gegevenswaarde. Kort samengevat hebben we de volgende formule: Bereik = Maximale waarde - Minimale waarde. De dataset 4,6,10, 15, 18 heeft bijvoorbeeld een maximum van 18, een minimum van 4 en een bereik van
18-4 = 14.Het bereik is een zeer ruwe meting van de verspreiding van gegevens omdat het extreem gevoelig is voor uitbijters, en als gevolg daarvan zijn er bepaalde beperkingen aan het nut van een echt bereik van een gegevensverzameling voor statistici omdat een enkele gegevenswaarde de waarde van de bereik.
Bekijk bijvoorbeeld de set gegevens 1, 2, 3, 4, 6, 7, 7, 8. De maximumwaarde is 8, het minimum is 1 en het bereik is 7. Overweeg dan dezelfde set gegevens, alleen met de waarde 100 inbegrepen. Het bereik wordt nu 100-1 = 99 waarbij de toevoeging van een enkel extra datapunt de waarde van het bereik sterk beïnvloedde. De standaarddeviatie is een andere spreidingsmaatstaf die minder vatbaar is voor uitbijters, maar het nadeel is dat de berekening van de standaarddeviatie is veel ingewikkelder.
Het assortiment vertelt ons ook niets over de interne kenmerken van onze dataset. We beschouwen bijvoorbeeld de dataset 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 waar het bereik voor deze dataset is 10-1 = 9. Als we dit dan vergelijken met de dataset van 1, 1, 1, 2, 9, 9, 9, 10. Hier is het bereik, wederom, negen, maar voor deze tweede set en in tegenstelling tot de eerste set, zijn de gegevens gegroepeerd rond het minimum en maximum. Andere statistieken, zoals het eerste en het derde kwartiel, zouden moeten worden gebruikt om een deel van deze interne structuur op te sporen.
Het bereik is een goede manier om een zeer basaal begrip te krijgen van hoe gespreid de cijfers in de dataset werkelijk zijn, omdat het gemakkelijk is berekenen omdat het alleen een eenvoudige rekenkundige bewerking vereist, maar er zijn ook een paar andere toepassingen van het bereik van een gegevensverzameling in statistieken.
Het bereik kan ook worden gebruikt om een andere spreidingsmaatstaf te schatten, de standaarddeviatie. In plaats van een vrij ingewikkelde formule te doorlopen om de standaarddeviatie te vinden, kunnen we in plaats daarvan de zogenaamde gebruiken bereikregel. Het bereik is fundamenteel in deze berekening.
Het bereik komt ook voor in a boxplot, of box en snorharen plot. De maximum- en minimumwaarden worden beide grafisch weergegeven aan het einde van de snorharen van de grafiek en de totale lengte van de snorharen en het vak is gelijk aan het bereik.