Boxplots krijgen hun naam van waar ze op lijken. Ze worden soms box- en whiskerplots genoemd. Dit soort grafieken wordt gebruikt om het bereik weer te geven, mediaan-en kwartielen. Wanneer ze zijn voltooid, bevat een vak het eerste en derde kwartielen. Whiskers gaan van het vak tot de minimum- en maximumwaarden van de gegevens.
De volgende pagina's laten zien hoe u een boxplot maakt voor een set gegevens met minimaal 20, eerste kwartiel 25, mediaan 32, derde kwartiel 35 en maximaal 43.
Trek vijf verticale lijnen boven de getallenlijn, één voor elk van de minimumwaarden, eerste kwartiel, mediaan, derde kwartiel en maximum. Gewoonlijk zijn de lijnen voor het minimum en maximum korter dan de lijnen voor de kwartielen en de mediaan.
Voor onze gegevens is het minimum 20, het eerste kwartiel is 25, de mediaan is 32, het derde kwartiel is 35 en het maximum is 43. De lijnen die overeenkomen met deze waarden zijn hierboven getekend.
Vervolgens tekenen we een doos en gebruiken we enkele lijnen om ons te begeleiden. Het eerste kwartiel bevindt zich aan de linkerkant van onze doos. Het derde kwartiel bevindt zich aan de rechterkant van onze doos. De mediaan valt overal in de doos.
Volgens de definitie van het eerste en derde kwartiel bevindt de helft van alle gegevenswaarden zich in het vak.
Nu zien we hoe een box- en whiskergrafiek het tweede deel van zijn naam krijgt. Snorharen worden getekend om het bereik van de gegevens aan te tonen. Trek een horizontale lijn van de lijn voor het minimum naar de linkerkant van de doos bij het eerste kwartiel. Dit is een van onze snorharen. Trek een tweede horizontale lijn vanaf de rechterkant van het vak bij het derde kwartiel naar de lijn die het maximum van de gegevens vertegenwoordigt. Dit is onze tweede whisker.
Onze box- en whiskergrafiek, of boxplot, is nu compleet. In één oogopslag kunnen we het bereik van de waarden van de gegevens bepalen en de mate waarin alles is samengevoegd. De volgende stap laat zien hoe we twee boxplots kunnen vergelijken en contrasteren.
Box- en snorhaargrafieken geven de samenvatting van vijf cijfers van een set gegevens weer. Twee verschillende gegevenssets kunnen dus worden vergeleken door hun boxplots samen te onderzoeken. Hierboven is een tweede boxplot getekend boven degene die we hebben geconstrueerd.
Er zijn een aantal functies die het vermelden waard zijn. De eerste is dat de mediaan van beide gegevenssets identiek zijn. De verticale lijn in beide vakken bevindt zich op dezelfde plaats op de getallenlijn. Het tweede ding om op te merken over de twee box- en whiskergrafieken is dat de bovenste plot niet zo verspreid is als de onderste. De bovenste doos is kleiner en de snorharen reiken niet zo ver.
Het tekenen van twee boxplots boven dezelfde getallenlijn veronderstelt dat de gegevens achter elke vergelijking verdienen. Het zou geen zin hebben om een boxplot hoogten van derde klassers te vergelijken met gewichten van honden in een lokaal asiel. Hoewel beide gegevens bevatten in de verhouding meetniveau, er is geen reden om de gegevens te vergelijken.
Aan de andere kant zou het logisch zijn om boxplots van hoogten van derde klassers te vergelijken als één plot vertegenwoordigde de gegevens van de jongens in een school, en het andere plot vertegenwoordigde de gegevens van de meisjes in de school.