Bij de bouw van een histogram, er zijn verschillende stappen die we moeten ondernemen voordat we onze grafiek daadwerkelijk tekenen. Na het opzetten van de klassen die we zullen gebruiken, wijzen we al onze gegevenswaarden toe aan een van deze klassen en tellen vervolgens het aantal gegevenswaarden dat in elke klasse valt en tekenen de hoogten van de balken. Deze hoogtes kunnen worden bepaald op twee verschillende manieren die met elkaar verband houden: frequentie of relatieve frequentie.
De frequentie van een klasse is het aantal hoeveel gegevenswaarden in een bepaalde klasse vallen, waarbij klassen met hogere frequenties hogere balken hebben en klassen met lagere frequenties lagere balken hebben. Aan de andere kant vereist relatieve frequentie één extra stap, omdat het de maat is van welk deel of percentage van de gegevenswaarden in een bepaalde klasse vallen.
Een eenvoudige berekening bepaalt de relatieve frequentie van de frequentie door alle frequenties van de klassen bij elkaar op te tellen en de telling door elke klasse te delen door de som van deze frequenties.
Het verschil tussen frequentie en relatieve frequentie
Om het verschil tussen frequentie en relatieve frequentie te zien, zullen we het volgende voorbeeld beschouwen. Stel dat we kijken naar de geschiedeniscijfers van studenten in de 10e klas en de klassen hebben die overeenkomen met lettercijfers: A, B, C, D, F. Het aantal van elk van deze cijfers geeft ons een frequentie voor elke klas:
- 7 studenten met een F
- 9 studenten met een D
- 18 studenten met een C
- 12 studenten met een B
- 4 studenten met een A
Om de relatieve frequentie voor elke klasse te bepalen, voegen we eerst het totale aantal gegevenspunten toe: 7 + 9 + 18 + 12 + 4 = 50. Vervolgens delen we elke frequentie door deze som 50.
- 0,14 = 14% studenten met een F
- 0,18 = 18% studenten met een D
- 0,36 = 36% studenten met een C
- 0.24 = 24% studenten met een B
- 0,08 = 8% studenten met een A
De initiële gegevensset hierboven met het aantal studenten dat in elke klas valt (lettercijfer) zou zijn indicatief voor de frequentie terwijl het percentage in de tweede dataset de relatieve frequentie van vertegenwoordigt deze cijfers.
Een eenvoudige manier om het verschil tussen frequentie en relatieve frequentie te definiëren, is dat frequentie afhankelijk is van de werkelijke waarden van elke klasse in een statistische gegevensverzameling terwijl de relatieve frequentie deze individuele waarden vergelijkt met de algemene totalen van alle betrokken klassen in een gegevens ingesteld.
Histogrammen
Frequenties of relatieve frequenties kunnen worden gebruikt voor een histogram. Hoewel de getallen langs de verticale as verschillen, blijft de algehele vorm van het histogram ongewijzigd. Dit komt omdat de hoogten ten opzichte van elkaar hetzelfde zijn, of we nu frequenties of relatieve frequenties gebruiken.
Relatieve frequentiehistogrammen zijn belangrijk omdat de hoogten kunnen worden geïnterpreteerd als kansen. Deze kanshistogrammen geven een grafische weergave van a kansverdeling, die kan worden gebruikt om de waarschijnlijkheid van bepaalde resultaten binnen een bepaalde populatie te bepalen.
Histogrammen zijn handige hulpmiddelen om snel trends in populaties te observeren voor statistici, wetgevers en organisatoren van de gemeenschap om te kunnen bepalen wat de beste manier is om de meeste mensen in een gegeven situatie te beïnvloeden bevolking.