In wiskunde en statistiek verwijst het gemiddelde naar de som van een groep waarden gedeeld door n, waar n is het aantal waarden in de groep. Een gemiddelde staat ook bekend als een gemeen.
Zoals de mediaan- en de modus, het gemiddelde is een maat voor de centrale neiging, wat betekent dat het een typische waarde in een bepaalde set weerspiegelt. Gemiddelden worden vrij regelmatig gebruikt om de eindcijfers over een periode of semester te bepalen. Gemiddelden worden ook gebruikt als prestatiemaatstaven. Slaggemiddelden geven bijvoorbeeld aan hoe vaak een honkbalspeler slaat wanneer ze aan het bat zijn. Het benzineverbruik geeft aan hoe ver een voertuig doorgaans zal rijden op een liter brandstof.
In de meest informele zin verwijst gemiddeld naar alles wat als gewoon of typisch wordt beschouwd.
Wiskundig gemiddelde
Een wiskundig gemiddelde wordt berekend door de som van een groep waarden te nemen en deze te delen door het aantal waarden in de groep. Het staat ook bekend als een rekenkundig gemiddelde. (Andere middelen, zoals geometrische en harmonische middelen, worden berekend met behulp van het product en de reciproque waarden van de waarden in plaats van de som.)
Met een kleine set waarden duurt het berekenen van het gemiddelde slechts een paar eenvoudige stappen. Laten we ons bijvoorbeeld voorstellen dat we de gemiddelde leeftijd willen vinden onder een groep van vijf personen. Hun respectievelijke leeftijden zijn 12, 22, 24, 27 en 35. Eerst tellen we deze waarden op om hun som te vinden:
- 12 + 22 + 24 + 27 + 35 = 120
Vervolgens nemen we deze som en delen deze door het aantal waarden (5):
- 120 ÷ 5 = 24
Het resultaat, 24, is de gemiddelde leeftijd van de vijf individuen.
Gemiddelde, mediaan en modus
Het gemiddelde of gemiddelde is niet de enige maatstaf voor centrale neiging, hoewel het een van de meest voorkomende is. De andere veel voorkomende metingen zijn de mediaan en de modus.
De mediaan is de middelste waarde in een bepaalde set of de waarde die de hogere helft van de onderste helft scheidt. In het bovenstaande voorbeeld is de mediane leeftijd van de vijf personen 24, de waarde die tussen de hogere helft (27, 35) en de onderste helft (12, 22) valt. Bij deze dataset zijn de mediaan en het gemiddelde hetzelfde, maar dat is niet altijd het geval. Als de jongste persoon in de groep bijvoorbeeld 7 was in plaats van 12, zou de gemiddelde leeftijd 23 zijn. De mediaan zou echter nog steeds 24 zijn.
Voor statistici kan de mediaan een zeer nuttige maatstaf zijn, vooral wanneer een dataset uitbijters bevat, of waarden die sterk verschillen van de andere waarden in de set. In het bovenstaande voorbeeld zijn alle individuen binnen 25 jaar van elkaar. Maar wat als dat niet zo was? Wat als de oudste persoon 85 was in plaats van 35? Die uitbijter zou de gemiddelde leeftijd op 34 brengen, een waarde die groter is dan 80 procent van de waarden in de set. Vanwege deze uitbijter is het wiskundige gemiddelde niet langer een goede weergave van de leeftijden in de groep. De mediaan van 24 is een veel betere maatstaf.
De modus is de meest voorkomende waarde in een gegevensverzameling, of degene die het meest waarschijnlijk voorkomt in een statistische steekproef. In het bovenstaande voorbeeld is er geen modus omdat elke individuele waarde uniek is. Bij een grotere steekproef van mensen zouden er waarschijnlijk meerdere individuen van dezelfde leeftijd zijn, en de meest voorkomende leeftijd zou de modus zijn.
Gewogen gemiddelde
In een gewoon gemiddelde wordt elke waarde in een gegeven dataset gelijk behandeld. Met andere woorden, elke waarde draagt evenveel bij als de andere tot het eindgemiddelde. In een gewogen gemiddeldesommige waarden hebben echter een groter effect op het eindgemiddelde dan andere. Stel je bijvoorbeeld een aandelenportefeuille voor die bestaat uit drie verschillende aandelen: voorraad A, voorraad B en voorraad C. In het afgelopen jaar groeide de waarde van aandeel A met 10 procent, de waarde van aandeel B met 15 procent en de waarde van aandeel C met 25 procent. We kunnen de gemiddelde procentuele groei berekenen door deze waarden bij elkaar op te tellen en te delen door drie. Maar dat zou ons alleen de algehele groei van de portefeuille vertellen als de eigenaar gelijke hoeveelheden van voorraad A, voorraad B en voorraad C zou hebben. De meeste portefeuilles bevatten natuurlijk een mix van verschillende aandelen, waarvan sommige een groter percentage van de portefeuille uitmaken dan andere.
Om de algehele groei van de portefeuille te vinden, moeten we een gewogen gemiddelde berekenen op basis van hoeveel van elk aandeel in de portefeuille wordt gehouden. We zullen bijvoorbeeld zeggen dat aandeel A 20 procent van de portefeuille uitmaakt, aandeel B 10 procent en aandeel C 70 procent.
We wegen elke groeiswaarde door deze te vermenigvuldigen met het percentage van de portefeuille:
- Voorraad A = 10 procent groei x 20 procent van de portefeuille = 200
- Voorraad B = 15 procent groei x 10 procent van de portefeuille = 150
- Voorraad C = 25 procent groei x 70 procent van de portefeuille = 1750
Vervolgens tellen we deze gewogen waarden op en delen ze door de som van de portefeuillepercentagewaarden:
- (200 + 150 + 1750) ÷ (20 + 10 + 70) = 21
Het resultaat, 21 procent, vertegenwoordigt de totale groei van de portefeuille. Merk op dat het hoger is dan het gemiddelde van de drie groeipercentages alleen - 16,67 - wat logisch is aangezien het best presterende aandeel ook het leeuwendeel van de portefeuille uitmaakt.