In verschillende disciplines is het doel om een grote groep individuen te bestuderen. Deze groepen kunnen net zo gevarieerd zijn als een vogelsoort, eerstejaars studenten in de Verenigde Staten of auto's die over de hele wereld rijden. Statistieken worden in al deze onderzoeken gebruikt wanneer het onmogelijk of zelfs onmogelijk is om elk lid van de groep van belang te bestuderen. In plaats van het meten van de spanwijdte van elke vogel van een soort, stelt u elk college enquêtevragen eerstejaars, of het meten van het brandstofverbruik van elke auto ter wereld, in plaats daarvan bestuderen en meten we een deelverzameling van de groep.
De verzameling van iedereen of alles dat in een onderzoek moet worden geanalyseerd, wordt een populatie genoemd. Zoals we in de bovenstaande voorbeelden hebben gezien, kan de populatie enorm groot zijn. Er kunnen miljoenen of zelfs miljarden individuen in de bevolking zijn. Maar we mogen niet denken dat de bevolking groot moet zijn. Als onze groep die wordt bestudeerd de vierde klas van een bepaalde school is, bestaat de populatie alleen uit deze studenten. Afhankelijk van de schoolgrootte kunnen dit minder dan honderd studenten in onze bevolking zijn.
Om onze studie qua tijd en middelen goedkoper te maken, bestuderen we slechts een deelgroep van de bevolking. Deze subset wordt a genoemd monster. Monsters kunnen vrij groot of vrij klein zijn. In theorie vormt één individu uit een populatie een steekproef. Veel toepassingen van statistieken vereisen dat een steekproef uit minstens 30 personen bestaat.
Parameters en statistieken
Waar we doorgaans naar op zoek zijn in een onderzoek, is de parameter. Een parameter is een numerieke waarde die iets zegt over de gehele populatie die wordt bestudeerd. We willen bijvoorbeeld de gemeen spanwijdte van de Amerikaanse zeearend. Dit is een parameter omdat het de hele populatie beschrijft.
Parameters zijn moeilijk, zo niet onmogelijk, precies te verkrijgen. Aan de andere kant heeft elke parameter een bijbehorende statistiek die exact kan worden gemeten. Een statistiek is een numerieke waarde die iets zegt over een steekproef. Om het bovenstaande voorbeeld uit te breiden, konden we 100 Amerikaanse zeearenden vangen en vervolgens de spanwijdte van elk van deze meten. De gemiddelde spanwijdte van de 100 adelaars die we hebben gevangen, is een statistiek.
De waarde van een parameter is een vast getal. Aangezien een statistiek daarentegen afhangt van een steekproef, kan de waarde van een statistiek variëren van steekproef tot steekproef. Stel dat onze populatieparameter een voor ons onbekende waarde van 10 heeft. Een steekproef van maat 50 heeft de bijbehorende statistiek met waarde 9.5. Een andere steekproef van maat 50 uit dezelfde populatie heeft de bijbehorende statistiek met waarde 11.1.
Het uiteindelijke doel van het statistiekveld is het schatten van een populatieparameter door middel van steekproefstatistieken.
Mnemonic Device
Er is een eenvoudige en ongecompliceerde manier om te onthouden wat een parameter en statistiek meten. Alles wat we moeten doen is naar de eerste letter van elk woord kijken. Een parameter meet iets in een populatie en een statistiek meet iets in een steekproef.
Voorbeelden van parameters en statistieken
Hieronder volgen nog enkele voorbeelden van parameters en statistieken:
- Stel dat we de populatie honden in Kansas City bestuderen. Een parameter van deze populatie is de gemiddelde lengte van alle honden in de stad. Een statistiek zou de gemiddelde lengte van 50 van deze honden zijn.
- We zullen een studie overwegen van middelbare scholieren in de Verenigde Staten. Een parameter van deze populatie is de standaarddeviatie van de gemiddelde cijfers van alle middelbare scholieren. Een statistiek is de standaarddeviatie van de cijfergemiddelden van een steekproef van 1000 middelbare school senioren.
- We houden rekening met alle waarschijnlijke kiezers voor een aanstaande verkiezing. Er zal een steminitiatief zijn om de staatsgrondwet te veranderen. We willen het draagvlak voor dit steminitiatief bepalen. Een parameter, in dit geval, is het aandeel van de bevolking van waarschijnlijke kiezers die het stembureau steunen. Een gerelateerde statistiek is het overeenkomstige deel van een steekproef van waarschijnlijke kiezers.