Waarschijnlijkheid en statistieken zijn twee nauw verwante wiskundige onderwerpen. Beiden gebruiken veel van dezelfde terminologie en er zijn veel contactpunten tussen beide. Het is heel gebruikelijk om geen onderscheid te zien tussen kansconcepten en statistische concepten. Vaak wordt materiaal van beide onderwerpen samengevoegd onder het kopje 'waarschijnlijkheid en statistiek', zonder te proberen te scheiden welke onderwerpen van welke discipline zijn. Ondanks deze praktijken en de gemeenschappelijke basis van de onderwerpen, zijn ze verschillend. Wat is het verschil tussen waarschijnlijkheid en statistieken?
Wat is bekend
Het belangrijkste verschil tussen waarschijnlijkheid en statistiek heeft te maken met kennis. Hiermee verwijzen we naar wat de bekende feiten zijn wanneer we een probleem benaderen. Inherent in zowel waarschijnlijkheid als statistiek is een bevolking, bestaande uit elk individu dat we willen bestuderen, en een steekproef, bestaande uit de individuen die zijn geselecteerd uit de populatie.
Een waarschijnlijkheidsprobleem begint als we alles weten over de samenstelling van een populatie, en dan zou vragen: 'Wat is de kans dat een selectie of steekproef uit de populatie zeker is kenmerken?"
Voorbeeld
We kunnen het verschil tussen waarschijnlijkheid en statistieken zien door na te denken over een la met sokken. Misschien hebben we wel een la met 100 sokken. Afhankelijk van onze kennis van de sokken, kunnen we een statistisch probleem of een waarschijnlijkheidsprobleem hebben.
Als we weten dat er 30 rode sokken, 20 blauwe sokken en 50 zwarte sokken zijn, kunnen we de waarschijnlijkheid gebruiken om vragen te beantwoorden over de samenstelling van een willekeurig voorbeeld van deze sokken. Vragen van dit type zijn:
- 'Hoe groot is de kans dat we twee blauwe sokken en twee rode sokken uit de la trekken?'
- 'Hoe groot is de kans dat we drie sokken uittrekken en een bijpassend paar hebben?'
- 'Wat is de kans dat we vijf sokken trekken, met vervanging, en ze zijn allemaal zwart? '
Als we in plaats daarvan geen kennis hebben over de soorten sokken in de la, gaan we het rijk van de statistieken binnen. Statistieken helpen ons om eigenschappen over de populatie af te leiden op basis van een willekeurige steekproef. Vragen die statistisch van aard zijn, zijn:
- Een willekeurige steekproef van tien sokken uit de la leverde een blauwe sok, vier rode sokken en vijf zwarte sokken op. Wat is het totale aandeel zwarte, blauwe en rode sokken in de la?
- We nemen willekeurig tien sokken uit de la, schrijven het aantal zwarte sokken op en zetten de sokken terug in de la. Dit proces wordt vijf keer uitgevoerd. Het gemiddelde aantal sokken is voor elk van deze proeven 7. Wat is het werkelijke aantal zwarte sokken in de la?
Gemeenschappelijkheid
Waarschijnlijkheid en statistiek hebben natuurlijk veel gemeen. Dit komt omdat statistieken gebaseerd zijn op waarschijnlijkheid. Hoewel we doorgaans geen volledige informatie hebben over een populatie, kunnen we stellingen en resultaten van waarschijnlijkheid gebruiken om tot statistische resultaten te komen. Deze resultaten informeren ons over de populatie.
Aan de basis van dit alles ligt de veronderstelling dat we te maken hebben met willekeurige processen. Daarom hebben we benadrukt dat de steekproefprocedure die we met de sokkenlade gebruikten willekeurig was. Als we geen aselecte steekproef hebben, bouwen we niet langer voort op aannames die in waarschijnlijkheid aanwezig zijn.
Waarschijnlijkheid en statistieken zijn nauw met elkaar verbonden, maar er zijn verschillen. Als je moet weten welke methoden geschikt zijn, vraag jezelf dan af wat je weet.