Kansverdeling in statistieken

click fraud protection

Als je er veel tijd mee bezig bent statistieken, al snel kom je de zin "kansverdeling" tegen. Hier krijgen we echt te zien hoeveel de gebieden van waarschijnlijkheid en statistieken elkaar overlappen. Hoewel dit klinkt als iets technischs, is de spreiding van de kansverdeling eigenlijk gewoon een manier om te praten over het organiseren van een lijst met kansen. Een kansverdeling is een functie of regel die kansen toewijst aan elke waarde van een willekeurige variabele. In sommige gevallen wordt de uitkering vermeld. In andere gevallen wordt het weergegeven als een grafiek.

Voorbeeld

Stel dat we gooi twee dobbelstenen en noteer vervolgens de som van de dobbelstenen. Sommen van twee tot twaalf zijn mogelijk. Elke som heeft een bepaalde waarschijnlijkheid. We kunnen deze eenvoudig als volgt opsommen:

  • De som van 2 heeft een kans van 1/36
  • De som van 3 heeft een kans van 2/36
  • De som van 4 heeft een kans van 3/36
  • De som van 5 heeft een waarschijnlijkheid van 4/36
  • De som van 6 heeft een kans van 5/36
  • instagram viewer
  • De som van 7 heeft een waarschijnlijkheid van 6/36
  • De som van 8 heeft een kans van 5/36
  • De som van 9 heeft een kans van 4/36
  • De som van 10 heeft een kans van 3/36
  • De som van 11 heeft een kans van 2/36
  • De som van 12 heeft een kans van 1/36

Deze lijst is een kansverdeling voor het kansexperiment van het gooien van twee dobbelstenen. We kunnen het bovenstaande ook beschouwen als een kansverdeling van de willekeurige variabele gedefinieerd door te kijken naar de som van de twee dobbelstenen.

Grafiek

Een kansverdeling kan in kaart worden gebracht, en soms helpt dit ons om kenmerken van de verdeling te tonen die niet duidelijk waren door alleen de lijst met kansen te lezen. De willekeurige variabele is uitgezet langs de X-as, en de bijbehorende waarschijnlijkheid is uitgezet langs de y-as. Voor een discrete willekeurige variabele hebben we een histogram. Voor een continue willekeurige variabele hebben we de binnenkant van een vloeiende curve.

De waarschijnlijkheidsregels zijn nog steeds van kracht en manifesteren zich op een aantal manieren. Omdat kansen groter dan of gelijk aan nul zijn, moet de grafiek van een kansverdeling hebben y-coördinaten die niet negatief zijn. Een ander kenmerk van kansen, namelijk dat het maximum is dat de kans op een gebeurtenis kan zijn, komt op een andere manier naar voren.

Gebied = waarschijnlijkheid

De grafiek van een kansverdeling is zo geconstrueerd dat gebieden kansen vertegenwoordigen. Voor een discrete kansverdeling berekenen we eigenlijk alleen de gebieden van rechthoeken. In de bovenstaande grafiek komen de gebieden van de drie balken overeen met vier, vijf en zes overeen met de kans dat de som van onze dobbelstenen vier, vijf of zes is. De gebieden van alle balken tellen samen op tot één.

In de standaard normale distributie of belcurve, we hebben een vergelijkbare situatie. Het gebied onder de curve tussen twee z waarden komt overeen met de kans dat onze variabele tussen deze twee waarden valt. Bijvoorbeeld, het gebied onder de belcurve voor -1 z.

Belangrijke distributies

Er zijn letterlijk oneindig veel kansverdelingen. Een lijst met enkele van de belangrijkste distributies volgt:

  • Binomiale distributie - Geeft het aantal successen voor een reeks onafhankelijke experimenten met twee resultaten
  • Chi-kwadraatverdeling - Voor het bepalen van hoe dicht waargenomen hoeveelheden in een voorgesteld model passen
  • F-verdeling - Gebruikt in de analyse van variantie (ANOVA)
  • Normale verdeling - Genaamd de belcurve en is te vinden in statistieken.
  • Student's distributie - Voor gebruik met kleine steekproeven van een normale verdeling
instagram story viewer