Chebyshev's ongelijkheid in waarschijnlijkheid

De ongelijkheid van Chebyshev zegt dat minstens 1-1 /K2 van gegevens uit een steekproef moet binnen vallen K standaarddeviaties van het gemiddelde (hier K is positief echt nummer groter dan één).

Elke gegevensverzameling die normaal wordt verspreid of in de vorm van een belcurve, heeft verschillende functies. Een daarvan heeft betrekking op de spreiding van de gegevens in verhouding tot het aantal standaarddeviaties van het gemiddelde. Bij een normale verdeling weten we dat 68% van de gegevens één standaarddeviatie is van het gemiddelde, 95% is twee standaarddeviaties van het gemiddelde en ongeveer 99% valt binnen drie standaarddeviaties van het gemiddelde.

Maar als de dataset niet is verdeeld in de vorm van een belcurve, dan zou een ander bedrag binnen één standaarddeviatie kunnen liggen. De ongelijkheid van Chebyshev biedt een manier om te weten in welk deel van de gegevens deze valt K standaarddeviaties van het gemiddelde voor ieder dataset.

Feiten over de ongelijkheid

We kunnen de bovenstaande ongelijkheid ook aangeven door de zinsnede 'gegevens uit een steekproef' te vervangen door

instagram viewer
kansverdeling. Dit komt omdat de ongelijkheid van Chebyshev het gevolg is van waarschijnlijkheid, die vervolgens op statistieken kan worden toegepast.

Het is belangrijk op te merken dat deze ongelijkheid een resultaat is dat wiskundig is bewezen. Het is niet zoals de empirische relatie tussen het gemiddelde en de modus, of de vuistregel die het bereik en de standaarddeviatie met elkaar verbindt.

Illustratie van de ongelijkheid

Om de ongelijkheid te illustreren, zullen we er enkele waarden van bekijken K:

  • Voor K = 2 we hebben 1-1 /K2 = 1 - 1/4 = 3/4 = 75%. Dus de ongelijkheid van Chebyshev zegt dat ten minste 75% van de gegevenswaarden van elke distributie binnen twee standaarddeviaties van het gemiddelde moeten liggen.
  • Voor K = 3 we hebben 1-1 /K2 = 1 - 1/9 = 8/9 = 89%. Dus de ongelijkheid van Chebyshev zegt dat ten minste 89% van de gegevenswaarden van elke distributie binnen drie standaarddeviaties van het gemiddelde moeten liggen.
  • Voor K = 4 we hebben 1-1 -K2 = 1 - 1/16 = 15/16 = 93.75%. Dus de ongelijkheid van Chebyshev zegt dat ten minste 93,75% van de gegevenswaarden van elke distributie binnen twee standaarddeviaties van het gemiddelde moeten liggen.

Voorbeeld

Stel dat we het gewicht van honden in het plaatselijke dierenasiel hebben bemonsterd en hebben vastgesteld dat ons monster gemiddeld 20 pond heeft met een standaarddeviatie van 3 pond. Met het gebruik van de ongelijkheid van Chebyshev weten we dat ten minste 75% van de honden die we hebben bemonsterd gewichten hebben die twee standaarddeviaties zijn van het gemiddelde. Twee keer de standaarddeviatie geeft ons 2 x 3 = 6. Trek af en tel dit op bij het gemiddelde van 20. Dit vertelt ons dat 75% van de honden een gewicht heeft van 14 pond tot 26 pond.

Gebruik van de ongelijkheid

Als we meer weten over de distributie waarmee we werken, kunnen we meestal garanderen dat meer gegevens een bepaald aantal standaarddeviaties verwijderd zijn van het gemiddelde. Als we bijvoorbeeld weten dat we een normale verdeling hebben, dan is 95% van de gegevens twee standaarddeviaties van het gemiddelde. De ongelijkheid van Chebyshev zegt dat we in deze situatie dat weten minstens 75% van de gegevens zijn twee standaarddeviaties van het gemiddelde. Zoals we in dit geval kunnen zien, zou het veel meer kunnen zijn dan deze 75%.

De waarde van de ongelijkheid is dat het ons een 'slechter geval'-scenario geeft waarin het enige wat we weten over onze voorbeeldgegevens (of kansverdeling) het gemiddelde is en standaardafwijking. Als we niets anders weten over onze gegevens, biedt de ongelijkheid van Chebyshev wat extra inzicht in hoe verspreid de dataset is.

Geschiedenis van de ongelijkheid

De ongelijkheid is genoemd naar de Russische wiskundige Pafnuty Chebyshev, die in 1874 voor het eerst de ongelijkheid zonder bewijs vaststelde. Tien jaar later werd de ongelijkheid bewezen door Markov in zijn Ph. D. proefschrift. Vanwege verschillen in de weergave van het Russische alfabet in het Engels, wordt Chebyshev ook wel gespeld als Tchebysheff.

instagram story viewer