De mediaan- van een set gegevens is het middenpunt waarin precies de helft van de gegevenswaarden kleiner is dan of gelijk is aan de mediaan. Op een vergelijkbare manier kunnen we nadenken over de mediaan van een continukansverdeling, maar in plaats van de middelste waarde in een set gegevens te vinden, vinden we het midden van de distributie op een andere manier.
De totale oppervlakte onder een kansdichtheidsfunctie is 1, wat 100% vertegenwoordigt, en als gevolg hiervan kan de helft hiervan worden vertegenwoordigd door de helft of 50 procent. Een van de grote ideeën van wiskundige statistiek is dat de waarschijnlijkheid wordt weergegeven door het gebied onder de curve van de dichtheidsfunctie, die wordt berekend door een integraal, en dus de mediaan van een continue verdeling is het punt waarop de echt nummer lijn waar precies de helft van het gebied links ligt.
Dit kan beknopter worden verklaard door de volgende onjuiste integraal. De mediaan van de continue willekeurige variabele X met dichtheidsfunctie f( X) is de waarde M zodat:
0.5=∫m−∞f(X)dX
Mediaan voor exponentiële distributie
We berekenen nu de mediaan voor de exponentiële verdeling Exp (A). Een willekeurige variabele met deze verdeling heeft een dichtheidsfunctie f(X) = e-X/EEN/ A voor X elk niet-negatief reëel getal. De functie bevat ook de wiskundige constante e, ongeveer gelijk aan 2.71828.
Omdat de kansdichtheidsfunctie nul is voor een negatieve waarde van X, alles wat we moeten doen is het volgende integreren en oplossen voor M:
0,5 = M0M f (x) dx
Aangezien de integraal ∫ e-X/EEN/AdvertentieX = -e-X/EEN, het resultaat is dat
0,5 = -e-M / A + 1
Dit betekent dat 0,5 = e-M / A en nadat we de natuurlijke logaritme van beide kanten van de vergelijking hebben genomen, hebben we:
ln (1/2) = -M / A
Aangezien 1/2 = 2-1, door eigenschappen van logaritmen schrijven we:
- ln2 = -M / A
Vermenigvuldiging van beide zijden met A geeft ons het resultaat dat de mediaan M = A ln2.
Mediane gemiddelde ongelijkheid in statistiek
Een gevolg van dit resultaat moet worden vermeld: het gemiddelde van de exponentiële verdeling Exp (A) is A, en aangezien ln2 kleiner is dan 1, volgt hieruit dat het product Aln2 kleiner is dan A. Dit betekent dat de mediaan van de exponentiële verdeling kleiner is dan het gemiddelde.
Dit is logisch als we nadenken over de grafiek van de kansdichtheidsfunctie. Door de lange staart zit deze verdeling scheef naar rechts. Vaak wanneer een verdeling naar rechts scheef staat, is het gemiddelde rechts van de mediaan.
Wat dit betekent in termen van statistische analyse, is dat we vaak kunnen voorspellen dat het gemiddelde en de mediaan niet direct zijn correleren gezien de kans dat de gegevens naar rechts scheef staan, wat kan worden uitgedrukt als het mediane gemiddelde ongelijkheidsbewijs bekend als De ongelijkheid van Chebyshev.
Neem bijvoorbeeld een dataset die stelt dat een persoon in totaal 30 bezoekers binnen 10 uur ontvangt, waarbij de gemiddelde wachttijd voor een bezoeker 20 minuten is, terwijl de reeks gegevens kan aantonen dat de mediane wachttijd ergens tussen de 20 en 30 minuten zou zijn als meer dan de helft van die bezoekers in de eerste vijf kwam uren.