Wanneer de standaarddeviatie gelijk is aan nul

De standaarddeviatie van de steekproef is een beschrijvende statistiek die de verspreiding van een kwantitatieve gegevensset meet. Dit nummer kan elk niet-negatief reëel getal zijn. Omdat nul een niet-negatieve factor is echt nummer, lijkt het de moeite waard om te vragen: "Wanneer is de standaarddeviatie van de steekproef gelijk aan nul?" Dit gebeurt in het zeer speciale en zeer ongebruikelijke geval waarin al onze gegevenswaarden exact hetzelfde zijn. We zullen de redenen onderzoeken waarom.

Beschrijving van de standaarddeviatie

Twee belangrijke vragen die we doorgaans willen beantwoorden over een dataset zijn:

  • Wat is het midden van de dataset?
  • Hoe verspreid is de dataset?

Er zijn verschillende metingen, beschrijvende statistieken genaamd, die deze vragen beantwoorden. Bijvoorbeeld het midden van de gegevens, ook wel bekend als de gemiddeldekan worden beschreven in termen van het gemiddelde, de mediaan of de modus. Andere, minder bekende statistieken kunnen worden gebruikt, zoals de midhinge of de trimean.

instagram viewer

Voor de verspreiding van onze data kunnen we gebruik maken van het bereik, de interkwartielbereik of de standaarddeviatie. De standaarddeviatie wordt gecombineerd met het gemiddelde om de verspreiding van onze gegevens te kwantificeren. Dit nummer kunnen we vervolgens gebruiken om meerdere datasets te vergelijken. Hoe groter onze standaarddeviatie, hoe groter de spreiding.

Intuïtie

Laten we dus uit deze beschrijving bekijken wat het zou betekenen om een ​​standaarddeviatie van nul te hebben. Dit zou aangeven dat er helemaal geen spreiding is in onze dataset. Alle individuele gegevenswaarden worden samengevoegd tot één waarde. Aangezien er maar één waarde zou zijn die onze gegevens zouden kunnen hebben, zou deze waarde het gemiddelde van onze steekproef vormen.

In deze situatie, wanneer al onze gegevenswaarden hetzelfde zijn, zou er geen enkele variatie zijn. Intuïtief is het logisch dat de standaarddeviatie van een dergelijke dataset nul zou zijn.

Wiskundig bewijs

De standaarddeviatie van het monster wordt gedefinieerd door een formule. Dus elke verklaring zoals die hierboven moet worden bewezen met deze formule. We beginnen met een dataset die voldoet aan de bovenstaande beschrijving: alle waarden zijn identiek en die zijn er ook n waarden gelijk aan X.

We berekenen het gemiddelde van deze dataset en zien dat dit zo is

X = (X + X +... + X)/n = nx/n = X.

Wanneer we nu de individuele afwijkingen van het gemiddelde berekenen, zien we dat al deze afwijkingen nul zijn. Bijgevolg zijn de variantie en ook de standaarddeviatie beide ook gelijk aan nul.

Noodzakelijk en voldoende

We zien dat als de dataset geen variatie vertoont, de standaarddeviatie nul is. We kunnen vragen of de converseren van deze verklaring is ook waar. Om te zien of dat zo is, zullen we de formule voor standaarddeviatie opnieuw gebruiken. Deze keer stellen we echter de standaarddeviatie gelijk aan nul. We zullen geen aannames doen over onze dataset, maar we zullen zien welke instelling s = 0 impliceert

Stel dat de standaarddeviatie van een dataset gelijk is aan nul. Dit zou impliceren dat de steekproefvariantie s2 is ook gelijk aan nul. Het resultaat is de vergelijking:

0 = (1/(n - 1)) ∑ (Xik - X )2

We vermenigvuldigen beide kanten van de vergelijking met n - 1 en zie dat de som van de gekwadrateerde afwijkingen gelijk is aan nul. Aangezien we met reële getallen werken, is de enige manier waarop dit kan gebeuren, dat elk van de gekwadrateerde afwijkingen gelijk is aan nul. Dit betekent dat voor iedereen ik, de voorwaarde (Xik - X )2 = 0.

We nemen nu de vierkantswortel van de bovenstaande vergelijking en zien dat elke afwijking van het gemiddelde gelijk moet zijn aan nul. Omdat voor iedereen ik,

Xik - X = 0

Dit betekent dat elke gegevenswaarde gelijk is aan het gemiddelde. Dit resultaat, samen met het bovenstaande, stelt ons in staat om te zeggen dat de standaarddeviatie van een dataset nul is als en alleen als alle waarden identiek zijn.

instagram story viewer