Wat is het verschil tussen de afwijking en de standaarddeviatie?

click fraud protection

Wanneer we de variabiliteit van een set gegevens meten, zijn er twee nauw met elkaar verband houdende statistieken: de variantie en standaardafwijking, die beide aangeven hoe verspreid de gegevenswaarden zijn en vergelijkbare stappen in hun berekening omvatten. Het belangrijkste verschil tussen deze twee statistische analyses is echter dat de standaarddeviatie de vierkantswortel van de variantie is.

Om de verschillen tussen deze twee waarnemingen van statistische spreiding te begrijpen, moet men eerst begrijpen wat elk vertegenwoordigt: Variantie vertegenwoordigt alle gegevenspunten in een set en wordt berekend door het gemiddelde van de gekwadrateerde afwijking van elk gemiddelde te berekenen, terwijl de standaarddeviatie een spreidingsmaatstaf is rond het gemiddelde wanneer de centrale neiging wordt berekend via de gemeen.

Als resultaat kan de variantie worden uitgedrukt als de gemiddelde gekwadrateerde afwijking van de waarden van de gemiddelden of [kwadrateren afwijking van de middelen] gedeeld door het aantal waarnemingen en standaarddeviatie kan worden uitgedrukt als de vierkantswortel van de variantie.

instagram viewer

Constructie van variantie

Om het verschil tussen deze statistieken volledig te begrijpen, moeten we de berekening van de variantie begrijpen. De stappen voor het berekenen van de steekproefvariantie zijn als volgt:

  1. Bereken het steekproefgemiddelde van de gegevens.
  2. Zoek het verschil tussen het gemiddelde en elk van de gegevenswaarden.
  3. Maak deze verschillen vierkant.
  4. Tel de gekwadrateerde verschillen bij elkaar op.
  5. Verdeel deze som met één minder dan het totale aantal gegevenswaarden.

De redenen voor elk van deze stappen zijn als volgt:

  1. Het gemiddelde geeft het middelpunt of gemiddelde van de gegevens.
  2. De verschillen met het gemiddelde helpen om de afwijkingen van dat gemiddelde te bepalen. Gegevenswaarden die ver van het gemiddelde verwijderd zijn, zullen een grotere afwijking veroorzaken dan die die dicht bij het gemiddelde liggen.
  3. De verschillen zijn gekwadrateerd, want als de verschillen worden opgeteld zonder gekwadrateerd te zijn, is deze som nul.
  4. De toevoeging van deze gekwadrateerde afwijkingen geeft een meting van de totale afwijking.
  5. De deling door één minder dan de steekproefomvang geeft een soort gemiddelde afwijking. Dit negeert het effect van het feit dat veel datapunten elk bijdragen aan het meten van spreiding.

Zoals eerder vermeld, wordt de standaarddeviatie eenvoudig berekend door de vierkantswortel van dit resultaat te vinden, die de absolute standaarddeviatie biedt, ongeacht een totaal aantal gegevenswaarden.

Variantie en standaarddeviatie

Wanneer we de variantie beschouwen, realiseren we ons dat er een groot nadeel is aan het gebruik ervan. Wanneer we de stappen van de berekening van de variantie volgen, laat dit zien dat de variantie wordt gemeten in termen van vierkante eenheden omdat we gekwadrateerde verschillen bij elkaar hebben opgeteld in onze berekening. Als onze voorbeeldgegevens bijvoorbeeld in meters worden gemeten, worden de eenheden voor een variantie in vierkante meters gegeven.

Om onze spreidingsmaatstaf te standaardiseren, moeten we de vierkantswortel van de variantie nemen. Dit elimineert het probleem van vierkante eenheden en geeft ons een maat voor de spreiding die dezelfde eenheden zal hebben als onze originele steekproef.

Er zijn veel formules in wiskundige statistiek die er mooier uitzien als we ze in termen van variantie vermelden in plaats van standaarddeviatie.

instagram story viewer