Bell Curve en normale verdeling Definitie

De voorwaarde bel curve wordt gebruikt om het wiskundige concept te beschrijven dat normale distributie wordt genoemd, ook wel Gaussiaanse distributie genoemd. "Bell curve" verwijst naar de belvorm die wordt gemaakt wanneer een lijn wordt uitgezet met behulp van de gegevenspunten voor een item dat voldoet aan de criteria voor normale distributie.

In een klokcurve bevat het midden het grootste getal van een waarde en daarom is dit het hoogste punt op de boog van de lijn. Dit punt wordt verwezen naar de gemeen, maar eenvoudig gezegd is dit het hoogste aantal keren dat een element voorkomt (in statistische termen, de modus).

Normale verdeling

Het belangrijkste om te weten over een normale verdeling is dat de curve in het midden geconcentreerd is en aan beide kanten afneemt. Dit is belangrijk omdat de gegevens minder geneigd zijn om ongewoon extreme waarden, uitschieters genoemd, te produceren in vergelijking met andere distributies. De klokcurve geeft ook aan dat de gegevens symmetrisch zijn. Dit betekent dat u redelijke verwachtingen kunt creëren over de mogelijkheid dat een uitkomst binnen een bereik links of rechts van het midden, nadat u de hoeveelheid afwijking in de gegevens hebt gemeten. Dit wordt gemeten in termen van

instagram viewer
standaard afwijkingen.

Een klokgrafiekgrafiek hangt af van twee factoren: het gemiddelde en de standaardafwijking. Het gemiddelde identificeert de positie van het midden en de standaardafwijking bepaalt de hoogte en breedte van de bel. Een grote standaardafwijking creëert bijvoorbeeld een bel die kort en breed is, terwijl een kleine standaardafwijking een lange en smalle curve creëert.

Waarschijnlijkheid van belcurve en standaardafwijking

Om de waarschijnlijkheidsfactoren van een normale verdeling te begrijpen, moet u de volgende regels begrijpen:

  1. Het totale oppervlak onder de curve is gelijk aan 1 (100%)
  2. Ongeveer 68% van het gebied onder de curve valt binnen één standaardafwijking.
  3. Ongeveer 95% van het gebied onder de curve valt binnen twee standaarddeviaties.
  4. Ongeveer 99,7% van het gebied onder de curve valt binnen drie standaarddeviaties.

Items 2, 3 en 4 hierboven worden soms de empirische regel of de 68-95-99.7-regel genoemd. Nadat u heeft vastgesteld dat de gegevens normaal worden gedistribueerd (bel gebogen) en bereken het gemiddelde en standaardafwijking, u kunt de bepalen waarschijnlijkheid dat een enkel gegevenspunt binnen een gegeven bereik van mogelijkheden valt.

Bell Curve-voorbeeld

Een goed voorbeeld van een belcurve of normale verdeling is de worp van twee dobbelstenen. De verdeling is gecentreerd rond het getal zeven en de waarschijnlijkheid neemt af naarmate u zich van het centrum verwijdert.

Hier is het percentage kans van de verschillende uitkomsten wanneer je twee dobbelstenen gooit.

  • Twee: (1/36) 2.78%
  • Drie: (2/36) 5.56%
  • Vier: (3/36) 8.33%
  • Vijf: (4/36) 11.11%
  • Zes: (5/36) 13.89%
  • Zeven: (6/36) 16,67% = meest waarschijnlijke uitkomst
  • Acht: (5/36) 13.89%
  • Negen: (4/36) 11.11%
  • Tien: (3/36) 8.33%
  • Elf: (2/36) 5.56%
  • Twaalf: (1/36) 2.78%

Normale distributies hebben veel handige eigenschappen, dus in veel gevallen, vooral in fysica en astronomie, willekeurige variaties met onbekende verdelingen worden vaak als normaal beschouwd om waarschijnlijkheidsberekeningen mogelijk te maken. Hoewel dit een gevaarlijke aanname kan zijn, is het vaak een goede benadering vanwege een verrassend resultaat dat bekend staat als de centrale limietstelling.

Deze stelling stelt dat het gemiddelde van elke reeks varianten met elke verdeling met een eindig gemiddelde en variantie de neiging heeft om in een normale verdeling te voorkomen. Veel gemeenschappelijke attributen zoals testscores of lengte volgen ruwweg normale verdelingen, met weinig leden aan de hoge en lage uiteinden en vele in het midden.

Wanneer u de belcurve niet moet gebruiken

Er zijn sommige soorten gegevens die geen normaal distributiepatroon volgen. Deze datasets moeten niet worden gedwongen om te proberen een belcurve te passen. Een klassiek voorbeeld zijn studentcijfers, die vaak twee modi hebben. Andere soorten gegevens die de curve niet volgen, zijn onder meer inkomen, bevolkingsgroei en mechanisch falen.

instagram story viewer