Willekeurige variabelen met een binomiale verdeling staan bekend als discreet. Dit betekent dat er een telbaar aantal uitkomsten kan optreden in een binomiale verdeling, met een scheiding tussen deze uitkomsten. Een binomiale variabele kan bijvoorbeeld een waarde van drie of vier hebben, maar geen getal tussen drie en vier.
Met het discrete karakter van een binomiale verdeling, is het enigszins verrassend dat een continue willekeurige variabele kan worden gebruikt om een binomiale verdeling te benaderen. Voor velen binomiale verdelingen, we kunnen een normale verdeling gebruiken om onze binomiale kansen te schatten.
Dit is te zien als je ernaar kijkt n munten gooien en verhuren X wees het aantal hoofden. In deze situatie hebben we een binomiale verdeling met kans van slagen als p = 0,5. Naarmate we het aantal opgooien verhogen, zien we dat de waarschijnlijkheid histogram draagt steeds meer gelijkenis met een normale verdeling.
Verklaring van de normale benadering
Elke normale verdeling wordt volledig door twee gedefinieerd
echte getallen. Deze getallen zijn het gemiddelde, dat het middelpunt van de verdeling meet, en de standaardafwijking, die de verspreiding van de distributie meet. Voor een gegeven binomiale situatie moeten we kunnen bepalen welke normale distributie we moeten gebruiken.De selectie van de juiste normale verdeling wordt bepaald door het aantal proeven n in de binomiale setting en de constante kans op succes p voor elk van deze proeven. De normale benadering voor onze binomiale variabele is een gemiddelde van np en een standaardafwijking van (np(1 - p)0.5.
Stel bijvoorbeeld dat we elk van de 100 vragen van een multiple-choice test hebben geraden, waarbij elke vraag één correct antwoord had op vier keuzes. Het aantal juiste antwoorden X is een binomiale willekeurige variabele met n = 100 en p = 0.25. Deze willekeurige variabele heeft dus een gemiddelde van 100 (0,25) = 25 en een standaardafwijking van (100 (0,25) (0,75))0.5 = 4.33. Een normale verdeling met gemiddelde 25 en standaardafwijking van 4,33 zal werken om deze binomiale verdeling te benaderen.
Wanneer is de benadering geschikt?
Door wat wiskunde te gebruiken kan aangetoond worden dat er een paar voorwaarden zijn die we nodig hebben om een normale benadering van de te gebruiken binomiale verdeling. Het aantal observaties n moet groot genoeg zijn, en de waarde van p zodat beide np en n(1 - p) groter zijn dan of gelijk zijn aan 10. Dit is een vuistregel, die wordt geleid door statistische praktijk. De normale benadering kan altijd worden gebruikt, maar als niet aan deze voorwaarden wordt voldaan, is de benadering mogelijk niet zo goed als een benadering.
Bijvoorbeeld als n = 100 en p = 0,25 dan zijn we gerechtvaardigd om de normale benadering te gebruiken. Dit is zo omdat np = 25 en n(1 - p) = 75. Omdat beide getallen groter zijn dan 10, zal de juiste normale verdeling een redelijk goede taak zijn om binomiale kansen te schatten.
Waarom de benadering gebruiken?
Binomiale kansen worden berekend met behulp van een zeer eenvoudige formule om de binomiale coëfficiënt te vinden. Helaas vanwege de faculteiten in de formule kan het heel gemakkelijk zijn om rekenproblemen te krijgen met de binomiaal formule. Met de normale benadering kunnen we al deze problemen omzeilen door met een bekende vriend, een tabel met waarden van een standaard normale verdeling, te werken.
Vaak is de bepaling van een waarschijnlijkheid dat een binomiale willekeurige variabele binnen een bereik van waarden valt moeilijk te berekenen. Dit komt omdat om de kans te vinden dat een binomiale variabele X groter is dan 3 en kleiner dan 10, zouden we de waarschijnlijkheid moeten vinden dat X is gelijk aan 4, 5, 6, 7, 8 en 9 en tel dan al deze waarschijnlijkheden bij elkaar op. Als de normale benadering kan worden gebruikt, moeten we in plaats daarvan de z-scores bepalen die overeenkomen met 3 en 10, en vervolgens een z-score tabel met waarschijnlijkheden gebruiken voor de standaard normale verdeling.