In dit artikel zullen we de stappen doorlopen die nodig zijn om een hypothesetestof test van significantie voor het verschil tussen twee populatie-proporties. Hierdoor kunnen we twee onbekende verhoudingen vergelijken en afleiden of ze niet gelijk zijn aan elkaar of dat de ene groter is dan de andere.
Hypothesetest Overzicht en achtergrond
Voordat we ingaan op de details van onze hypothesetoets, zullen we kijken naar het raamwerk van hypothesetoetsen. In een significantietest proberen we aan te tonen dat een uitspraak over de waarde van een populatie parameter (of soms de aard van de populatie zelf) is waarschijnlijk waar.
We verzamelen bewijs voor deze verklaring door het uitvoeren van een statistische steekproef. Uit deze steekproef berekenen we een statistiek. De waarde van deze statistiek is wat we gebruiken om de waarheid van de oorspronkelijke verklaring te bepalen. Dit proces bevat onzekerheid, maar we kunnen deze onzekerheid kwantificeren
Het algemene proces voor een hypothesetoets wordt gegeven door de onderstaande lijst:
- Zorg ervoor dat aan de voorwaarden wordt voldaan die nodig zijn voor onze test.
- Vermeld duidelijk de nul en alternatieve hypothesen. De alternatieve hypothese kan betrekking hebben op een eenzijdige of een tweezijdige test. We moeten ook het significantieniveau bepalen, dat zal worden aangegeven met de Griekse letter alpha.
- Bereken de teststatistiek. Het type statistiek dat we gebruiken, hangt af van de specifieke test die we uitvoeren. De berekening is gebaseerd op onze statistische steekproef.
- Bereken de p-waarde. De teststatistiek kan worden vertaald in een p-waarde. Een p-waarde is de kans dat alleen al de waarde van onze teststatistiek wordt geproduceerd in de veronderstelling dat de nulhypothese waar is. De algemene regel is dat hoe kleiner de p-waarde, hoe groter het bewijs tegen de nulhypothese.
- Een conclusie trekken. Ten slotte gebruiken we de waarde van alpha die al was geselecteerd als drempelwaarde. De beslissingsregel is dat als de p-waarde kleiner is dan of gelijk is aan alpha, dan verwerpen we de nulhypothese. Anders wij niet afwijzen de nulhypothese.
Nu we het raamwerk voor een hypothesetoets hebben gezien, zullen we de details voor een hypothesetoets zien voor het verschil tussen twee populatie-proporties.
De omstandigheden
Een hypothesetoets voor het verschil tussen twee populatie-proporties vereist dat aan de volgende voorwaarden wordt voldaan:
- We hebben twee eenvoudige willekeurige steekproeven van grote populaties. Hier betekent "groot" dat de populatie minstens 20 keer groter is dan de omvang van de steekproef. De steekproefomvang wordt aangegeven met n1 en n2.
- De individuen in onze monsters zijn onafhankelijk van elkaar gekozen. De bevolking zelf moet ook onafhankelijk zijn.
- Er zijn minstens 10 successen en 10 mislukkingen in onze beide voorbeelden.
Zolang aan deze voorwaarden is voldaan, kunnen we doorgaan met onze hypothesetoets.
De nul- en alternatieve hypothesen
Nu moeten we de hypothesen overwegen voor onze test van betekenis. De nulhypothese is onze verklaring zonder effect. In dit specifieke type hypothesetest is onze nulhypothese dat er geen verschil is tussen de twee populatie-verhoudingen. We kunnen dit schrijven als H0: p1 = p2.
De alternatieve hypothese is een van de drie mogelijkheden, afhankelijk van de specifieke kenmerken van wat we testen:
- Heen: p1 is groter dan p2. Dit is een eenzijdige of eenzijdige test.
- Heen: p1 is minder dan p2. Dit is ook een eenzijdige test.
- Heen: p1 is niet gelijk aan p2. Dit is een tweezijdige of dubbelzijdige test.
Zoals altijd moeten we, om voorzichtig te zijn, de tweezijdige alternatieve hypothese gebruiken als we geen richting in gedachten hebben voordat we onze steekproef verkrijgen. De reden hiervoor is dat het met een dubbelzijdige toets moeilijker is om de nulhypothese te verwerpen.
De drie hypothesen kunnen worden herschreven door te vermelden hoe p1 - p2 is gerelateerd aan de waarde nul. Meer specifiek zou de nulhypothese H worden0:p1 - p2 = 0. De mogelijke alternatieve hypothesen zouden worden geschreven als:
- Heen: p1 - p2 > 0 is gelijk aan de instructie "p1 is groter dan p2."
- Heen: p1 - p2 <0 komt overeen met de instructie "p1 is minder dan p2."
- Heen: p1 - p2 ≠ 0 komt overeen met de instructie "p1 is niet gelijk aan p2."
Deze gelijkwaardige formulering laat ons eigenlijk iets meer zien van wat er achter de schermen gebeurt. Wat we in deze hypothesetoets doen, is de twee parameters omdraaien p1 en p2 in de enkele parameter p1 - p2. Vervolgens testen we deze nieuwe parameter tegen de waarde nul.
De teststatistiek
De formule voor de teststatistiek wordt gegeven in de bovenstaande afbeelding. Een uitleg van elk van de termen volgt:
- De steekproef uit de eerste populatie heeft een omvang n1. Het aantal successen uit deze steekproef (die niet direct te zien is in bovenstaande formule) is k1.
- De steekproef uit de tweede populatie heeft een omvang n2. Het aantal successen uit deze steekproef is k2.
- De steekproefverhoudingen zijn p1-hoed = k1 / n1 en P2-hat = k2 / n2 .
- Vervolgens combineren of bundelen we de successen van beide voorbeelden en verkrijgen we: p-hat = (k1 + k2) / (n1 + n2).
Wees zoals altijd voorzichtig met de volgorde van bewerkingen bij het berekenen. Alles onder de radicaal moet worden berekend voordat de vierkantswortel wordt genomen.
De P-waarde
De volgende stap is het berekenen van de p-waarde die overeenkomt met onze teststatistiek. We gebruiken een standaard normale verdeling voor onze statistiek en raadplegen een tabel met waarden of gebruiken statistische software.
De details van onze p-waardeberekening zijn afhankelijk van de alternatieve hypothese die we gebruiken:
- Voor Heen: p1 - p2 > 0, berekenen we het aandeel van de normale verdeling dat groter is dan Z.
- Voor Heen: p1 - p2 <0, we berekenen het aandeel van de normale verdeling dat kleiner is dan Z.
- Voor Heen: p1 - p2 ≠ 0, we berekenen het aandeel van de normale verdeling dat groter is dan |Z|, de absolute waarde van Z. Hierna verdubbelen we, om er rekening mee te houden dat we een tweezijdige test hebben, de verhouding.
Beslisregel
Nu nemen we een beslissing over het al dan niet afwijzen van de nulhypothese (en daarmee het accepteren van het alternatief) of het niet afwijzen van de nulhypothese. We nemen deze beslissing door onze p-waarde te vergelijken met het significantieniveau alpha.
- Als de p-waarde kleiner is dan of gelijk is aan alpha, dan verwerpen we de nulhypothese. Dit betekent dat we een statistisch significant resultaat hebben en dat we de alternatieve hypothese gaan accepteren.
- Als de p-waarde groter is dan alpha, dan verwerpen we de nulhypothese niet. Dit bewijst niet dat de nulhypothese waar is. In plaats daarvan betekent het dat we niet overtuigend genoeg bewijs hebben verkregen om de nulhypothese te verwerpen.
Speciale opmerking
De betrouwbaarheidsinterval voor het verschil tussen twee populatie-proporties brengt de successen niet samen, terwijl de hypothesetoets dat wel doet. De reden hiervoor is dat onze nulhypothese dat veronderstelt p1 - p2 = 0. Het betrouwbaarheidsinterval gaat hiervan niet uit. Sommige statistici bundelen de successen voor deze hypothesetest niet en gebruiken in plaats daarvan een enigszins gewijzigde versie van de bovenstaande teststatistiek.