Definitie van betrouwbaarheid in onderzoek

Betrouwbaarheid is de mate waarin een meetinstrument elke keer dat het wordt gebruikt dezelfde resultaten geeft, ervan uitgaande dat het onderliggende gemeten ding niet verandert.

Belangrijkste punten: betrouwbaarheid

Als een meetinstrument elke keer dat het wordt gebruikt vergelijkbare resultaten oplevert (ervan uitgaande dat wat wordt gemeten in de loop van de tijd hetzelfde blijft), heeft het een hoge betrouwbaarheid.
Goede meetinstrumenten moeten zowel een hoge betrouwbaarheid als een hoge nauwkeurigheid hebben.
Vier methoden die sociologen kunnen gebruiken om de betrouwbaarheid te beoordelen, zijn de test-hertestprocedure, de procedure voor alternatieve vormen, de procedure voor gesplitste helften en de interne consistentieprocedure.

Een voorbeeld

Stel je voor dat je de betrouwbaarheid van een thermometer in je huis probeert te beoordelen. Als de temperatuur in een kamer hetzelfde blijft, geeft een betrouwbare thermometer altijd dezelfde waarde. Een thermometer die niet betrouwbaar is, zou veranderen, zelfs als de temperatuur dat niet doet. Merk echter op dat de thermometer niet nauwkeurig hoeft te zijn om betrouwbaar te zijn. Het kan bijvoorbeeld altijd drie graden te hoog zijn. De mate van betrouwbaarheid heeft in plaats daarvan te maken met de voorspelbaarheid van de relatie met wat er wordt getest.

instagram viewer

Methoden om betrouwbaarheid te beoordelen

Om de betrouwbaarheid te beoordelen, moet het gemeten ding meer dan eens worden gemeten. Als u bijvoorbeeld de lengte van een bank wilt meten om er zeker van te zijn dat deze door een deur past, kunt u deze twee keer meten. Als u tweemaal dezelfde meting krijgt, kunt u erop vertrouwen dat u betrouwbaar hebt gemeten.

Er zijn vier procedures om de betrouwbaarheid van een test te beoordelen. (Hier verwijst de term "test" naar een groep uitspraken op een vragenlijst, die van een waarnemer kwantitatief of kwalitatief evaluatie, of een combinatie van beide.)

De procedure voor opnieuw testen

Hier wordt dezelfde test twee of meer keren gegeven. Je zou bijvoorbeeld kunnen maak een vragenlijst met een set van tien uitspraken om het vertrouwen te beoordelen. Deze tien verklaringen worden vervolgens tweemaal op twee verschillende tijdstippen aan een onderwerp gegeven. Als de respondent beide keren vergelijkbare antwoorden geeft, kunt u ervan uitgaan dat de vragen de antwoorden van het onderwerp betrouwbaar hebben beoordeeld.

Een voordeel van deze methode is dat voor deze procedure slechts één test hoeft te worden ontwikkeld. Er zijn echter enkele nadelen aan de test-hertestprocedure. Tussen testtijden kunnen gebeurtenissen plaatsvinden die de antwoorden van de respondenten beïnvloeden; antwoorden kunnen in de loop van de tijd veranderen, simpelweg omdat mensen veranderen en groeien in de tijd; en het onderwerp kan zich de tweede keer aanpassen aan de test, dieper nadenken over de vragen en hun antwoorden opnieuw evalueren. In het bovenstaande voorbeeld zijn sommige respondenten bijvoorbeeld meer zelfvertrouwen geworden tussen de eerste en de tweede testsessie, die het moeilijker zou maken om de resultaten van de test-hertest te interpreteren procedure.

De procedure voor alternatieve formulieren

In de procedure voor alternatieve vormen (ook wel genoemd parallelle vormen betrouwbaarheid) worden twee tests gegeven. U kunt bijvoorbeeld twee sets van vijf verklaringen maken die het vertrouwen meten. De proefpersonen zouden worden gevraagd om elk van de vragenlijsten met vijf verklaringen in te vullen. Als de persoon voor beide tests vergelijkbare antwoorden geeft, kun je ervan uitgaan dat je het concept betrouwbaar hebt gemeten. Een voordeel is dat cueing minder een factor zal zijn omdat de twee tests verschillend zijn. Het is echter belangrijk om ervoor te zorgen dat beide alternatieve versies van de test inderdaad hetzelfde meten.

De Split-Halves Procedure

In deze procedure wordt eenmaal een enkele test gegeven. Aan elke helft wordt afzonderlijk een cijfer toegekend en van elke helft worden de cijfers vergeleken. U kunt bijvoorbeeld een set van tien stellingen op een vragenlijst hebben om het vertrouwen te beoordelen. Respondenten doen de test en de vragen worden vervolgens opgesplitst in twee subtests van elk vijf items. Als de score op de eerste helft de score op de tweede helft weerspiegelt, kun je aannemen dat de test het concept betrouwbaar heeft gemeten. Aan de positieve kant spelen geschiedenis, rijping en cueing niet. De scores kunnen echter sterk variëren, afhankelijk van de manier waarop de test in twee helften is verdeeld.

De interne consistentieprocedure

Hier wordt dezelfde test één keer afgenomen en wordt de score gebaseerd op gemiddelde gelijkenis van reacties. In een vragenlijst met tien stellingen om het vertrouwen te meten, kan elke reactie bijvoorbeeld worden gezien als een subtest met één stelling. De overeenkomst in reacties op elk van de tien stellingen wordt gebruikt om de betrouwbaarheid te beoordelen. Als de respondent niet alle tien stellingen op een vergelijkbare manier beantwoordt, dan mag men aannemen dat de test niet betrouwbaar is. Een manier waarop onderzoekers de interne consistentie kunnen beoordelen, is door te gebruiken statistische software rekenen Cronbach's alpha.

Met de interne consistentieprocedure zijn geschiedenis, rijping en cueing geen overweging. Het aantal uitspraken in de test kan echter van invloed zijn op de beoordeling van betrouwbaarheid bij interne beoordeling.