Definitie en voorbeelden van secundaire gegevensanalyse

Secundaire gegevensanalyse is de analyse van gegevens die door iemand anders zijn verzameld. Hieronder bespreken we de definitie van secundaire gegevens, hoe deze door onderzoekers kunnen worden gebruikt en de voor- en nadelen van dit type onderzoek.

Belangrijkste punten: analyse van secundaire gegevens

Primaire gegevens verwijzen naar gegevens die onderzoekers zelf hebben verzameld, terwijl secundaire gegevens verwijzen naar gegevens die door iemand anders zijn verzameld.
Secundaire gegevens zijn beschikbaar uit verschillende bronnen, zoals overheden en onderzoeksinstellingen.
Hoewel het gebruik van secundaire gegevens goedkoper kan zijn, beantwoorden bestaande gegevenssets mogelijk niet alle vragen van een onderzoeker.

Vergelijking van primaire en secundaire gegevens

In het sociaalwetenschappelijk onderzoek zijn de termen primaire data en secundaire data een veel voorkomende term. Primaire gegevens worden verzameld door een onderzoeker of een team van onderzoekers voor het specifieke doel of de analyse in kwestie. Hier bedenkt en ontwikkelt een onderzoeksteam een onderzoeksproject, beslist over een

instagram viewer

bemonsteringstechniek, verzamelt gegevens die zijn ontworpen om specifieke vragen te beantwoorden, en voert hun eigen analyses uit van de gegevens die ze hebben verzameld. In dit geval zijn de mensen die betrokken zijn bij de gegevensanalyse bekend met het onderzoeksontwerp en het gegevensverzamelingsproces.

Secundaire data-analyse, aan de andere kant, is het gebruik van gegevens die is door iemand anders verzameld voor een ander doel. In dit geval stelt de onderzoeker vragen die aan de orde komen door de analyse van een dataset die zij niet betrokken waren bij het verzamelen. De gegevens zijn niet verzameld om de specifieke onderzoeksvragen van de onderzoeker te beantwoorden en zijn in plaats daarvan voor een ander doel verzameld. Dit betekent dat dezelfde dataset in feite een primaire dataset kan zijn voor één onderzoeker en een secundaire dataset voor een andere.

Secundaire gegevens gebruiken

Er zijn enkele belangrijke dingen die moeten worden gedaan voordat secundaire gegevens in een analyse worden gebruikt. Omdat de onderzoeker de gegevens niet heeft verzameld, is het belangrijk dat ze bekend raken met de dataset: hoe de gegevens zijn verzameld, wat de antwoordcategorieën zijn voor elk vraag of al dan niet gewichten moeten worden toegepast tijdens de analyse, of er al dan niet rekening moet worden gehouden met clusters of stratificatie, wie de studiepopulatie was, en meer.

Er zijn veel secundaire gegevensbronnen en datasets beschikbaar voor sociologisch onderzoekwaarvan vele openbaar en gemakkelijk toegankelijk zijn. De Volkstelling Verenigde Staten, de Algemeen sociaal onderzoek, en de American Community Survey zijn enkele van de meest gebruikte secundaire datasets die beschikbaar zijn.

Voordelen van secundaire gegevensanalyse

Het grootste voordeel van het gebruik van secundaire data is dat deze zuiniger kan zijn. Iemand anders heeft de data al verzameld, dus de onderzoeker hoeft geen geld, tijd, energie en middelen te besteden aan deze onderzoeksfase. Soms moet de secundaire dataset worden gekocht, maar de kosten zijn bijna altijd lager dan de kosten van het verzamelen van een vergelijkbaar product gegevensverzameling vanaf nul, die meestal salarissen, reizen en transport, kantoorruimte, apparatuur en andere overhead omvat kosten. Omdat de gegevens al zijn verzameld en meestal worden opgeschoond en opgeslagen in elektronisch formaat, kan de onderzoeker het grootste deel van zijn tijd besteden het analyseren van de gegevens in plaats van de gegevens gereed te maken voor analyse.

Een tweede groot voordeel van het gebruik van secundaire gegevens is de breedte van de beschikbare gegevens. De federale overheid voert talrijke onderzoeken uit op grote nationale schaal die individuele onderzoekers moeilijk zouden kunnen verzamelen. Veel van deze datasets zijn dat ook longitudinaal, wat betekent dat dezelfde gegevens over verschillende perioden van dezelfde populatie zijn verzameld. Hierdoor kunnen onderzoekers trends en veranderingen van fenomenen in de tijd bekijken.

Een derde belangrijk voordeel van het gebruik van secundaire gegevens is dat het gegevensverzamelingsproces vaak een niveau behoudt expertise en professionaliteit die mogelijk niet aanwezig zijn bij individuele onderzoekers of kleine onderzoeksprojecten. Zo wordt de gegevensverzameling voor veel federale datasets vaak uitgevoerd door personeelsleden die gespecialiseerd zijn in bepaalde taken en hebben vele jaren ervaring op dat specifieke gebied en met dat specifieke onderzoek. Veel kleinere onderzoeksprojecten beschikken niet over dat niveau van deskundigheid, omdat veel gegevens worden verzameld door studenten die in deeltijd werken.

Nadelen van secundaire data-analyse

Een groot nadeel van het gebruik van secundaire gegevens is dat deze mogelijk niet de specifieke onderzoeksvragen van de onderzoeker beantwoorden of specifieke informatie bevatten die de onderzoeker graag zou willen hebben. Het is mogelijk ook niet verzameld in de geografische regio of in de gewenste jaren of bij de specifieke populatie waarin de onderzoeker geïnteresseerd is. Een onderzoeker die geïnteresseerd is in het bestuderen van adolescenten, kan bijvoorbeeld tot de conclusie komen dat de secundaire dataset alleen jongeren omvat.

Omdat de onderzoeker de gegevens niet heeft verzameld, hebben ze bovendien geen controle over wat er in de dataset zit. Vaak kan dit de analyse beperken of de oorspronkelijke vragen die de onderzoeker wilde beantwoorden, veranderen. Zo kan een onderzoeker die geluk en optimisme bestudeert, ontdekken dat een secundaire dataset er slechts één bevat variabelen, maar niet beide.

Een gerelateerd probleem is dat de variabelen mogelijk zijn geweest anders gedefinieerd of gecategoriseerd dan de onderzoeker zou hebben gekozen. De leeftijd kan bijvoorbeeld zijn verzameld in categorieën in plaats van als een continue variabele, of ras kan worden gedefinieerd als 'wit' en 'overig' in plaats van categorieën te bevatten voor elke grote race.

Een ander belangrijk nadeel van het gebruik van secundaire gegevens is dat de onderzoeker niet precies weet hoe het gegevensverzamelingsproces is verlopen of hoe goed het is uitgevoerd. De onderzoeker is meestal niet op de hoogte van informatie over hoe ernstig de gegevens worden beïnvloed door problemen zoals een laag responspercentage of verkeerd begrijpen van specifieke enquêtevragen door de respondent. Soms is deze informatie direct beschikbaar, zoals bij veel federale datasets. Veel andere secundaire gegevenssets gaan echter niet vergezeld van dit soort informatie en de analist moet leren tussen de regels te lezen om mogelijke beperkingen van de gegevens te ontdekken.