Cover
Comença ara de franc Class8_Niet-reactief+onderzoek+en+secundaire+data-analyse_2025.pptx
Summary
# Niet-reactief onderzoek en secundaire data-analyse
Dit onderwerp verkent methoden voor het verzamelen van gegevens waarbij de onderzoeker de onderzochten niet direct beïnvloedt, met een focus op verschillende soorten niet-reactieve data en de analyse van secundaire databronnen.
### 1.1 Inleiding
Kritiek op de klassieke surveymethode suggereert dat surveyonderzoek invasief kan zijn en de sociale werkelijkheid kan vertekenen. In het midden van de jaren 1960 pleitten Web et al. voor niet-reactief onderzoek, waarbij waarnemingen plaatsvinden zonder dat de onderzochten zich bewust zijn van het onderzoek. Dit wordt ook wel 'unobtrusive measurement' genoemd, waarbij de onderzoeker de natuurlijke wereld niet binnendringt. Er wordt een onderscheid gemaakt tussen reactieve en niet-reactieve databronnen, en tussen primaire en secundaire databronnen.
### 1.2 Reactieve versus niet-reactieve databronnen
* **Reactieve data**: Worden uitgelokt door de onderzoeker. Voorbeelden hiervan zijn observatiemethoden, experimentele observatie, en intensieve of extensieve bevragingen (diepte-interviews, focusgroepen, face-to-face, telefoon, post, internet).
* **Niet-reactieve data**: Bestaan onafhankelijk van het optreden van de onderzoeker en worden dus niet beïnvloed door de onderzoeker.
### 1.3 Primaire versus secundaire databronnen
* **Primaire databronnen**: Data die door de onderzoeker zelf worden verzameld.
* **Voordelen**: De onderzoeker heeft meer invloed op de aard van de data (vragen, registraties), meer zicht op selectiviteit (aselecte steekproef, randomisatie), en kan de onderzoekssituatie structureren om verstorende factoren te beheersen.
* **Nadelen**: Vaak hoge kostprijs, tijdsintensief en 'obtrusive measurement'.
* **Secundaire databronnen**: Data die door derden zijn verzameld. Voorbeelden zijn ambtelijk statistisch materiaal, wetenschappelijke literatuur en data verzameld door andere onderzoekers.
* **Voordelen**: Kosteneffectiviteit, efficiëntie (onderzoek sneller en beter te plannen), en data zijn doorgaans niet beïnvloed door het gedrag van de onderzoeker (hoewel hier uitzonderingen zijn).
* **Nadelen**: Selectieprocessen die buiten de onderzoeker liggen (registratie door anderen, beïnvloed door beleid), bepaalde gegevens worden niet geregistreerd, bepaalde vragen worden niet gesteld. Dit leidt tot volledige afhankelijkheid van wat anderen hebben gedaan en verschillende soorten vertekening.
### 1.4 Soorten niet-reactieve gegevens
Er worden drie belangrijke soorten niet-reactieve gegevens onderscheiden:
1. Teksten (inhoudsanalyse)
2. Administratieve data en officiële statistieken
3. Big data
#### 1.4.1 Teksten: inhoudsanalyse
* **Inleiding**: Teksten zijn 'boodschappen' die mensen produceren via diverse media zoals kranten, boeken, radio, tv, politieke propaganda, officiële documenten (processen-verbaal, wetteksten), en persoonlijke documenten (brieven, dagboeken). Het kernelement is dat deze bronnen tekst of symbolen bevatten, meestal bewust geproduceerd.
* **Definitie**: Inhoudsanalyse is een methode om informatie uit teksten te halen en deze wetenschappelijk te analyseren. Het richt zich op de wereld van betekenissen, waarden en normen zoals die tot uiting komt in symbolische elementen. Het wordt vaak toegepast in communicatiewetenschappen en politieke wetenschappen en kent zowel kwantitatieve als kwalitatieve varianten. De kernvraag is: wie zegt wat, aan wie, hoe, waarom en met welk effect?
* **Voorbeeld onderzoeksvragen**: Hoe evolueert de berichtgeving over een specifieke oorlog in het nieuws? Hoe vaak komen vrouwen in het nieuws voor en in welke rol? Welke krant besteedt de meeste aandacht aan een bepaalde beweging?
* **Formele en gestructureerde vorm**: Kwantitatieve meting van frequentie van thema's en woorden, met expliciete en a priori geformuleerde regels en classificatieschema's.
* **Procedure**:
1. Onderzoeksvraag formuleren.
2. Populatie van analyse-eenheden bepalen.
3. Een toevalsteekproef trekken.
4. Geslecteerde teksten coderen: kwantificeren van de inhoud (frequentie, volume, richting, intensiteit).
* **Analyse-eenheden en steekproef**: Analyse-eenheden kunnen kranten, pamfletten, personen, etc. zijn. Bij het trekken van een steekproef is het belangrijk te bepalen welk type media of teksten worden onderzocht en de tijdsperiode af te bakenen, waarbij random sampling wordt aanbevolen.
* **Coderen**: Twee belangrijke elementen zijn het codeerschema (een tabel met codes, waarbij kolommen dimensies en rijen analyse-eenheden voorstellen) en de codeurshandleiding (instructies voor codeurs, lijst van categorieën, instructies bij overlap).
* **Richtlijnen**: Goed afgebakende en exhaustieve dimensies en categorieën, duidelijke instructies.
* **Codeurbetrouwbaarheid**: De mate waarin verschillende codeurs dezelfde resultaten bereiken. Dit is groter bij **manifest coderen** (objectieve, ondubbelzinnige elementen zoals frequentie en omvang) dan bij **latent coderen** (tussen de regels lezen, zoals richting en intensiteit).
* **Voor- en nadelen**:
* **Voordelen**: Gemakkelijk voor longitudinale analyse, onopvallend, gemakkelijke toegang tot bronnen.
* **Nadelen**: Authenticiteit, geloofwaardigheid en representativiteit van documenten kunnen twijfelachtig zijn, interpretaties door codeurs, onmogelijk om 'waarom'-vragen te beantwoorden, potentieel a-theoretische benadering.
* **Voorbeelden**:
* Thomas & Znaniecki (1958) analyseerde brieven en dagboeken van Poolse immigranten om inzicht te krijgen in aanpassing en integratie (hoewel dit nog geen formele kwantitatieve inhoudsanalyse was).
* Lasswell & Berelson voerden een vroege formele inhoudsanalyse uit op fascistische propaganda, waarbij thema's, stijlen en effecten van retoriek werden onderzocht. De 'Lasswell Value Dictionary' (1968) classificceerde inhoud op basis van trefwoorden voor kwantitatieve verwerking.
* Budge, Robertson & Hearl (1987) analyseerden partij-ideologieën en strategieën in 19 democratische landen met hun 'Standard Coding Frame' en factoranalyse om dimensies zoals economisch links-rechts, progressief-conservatief, en unitarisme-federalisme te identificeren.
* Het Manifesto Project Database verzamelt verkiezingsprogramma's van politieke partijen wereldwijd.
* Het Nieuwsarchief biedt een archief van nieuwsuitzendingen met manifeste voorcodering.
#### 1.4.2 Administratieve data en officiële statistieken
* **Inleiding**: Officiële statistieken groeien sinds de 19e eeuw, waarbij overheidsinstanties de maatschappij inventariseren. Deze data bestrijken vrijwel elk terrein van het bestaan (geboorte, sterfte, migratie, onderwijs, arbeid) en zijn een belangrijke bron voor sociaalwetenschappelijk onderzoek. Officiële statistiek is kwantitatief onderzoek op basis van documenten geproduceerd door overheidsinstanties voor eigen gebruik.
* **Belangrijke bronnen**: Bevolkingsregisters, volkstellingen (censussen), en surveys (zoals de Labour Force Survey, EU-SILC).
* **Verscheidenheid aan thema's**: Demografische, economische, sociale indicatoren, mobiliteit, leefmilieu en energie.
* **Volkstellingen**: Waren tot 2001 exhaustief en verzamelden socio-demografische kenmerken, huishoudenssamenstelling, huisvesting, opleiding, en werkgelegenheid. Daarnaast bestaan landbouw-, industrie-, handels-, financiële, verkeers- en juridische statistieken. De Sociaal-Economische Enquête (2001) is een voorbeeld van een dergelijke uitgebreide dataverzameling.
* **Nadelen van officiële statistiek**:
* Effectmaten geven geen informatie over achterliggende sociale processen.
* Afbakening van populaties en operationalisering van variabelen komen vaak niet overeen met de intenties van de onderzoeker.
* Definities en registraties veranderen door de tijd heen.
* Niet vrij van bias: zelfmoordstatistieken, huishoudensstatistieken, onderregistratie van emigratie.
* Achterstand in publicatie: meerdere jaren op tal van reeksen.
* Sommige onderwerpen worden niet bevraagd.
* Ontsluitbaarheid kan een probleem zijn; in België zijn individuele data (geanonimiseerd) niet publiek beschikbaar zoals in sommige andere landen.
* Gevoeligheid voor privacy heeft geleid tot boycot van volkstellingen en de opkomst van surveys.
* Integratie van verschillende databanken op individueel niveau kan privacy schenden.
* **Online administratieve gegevensbronnen**: Websites zoals Statistics Belgium, Eurostat, OECD Statistics en de United Nations Statistics Division bieden toegang tot data.
#### 1.4.3 Big data
* **Inleiding**: In onze hoogtechnologische wereld ontstaat een enorm datapotentieel door digitale voetafdrukken. Big data verwijst naar digitale gegevens die automatisch worden gegenereerd door technologische systemen en wordt gekenmerkt door de '3 V's': Volume (enorme databanken), Velocity (real-time dataverzameling) en Variety (enorme variabiliteit).
* **Soorten big data**:
* **Social media**: Facebook, X, Instagram, internetfora, professionele netwerksites.
* **Transactiedata**: Gegevens die ontstaan bij elektronische bankverrichtingen, kredietkaarten, klantenkaarten, consumptiepatronen (Netflix, Spotify). Deze zijn vaak minder gevoelig voor reactiviteit dan sociale mediadata.
* **Smartphone gegevens**: Locatiegegevens.
* **Potentieel en foutenbronnen**: Hoewel big data een enorm potentieel biedt, zijn er veel foutenbronnen zoals het probleem van 'coverage' (digitale 'have-nots' blijven buiten beschouwing), 'impression management' (fraude), gepersonaliseerde marketing en beschikbaarheid van data (bv. Facebook).
* **Voorbeeld: Big Data in Migratieonderzoek**: Een studie combineerde Twitter- en mobiele telefoongegevens om massale verplaatsingen richting EU-grenzen te observeren na de Turkse grensopening. Mobiele telefoon data waren betrouwbaar voor het meten van mobiliteit, terwijl Twitter-data inzicht gaf in sentiment en publieke opinie. De combinatie leverde een rijk beeld op van kwantitatieve mobiliteit en kwalitatieve context, maar benadrukte het belang van ethiek, privacy en representativiteit.
### 1.5 Voor- en nadelen van niet-reactieve en secundaire data
* **Voordelen**:
* Toegankelijkheid van onderwerpen die via andere methodes niet bestudeerd kunnen worden.
* 'Unobtrusive measurement': geen stimulus van de onderzoeker (hoewel andere bronnen van bias bestaan).
* Mogelijkheid tot longitudinale waarnemingen en analyse van sequenties van gebeurtenissen.
* Historisch perspectief en meting van trends door tijdsreeksen.
* Kostenbesparend, meer tijd voor data-analyse, relatief goedkope verwerking.
* Herhaalbaarheid en verifieerbaarheid kunnen betrouwbaarheid en validiteit controleren.
* **Nadelen**:
* **Bias primaire bron**: Soms moeilijk te achterhalen of te corrigeren (bv. niet alles wordt gedeclareerd in ambtelijke statistiek, lacunes in persoonlijke documenten).
* **Selectie-bias**: Documenten zijn niet altijd gegenereerd door een representatieve steekproef (bv. schriftelijke bronnen eigen aan hogere sociale klassen).
* **Onvolledigheid**: Verslagen, notulen en getuigenissen zijn vaak slechts beknopte weergaven.
* **Databeschikbaarheid**: Classificatie en verwerking van documenten is vaak niet uniform, wat vergelijkbaarheid en verwerking bemoeilijkt (onderzoekerbias).
* **Interpretatie**: Interne validiteit kan twijfelachtig zijn; de betekenis van de primaire bron is niet altijd eenduidig, wat leidt tot onderzoekerbias.
> **Tip:** Bij het gebruik van secundaire data is het cruciaal om de oorsprong, het verzamelingsproces en de mogelijke beperkingen van de data grondig te begrijpen alvorens tot analyse over te gaan.
> **Tip:** Wees kritisch op de 'manifeste' inhoud van documenten en overweeg de 'latente' betekenissen en de context waarin ze zijn geproduceerd.
---
# Inhoudsanalyse
Inhoudsanalyse is een methode om systematisch en objectief informatie uit teksten te halen, waarbij de nadruk ligt op de analyse van communicatie-uitingen.
### 2.1 Introductie tot inhoudsanalyse
Inhoudsanalyse wordt beschouwd als een niet-reactieve onderzoeksmethode, wat betekent dat de onderzoeker de geobserveerde realiteit niet beïnvloedt. Dit staat in contrast met reactieve methoden zoals surveys, waarbij de aanwezigheid van de onderzoeker reacties kan uitlokken. Inhoudsanalyse richt zich op 'boodschappen' die mensen produceren, variërend van krantenartikelen, boeken, radio- en tv-uitzendingen, politieke propaganda tot officiële documenten en persoonlijke geschriften. Het kernidee is het analyseren van de betekenissen, waarden en normen die in deze symbolische elementen tot uiting komen.
Onderzoeksvragen die met inhoudsanalyse beantwoord kunnen worden, hebben vaak betrekking op wie wat zegt, tegen wie, hoe, waarom en met welk effect. Typische vragen zijn bijvoorbeeld:
* Hoe evolueert de frequentie van rapportering van een bepaald thema in het nieuws over tijd?
* Hoe vaak komen bepaalde groepen in beeld in de media en in welke rol?
* Welke onderwerpen krijgen de meeste aandacht in specifieke publicaties?
### 2.2 Definitie en procedure van inhoudsanalyse
Berelson definieerde inhoudsanalyse in 1952 als een onderzoekstechniek voor de objectieve, systematische en kwantitatieve beschrijving van de manifeste inhoud van communicatie. De focus ligt hierbij op de massacommunicatie, waarbij de inhoud wordt gekwantificeerd in vooraf gedefinieerde categorieën. Systematiek en objectiviteit worden nagestreefd door duidelijke, vooraf opgestelde regels voor categorisering en codering.
De procedure van inhoudsanalyse omvat de volgende stappen:
1. **Onderzoeksvraag formuleren:** Dit bepaalt de focus van de analyse.
2. **Populatie van analyse-eenheden bepalen:** Dit kan variëren van kranten, pamfletten tot personen.
3. **Toevalsteekproef trekken:** Selectie van de te analyseren teksten of communicatie-uitingen.
4. **Coderen van geselecteerde teksten:** Dit is de kern van de kwantificering en omvat het meten van de inhoud. Hierbij kunnen verschillende aspecten worden onderzocht:
* **Frequentie:** Hoe vaak komt een element voor?
* **Volume:** Hoeveel ruimte neemt een element in?
* **Richting:** Wat is de teneur of sentiment van de boodschap?
* **Intensiteit:** Hoe sterk is de boodschap?
Bij het coderen zijn twee belangrijke elementen cruciaal:
* **Het codeerschema:** Een tabel waarin de data worden ingevuld, met kolommen voor te analyseren dimensies en rijen voor de analyse-eenheden.
* **De codeurshandleiding:** Bevat gedetailleerde instructies voor codeurs, inclusief een lijst van alle mogelijke categorieën, richtlijnen voor overlappingen, en definitie van dimensies.
**Tip:** Het gebruik van bestaande handleidingen voor inhoudsanalyse kan als startpunt dienen, maar het is essentieel dat dimensies en categorieën goed zijn afgebakend, overlappen minimaliseren, en waar mogelijk uitputtend zijn.
Een belangrijk aspect is de **codeurbetrouwbaarheid**, die de mate aangeeft waarin verschillende codeurs tot dezelfde resultaten komen. Dit is met name relevant bij het onderscheid tussen **manifest coderen** (objectief en ondubbelzinnig te coderen elementen zoals frequentie en omvang) en **latent coderen** (interpretatie van tussen de regels door, zoals richting en intensiteit). Codeurbetrouwbaarheid is doorgaans groter bij manifest coderen.
### 2.3 Voor- en nadelen van inhoudsanalyse
**Voordelen:**
* **Longitudinale analyse:** Gemakkelijk om trends en veranderingen over tijd te analyseren.
* **Onopvallend/discreet:** De onderzoeker verstoort de natuurlijke setting niet.
* **Gemakkelijke toegang tot bronnen:** Veel communicatie-uitingen zijn publiek toegankelijk.
* **Toegankelijkheid van bepaalde onderwerpen:** Onderwerpen die moeilijk via andere methoden te bestuderen zijn, kunnen via tekstanalyse benaderd worden.
* **Longitudinale waarnemingen:** Analyse van sequenties van gebeurtenissen bij individuen of in de tijd.
* **Historisch perspectief:** Tijdsreeksen maken het mogelijk trends te meten.
* **Kostenbesparend:** Vaak goedkoper dan nieuwe data te verzamelen.
* **Herhaalbaarheid en verifieerbaarheid:** De betrouwbaarheid en validiteit kunnen worden gecontroleerd.
**Nadelen:**
* **Authenticiteit, geloofwaardigheid en representativiteit:** De aard van de bronnen (bv. persoonlijke documenten) kan twijfel oproepen.
* **Interpretaties door codeurs:** Subjectiviteit kan optreden, vooral bij latent coderen.
* **Onmogelijkheid om 'waarom'-vragen te beantwoorden:** Inhoudsanalyse beschrijft wat er is, niet per se de diepere motivaties erachter.
* **A-theoretische benadering:** Er is een risico op het isoleren van de analyse van bredere theoretische kaders.
* **Bias van primaire bron:** De oorspronkelijke maker van de tekst kan al eigen biases hebben, die soms moeilijk te achterhalen of corrigeren zijn.
* **Selectie-bias van documenten:** Documenten zijn mogelijk niet gegenereerd door een representatieve steekproef van de populatie.
* **Onvolledigheid:** Verslagen, notulen en getuigenissen kunnen beknopte weergaven zijn.
* **Databeschikbaarheid en uniformiteit:** Classificatie en verwerking van documenten zijn vaak niet uniform, wat vergelijkbaarheid bemoeilijkt.
* **Interpretatie en interne validiteit:** De betekenis van primaire bronnen is niet altijd eenduidig, wat leidt tot onderzoekerbias.
### 2.4 Voorbeelden van toegepaste inhoudsanalyse
Historisch gezien legden Thomas & Znaniecki met hun studie van briefwisseling en dagboeken van Poolse immigranten een basis voor de analyse van persoonlijke documenten, hoewel dit nog niet de formele kwantitatieve inhoudsanalyse was.
Lasswell en Berelson deden een aanzet tot de formele inhoudsanalyse door de analyse van fascistische propaganda, waarbij thema's, stijlen van politieke retoriek en effecten op het publiek werden onderzocht. De "Lasswell Value Dictionary" bood een classificatie van trefwoorden voor kwantitatieve verwerking.
Na de Tweede Wereldoorlog werd de methode verder ontwikkeld door politicologen, met studies zoals:
* **Budge, Robertson & Hearl (1987) - Ideology, Strategy & Party Change:** Deze studie vergeleek partij-ideologieën en -strategieën in 19 democratische landen door middel van factoranalyse op basis van programmateksten. Drie hoofddimensies voor België werden geïdentificeerd: economisch links-rechts, progressief-conservatief (klerikaal), en unitarisme-federalisme.
* **Manifesto Project Database:** Een omvangrijke verzameling verkiezingsprogramma's van politieke partijen uit meer dan 50 landen sinds 1945, beheerd door het Wissenschaftszentrum Berlin für Sozialforschung.
* **Het Nieuwsarchief (VTM en VRT):** Een archief van nieuwsuitzendingen sinds 2003, met manifeste voorcodering van hoofdonderwerp, actoren, spreektijd, etc.
**> Tip:** Het analyseren van historische politieke programma's kan inzicht geven in de evolutie van politieke doctrines en de manier waarop maatschappelijke thema's door partijen worden benaderd.
### 2.5 Soorten niet-reactieve gegevens (breder kader)
Inhoudsanalyse is één type niet-reactieve gegevens. Andere belangrijke categorieën zijn:
* **Administratieve data en officiële statistieken:** Gegevens die door overheidsinstanties worden verzameld voor hun eigen gebruik. Denk hierbij aan bevolkingsregisters, volkstellingen, en diverse surveys (bv. Labour Force Survey). Deze bronnen bieden kwantitatieve informatie over demografie, economie en sociale indicatoren.
* **Nadelen:** Deze data zijn niet altijd afgestemd op de onderzoeksvraag van de sociaalwetenschapper, definities en registraties kunnen wijzigen, en er kan sprake zijn van onderregistratie of achterstand. Ook gevoeligheid voor privacy kan beperkingen opleggen.
* **Big data:** Enorme hoeveelheden digitale gegevens die automatisch worden gegenereerd door technologische systemen. Kenmerken zijn het enorme **volume**, de hoge **snelheid** (velocity) van dataverzameling, en de grote **variëteit** aan datatypen.
* **Soorten:** Sociale media data (Facebook, Twitter), transactiedata (bankverrichtingen, creditcards, consumptiepatronen), en smartphonegegevens (locatiegegevens).
* **Uitdagingen:** Foutenbronnen zoals de 'technologische have-nots' die buiten beschouwing blijven, impression management, en data-beschikbaarheid, evenals ethische en privacykwesties.
* **Voorbeeld:** Het combineren van Twitter-data en mobiele telefoon data kan inzicht geven in massale verplaatsingen en de bijbehorende publieke opinie, zoals in migratieonderzoek.
**> Tip:** Hoewel officiële statistieken en big data enorme potentie hebben, is het cruciaal om altijd kritisch te kijken naar de methodologie, mogelijke biases, en de beperkingen van de data.
---
**Opdracht:** Bedenk een multiple choice vraag op basis van hoofdstuk 10, bestaande uit 9 stellingen waaronder één foutieve stelling.
**Vraag:** Welke van de volgende stellingen over inhoudsanalyse is ONJUIST?
a) Inhoudsanalyse is een reactieve onderzoeksmethode waarbij de onderzoeker de geobserveerde realiteit beïnvloedt.
b) Een belangrijke stap in de procedure van inhoudsanalyse is het trekken van een toevalsteekproef uit de populatie van analyse-eenheden.
c) Frequentie, volume, richting en intensiteit zijn vier mogelijke aspecten die bij inhoudsanalyse gekwantificeerd kunnen worden.
d) De definitie van Berelson benadrukt de objectieve, systematische en kwantitatieve beschrijving van de manifeste inhoud van communicatie.
e) Een voordeel van inhoudsanalyse is de mogelijkheid om longitudinale analyses uit te voeren.
f) Intercodeurbetrouwbaarheid verwijst naar de mate waarin verschillende codeurs dezelfde resultaten bereiken.
g) Latent coderen focust op elementen die objectief en ondubbelzinnig te coderen zijn, zoals de frequentie van een woord.
h) Een nadeel van inhoudsanalyse kan zijn dat het moeilijk is om 'waarom'-vragen te beantwoorden.
i) De Manifesto Project Database is een voorbeeld van een databank met verkiezingsprogramma's van politieke partijen.
**Foutieve stelling:** a) Inhoudsanalyse is een reactieve onderzoeksmethode waarbij de onderzoeker de geobserveerde realiteit beïnvloedt. (Correctie: Inhoudsanalyse wordt beschouwd als een *niet-reactieve* methode.)
---
# Administratieve data en officiële statistieken
Hier is de samenvatting voor het onderwerp "Administratieve data en officiële statistieken", opgesteld als een studiehandleiding voor een examen.
## 3. Administratieve data en officiële statistieken
Dit deel van het document bespreekt het gebruik van gegevens die door overheidsinstanties worden verzameld, zoals bevolkingsregisters en volkstellingen, als bronnen voor sociaalwetenschappelijk onderzoek, waarbij zowel de voordelen als de nadelen worden belicht.
### 3.1 Officiële statistieken
Officiële statistieken zijn het resultaat van kwantitatief onderzoek dat is gebaseerd op allerlei documenten die door overheidsinstanties voor eigen gebruik worden geproduceerd. De groei van officiële statistieken is merkbaar sinds de 19e eeuw, waarbij overheidsinstanties systematisch inventariseren wat er in de samenleving gebeurt om een statistische beschrijving te verkrijgen.
#### 3.1.1 Geïnventariseerde terreinen
Vrijwel elk terrein van ons bestaan kan onderwerp zijn van inventarisatie, waaronder:
* Geboorte
* Sterfte
* Migratie
* Onderwijs
* Arbeid
Deze gegevens vormen een belangrijke bron voor sociaalwetenschappelijk onderzoek, waarbij probleemstellingen via ambtelijke statistiek kunnen worden opgelost.
#### 3.1.2 Belangrijke bronnen
Drie belangrijke bronnen van officiële statistieken worden onderscheiden:
* Bevolkingsregisters
* Volkstellingen of censussen
* Surveys (zoals de Labour Force Survey, EU-SILC)
De verscheidenheid aan thema's die door officiële statistieken worden bestreken, omvat onder andere demografische gegevens, economische indicatoren, sociale indicatoren, mobiliteit, leefmilieu en energie.
#### 3.1.3 Volkstellingen
Volkstellingen, zoals die in België van 1848 tot 2001, hebben als doel een uitputtende registratie van alle officiële inwoners. De variabelen die hierbij worden verzameld, omvatten socio-demografische kenmerken, huishoudenspositie en -samenstelling, huisvestingskenmerken, schoolloopbaan en onderwijsniveau, en werkgelegenheid (beroep, sector). Daarnaast bestaan er ook landbouwstatistieken, industriële statistieken, handels- en financiële statistieken, verkeersstatistieken en juridische statistieken.
> **Tip:** Volkstellingen kunnen gebruikt worden voor prospectieve en retrospectieve longitudinale designs, waardoor trends over tijd kunnen worden geanalyseerd.
#### 3.1.4 Nadelen van officiële statistiek
Ondanks de waarde van officiële statistieken, kleven er ook aanzienlijke nadelen aan het gebruik ervan voor sociaalwetenschappelijk onderzoek:
* **Beperkte informatie over achterliggende processen:** Effectmaten bieden geen inzicht in de sociale processen die aan de cijfers ten grondslag liggen.
* **Verschillende operationalisering:** De wijze waarop een populatie is afgebakend of een variabele is geoperationaliseerd, komt vaak niet overeen met de specifieke bedoelingen van de onderzoeker.
* **Wijzigende definities en registraties:** Door de tijd heen kunnen definities en registratieprocedures wijzigen, wat de vergelijkbaarheid bemoeilijkt.
* **Niet vrij van bias:** Statistieken kunnen inherent bevooroordeeld zijn. Voorbeelden hiervan zijn:
* Statistieken van doodsoorzaken die afhankelijk zijn van de diagnose van overlijdensoorzaak.
* Zelfmoordstatistieken die geen zicht bieden op verborgen gevallen.
* Huishoudensstatistieken die moeite hebben met het identificeren van ongehuwd samenwonen.
* **Onderregistratie:** Bepaalde fenomenen kunnen ondergeregistreerd worden, zoals emigratie.
* **Achterstand in data:** Voor veel reeksen bestaat een achterstand van meerdere jaren, wat real-time analyse bemoeilijkt.
* **Selectieve thema's:** Niet alle onderwerpen worden bevraagd.
* **Ontsluitbaarheid en privacy:** De mate van ontsluitbaarheid van individuele gegevens varieert per land. In België zijn geanonimiseerde en niet-identificeerbare individuele gegevens niet zomaar publiek beschikbaar, in tegenstelling tot bijvoorbeeld ‘public use tapes’ in andere landen. De gevoeligheid voor privacy is sinds de jaren 1960 toegenomen, wat heeft geleid tot boycots van volkstellingen in landen als Duitsland en Nederland en een verschuiving naar surveys. Integratie van verschillende databanken op individueel niveau kan leiden tot schending van privacy.
> **Tip:** Hoewel officiële statistieken nadelen hebben, worden ze vaak nog (onder)gewaardeerd als een waardevolle onderzoeksbron. Het is cruciaal om de beperkingen van de data te erkennen en hier rekening mee te houden in de analyse.
#### 3.1.5 Online administratieve gegevensbronnen
Moderne administratieve gegevens zijn steeds vaker online toegankelijk via platforms zoals:
* Statistics Belgium (statbel.fgov.be)
* Eurostat Statistics Database (ec.europa.eu/eurostat)
* OECD Statistics (stats.oecd.org)
* United Nations Statistics Division (unstats.un.org)
Deze bronnen bieden een schat aan geaggregeerde data die kan worden gebruikt voor sociaalwetenschappelijk onderzoek.
### 3.2 Voor- en nadelen van niet-reactieve en secundaire data-analyse
Niet-reactieve gegevens bestaan onafhankelijk van het optreden van de onderzoeker, waardoor ze niet beïnvloed worden door de onderzoeker. Secundaire data zijn gegevens die door derden zijn verzameld. Deze benaderingen bieden specifieke voordelen maar kennen ook beperkingen.
#### 3.2.1 Voordelen van niet-reactieve en secundaire data
* **Toegankelijkheid van bepaalde onderwerpen:** Ze maken het mogelijk om onderwerpen te bestuderen die via andere methoden moeilijk of niet toegankelijk zijn.
* **Onopvallende meting (Unobtrusive measurement):** Er is geen directe stimulus van de onderzoeker die het gedrag van de onderzochte beïnvloedt, hoewel andere bronnen van bias wel aanwezig kunnen zijn.
* **Longitudinale waarnemingen:** De analyse van sequenties van gebeurtenissen bij individuen of tijdsreeksen is vaak goed mogelijk, wat trends kan blootleggen.
* **Historisch perspectief:** Tijdsreeksen, vaak voorkomend in secundaire data, maken het mogelijk om trends op lange termijn te bestuderen.
* **Kostenbesparend en efficiënt:** Het verzamelen van nieuwe data is vaak duur en tijdrovend. Het gebruik van bestaande data bespaart kosten en tijd, waardoor meer nadruk kan liggen op data-analyse en verwerking.
* **Herhaalbaarheid en verifieerbaarheid:** De betrouwbaarheid en validiteit van de data kunnen vaak worden gecontroleerd, wat bijdraagt aan de wetenschappelijke stevigheid van het onderzoek.
#### 3.2.2 Nadelen van niet-reactieve en secundaire data
* **Bias van de primaire bron:** Er kan sprake zijn van vertekening in de oorspronkelijke data die soms moeilijk te achterhalen of te corrigeren is. Bij ambtelijke statistiek worden bijvoorbeeld niet alle gegevens gedeclareerd, wat lacunes oplevert. Persoonlijke documenten kunnen ook selectief zijn in wat er wel en niet wordt vermeld.
* **Selectiebias:** Documenten zijn niet altijd gegenereerd door een representatieve steekproef. Schriftelijke bronnen zijn bijvoorbeeld vaker afkomstig uit hogere sociale klassen.
* **Onvolledigheid:** Verslagen, notulen en getuigenissen zijn vaak slechts beknopte weergaven, wat historische kritiek noodzakelijk maakt.
* **Databeschikbaarheid en uniformiteit:** De classificatie en verwerking van documenten zijn vaak niet uniform, wat vergelijkbaarheid en verwerking kan bemoeilijken. Classificatie en codering kunnen leiden tot onderzoekerbias.
* **Interpretatie en interne validiteit:** De betekenis van de primaire bron is niet altijd eenduidig, waardoor de interpretatie van de onderzoeker subjectief kan zijn en onderzoekerbias kan introduceren.
* **Gevaar voor subjectivisme:** Vooral bij kwalitatieve analyse van niet-reactieve bronnen kan de interpretatie van de onderzoeker sterk subjectief zijn.
* **Herhaalbaarheid:** Vanwege de specifieke context en situatie zijn niet-reactieve onderzoeksresultaten vaak niet direct herhaalbaar, zeker niet in een rigide zin.
* **Generaliseerbaarheid:** Observaties die beperkt zijn tot een specifieke locatie of context kunnen de generaliseerbaarheid van de bevindingen beperken.
* **Ethische overwegingen:** Hoewel de data zelf niet-reactief zijn, kunnen er ethische bezwaren rijzen bij het hergebruik van data, vooral als deze indirect herleidbaar zijn tot individuen.
> **Tip:** Bij het werken met secundaire data is het cruciaal om de oorsprong, verzamelingsmethoden en mogelijke beperkingen van de data grondig te onderzoeken. Een kritische houding is essentieel.
---
# Big data
Oké, hier is de studiehandleiding voor het onderwerp "Big data", gebaseerd op de verstrekte tekst.
## 4. Big data
Big data verwijst naar enorme hoeveelheden digitale gegevens die automatisch worden gegenereerd door technologische systemen, gekenmerkt door volume, snelheid en variëteit, en biedt een enorm potentieel voor analyse, maar brengt ook significante uitdagingen met zich mee op het gebied van foutenbronnen, ethiek en representativiteit.
### 4.1 Inleiding tot big data
In onze hoogtechnologische wereld genereren we voortdurend digitale voetafdrukken. Big data omvat digitale gegevens die automatisch worden gegenereerd door technologische systemen. Deze gegevens worden doorgaans gekenmerkt door drie belangrijke kenmerken, ook wel bekend als de '3 V's':
* **Volume:** Dit verwijst naar de enorme hoeveelheid gegevens die worden verzameld en opgeslagen, vaak in de vorm van gigantische databanken.
* **Velocity:** Dit duidt op de snelheid waarmee data wordt verzameld en verwerkt, vaak in real-time of bijna real-time.
* **Variety:** Dit betreft de enorme variabiliteit in de soorten gegevens die worden gegenereerd, van gestructureerde gegevens tot ongestructureerde en semi-gestructureerde gegevens.
### 4.2 Soorten big data
Big data kan afkomstig zijn uit verschillende bronnen:
* **Sociale media:** Platforms zoals Facebook, X (voorheen Twitter), Instagram, internetfora en professionele netwerksites (zoals LinkedIn) genereren continu gebruikersgegevens. Ook academische profielpagina's vallen hieronder.
* **Transactiedata:** Dit zijn gegevens die automatisch ontstaan door economische transacties. Voorbeelden hiervan zijn elektronische bankverrichtingen, creditcardtransacties, aankopen met klantenkaarten, en consumptiepatronen op streamingdiensten zoals Netflix en Spotify, die informatie geven over bijvoorbeeld muzieksmaak. Deze gegevens zijn over het algemeen minder gevoelig voor reactiviteit dan data van sociale media.
* **Smartphone gegevens:** Mobiele telefoons genereren locatiegegevens en andere informatie die waardevol kan zijn voor onderzoek. Bijvoorbeeld, mobiliteitsdata kan worden gebruikt om risicogebieden voor de verspreiding van ziektes te identificeren.
### 4.3 Potentieel en uitdagingen van big data
Ondanks het enorme potentieel van big data, zijn er aanzienlijke foutenbronnen en ethische overwegingen waarmee rekening moet worden gehouden:
* **Problemen met coverage:** Technologische 'have-nots' (personen zonder toegang tot technologie) blijven vaak buiten beschouwing, wat leidt tot een vertekend beeld van de werkelijkheid.
* **Impression management (fraude):** Net als bij andere databronnen, kunnen gebruikers proberen een bepaalde indruk te wekken, wat de data beïnvloedt.
* **Gepersonaliseerde marketing:** De data kan worden gebruikt voor gerichte marketing, wat ethische vragen oproept over privacy en manipulatie.
* **Data beschikbaarheid:** Toegang tot bepaalde datasets, zoals die van Facebook, kan beperkt zijn of afhankelijk van specifieke voorwaarden.
* **Ethische overwegingen:** Privacy van individuen, data-eigendom, en het risico op discriminatie op basis van data-analyse zijn cruciale ethische kwesties.
* **Representativiteit:** De aard van big data, vaak gegenereerd door specifieke groepen gebruikers, roept vragen op over de representativiteit voor de gehele populatie.
#### 4.3.1 Voorbeeld: Big data in migratieonderzoek
Een studie combineerde Twitter-data en mobiele telefoongegevens om de massale verplaatsingen richting de EU-grenzen na de Turkse grensopening te onderzoeken.
* **Mobiele telefoon data:** Geaggregeerde gsm-signalen werden gebruikt om grensbewegingen te meten. Deze data bleek betrouwbaar voor het schatten van mobiliteit.
* **Twitter data:** Analyse van sentiment, discours en publieke opinie werd uitgevoerd. Deze data was echter minder geschikt om daadwerkelijke bewegingen te meten.
De conclusie was dat de combinatie van beide databronnen een rijk beeld gaf, door zowel kwantitatieve mobiliteitsgegevens als kwalitatieve context te bieden. Belangrijk is echter dat bij dergelijk onderzoek de ethiek, privacy en representativiteit continu in acht moeten worden genomen.
> **Tip:** Hoewel big data een schat aan informatie kan bevatten, is het cruciaal om kritisch te blijven over de bron, de methoden van dataverzameling en de mogelijke vertekeningen. Combineer big data vaak met andere methoden om een completer beeld te krijgen.
> **Voorbeeld:** Het analyseren van de reispatronen van miljoenen smartphones kan inzicht geven in hoe epidemieën zich verspreiden. Echter, het negeert individuen die geen smartphone bezitten, wat een bias introduceert in de analyse van de verspreiding.
---
# Veldonderzoek en participerende observatie
Hier volgt een gedetailleerd overzicht van veldonderzoek en participerende observatie, bedoeld als studiehandleiding.
## 5. Veldonderzoek en participerende observatie
Dit hoofdstuk verkent veldonderzoek en participerende observatie als kwalitatieve onderzoeksmethoden, waarbij de onderzoeker zich onderdompelt in de natuurlijke omgeving van de onderzochten.
### 5.1 Inleiding
Veldonderzoek, participerende observatie en etnografie zijn kwalitatieve onderzoeksmethoden die zich richten op het beschrijven van sociale groepen van binnenuit. Ze worden vaak toegepast bij moeilijk te doorgronden groepen die met kwantitatieve methoden lastig te bestuderen zijn, zoals daklozen, misdadigers of specifieke subculturen. De onderzoeker dompelt zich voor een langere periode onder in de natuurlijke omgeving van de onderzochten, waarbij het doel is om het perspectief van een buitenstaander te verlaten en zich zoveel mogelijk in te leven in de situatie van de onderzochten. Deze methoden zijn begin 20e eeuw ontwikkeld, met de Universiteit van Chicago (onder leiding van R. Park) als belangrijke bakermat.
De termen veldonderzoek, participerende observatie en etnografie worden vaak door elkaar gebruikt.
* **Veldonderzoek** duidt op het observeren van onderzochten in hun natuurlijke omgeving gedurende een langere periode.
* **Participerende observatie** benadrukt de activiteiten die de onderzoeker onderneemt: waarnemen én participeren in de groep.
* **Etnografie** wordt vaak als synoniem gebruikt voor veldonderzoek.
#### 5.1.1 Toepassingsvelden
Veldonderzoek is geschikt voor de studie van:
* Kleine groepen: observatie en analyse van interacties om inzicht te krijgen in sociale posities, leerprocessen en persoonlijkheidsontwikkeling.
* Grote groepen: analyse van massaverschijnselen, groepsdynamiek in teams, interacties binnen organisaties en niet-westerse samenlevingen of religieuze groepen.
#### 5.1.2 Grondleggers en kritiek
De methoden zijn vooral ontwikkeld in de culturele antropologie. Aanvankelijk, in de 19e eeuw, was er sprake van 'armchair' antropologie, waarbij onderzoekers gegevens verzamelden via derden. Franz Boas introduceerde vervolgens het belang van 'going native', het zelf uitvoeren van etnografisch veldwerk. Bronislaw Malinowski en Margaret Mead verschooven de focus van pure beschrijving naar het toetsen van specifieke hypothesen.
Kritiek op vroege methoden richt zich op:
* **Epistemische extractie**: Informatie werd vaak verkregen uit koloniale bronnen, waardoor de gemeenschappen zelf geen stem hadden.
* **Bevestiging van hiërarchieën**: Evolutionistische schema's versterkten koloniale machtsstructuren.
* **Reproductie van stereotypering**: De 'ander' werd vaak exotisch, statisch en simplistisch voorgesteld.
* **'Going native'**: Romantisering en toe-eigening, waarbij de onderzoeker tijdelijk een cultuur beleefde maar het privilege behield om terug te keren, wat de machtsverschillen intact liet.
### 5.2 Types veldonderzoek
Veldonderzoek kan worden ingedeeld aan de hand van drie criteria: de rol van de onderzoeker, de mate van openheid en het gehanteerde paradigma.
#### 5.2.1 Rol van de onderzoeker: participeren vs. observeren
Dit aspect beschrijft de mate waarin de onderzoeker zich mengt met de bestudeerde groep. Het kan worden gezien als een continuüm:
* **Zuiver observeren**: De onderzoeker mengt zich niet in de groep. Dit is een niet-reactieve methode zonder verstorend effect, maar mist mogelijk diepere betekenissen. Een veldexperiment is een actievere vorm waarbij een stimulus wordt geïntroduceerd om reacties uit te lokken.
* **Waarnemer-als-participant**: Participeren is een middel om toegang te krijgen tot de setting, maar de primaire rol blijft die van waarnemer.
* **Participant-als-waarnemer**: Deelnemen is een middel om zich als onderzoeker in te leven in de situatie.
* **Volledig participeren ('Going native')**: De onderzoeker gaat volledig op in de groep, waarbij de rol van onderzoeker vervaagt.
#### 5.2.2 Mate van openheid: verborgen vs. open onderzoek
Dit criterium betreft de kennis van de onderzochten over het onderzoek.
* **Verborgen (covert) onderzoek**: De onderzoeker neemt een verborgen rol aan en wordt niet herkend als onderzoeker. Dit leidt tot minder of geen toegangsproblemen en geen reactiviteit. Nadelen zijn echter dat andere methoden niet gebruikt kunnen worden, er praktische problemen zijn met het maken van notities, er angst is om ontdekt te worden, en er ethische bezwaren zijn (misleiding, gebrek aan informed consent). Dit is makkelijker in publieke ruimtes dan in privéomstandigheden.
* **Open (overt) onderzoek**: De onderzochte personen zijn zich bewust van de rol van de onderzoeker.
#### 5.2.3 Paradigma: coöperatief vs. investigatief
Dit criterium gaat over de opvatting van de onderzoeker over de onderzochte groep.
* **Coöperatief paradigma**: De onderzochten worden gezien als bereid om een waarheidsgetrouw beeld te geven. De onderzoeker communiceert open en eerlijk over het onderzoek.
* **Investigatief paradigma**: Voortkomend uit kritiek, stelt dit paradigma dat onderzochten onderzoekers juist proberen te misleiden. Dit pleit eerder voor een verborgen rol van de onderzoeker.
### 5.3 Verloop van veldonderzoek
Het verloop van veldonderzoek kent verschillende fasen:
1. **Planning veldwerk**: Voorbereiding van het onderzoek.
2. **Toegang krijgen tot het veld**: Fysieke en sociale toegang tot de bestudeerde setting, wat kan variëren van eenvoudig (open ruimte) tot complex (gesloten groepen) waarbij een vertrouwensrelatie opgebouwd moet worden via lokale informanten en gatekeepers.
3. **Verblijf in het veld**: Het eigenlijke dataverzamelingsproces, vaak aangeduid met termen als 'scoring the facts' (via bevragingen, informanten, opnamen) en 'reading the field' (interpretatieve momenten en 'validity checks'). Dit omvat ook het bijhouden van notities ('scoring the field').
4. **Uittrede uit het veld**: Het proces van het verlaten van de bestudeerde setting.
5. **Rapportering**: Interpretatie en verslaglegging van de bevindingen.
#### 5.3.1 Veldwerknotities
Er zijn verschillende soorten veldwerknotities:
* **Observatienota's**: Neutrale en feitelijke beschrijvingen van wat de onderzoeker observeert (wie, wat, waar, waarom, wanneer, hoe).
* **Analytische nota's**: Interpretaties van de feiten, met aandacht voor achterliggende betekenissen en algemene patronen.
* **Methodologische nota's**: Reflecties van de onderzoeker over de gebruikte technieken.
Naast deze kunnen ook **mentale notities** (kortstondige herinneringen) en **scratch notes** (korte, rauwe notities die later worden uitgewerkt) worden gemaakt.
#### 5.3.2 Voorbeelden
* **William Foote Whyte - 'Street Corner Society'**: Een studie van een Italiaanse sloppenwijk in Boston, waarbij de sociale structuur van 'corner boys' en 'racketeers' werd geobserveerd.
* **Margaret Mead - 'Coming of Age in Samoa'**: Een onderzoek naar puberteit en seksualiteit bij tieners op Samoa, waarbij de invloed van cultuur op psychoseksuele ontwikkeling werd benadrukt.
* **Laud Humphreys - 'The Tearoom Trade'**: Een controversiële studie naar homoseksuele ontmoetingen in openbare toiletten, waarbij de onderzoeker zich voordeed als 'watch queen'.
* **Günter Wallraff - 'Ik (Ali)'**: Een beschrijving van de ervaringen van racisme door de onderzoeker die zich voordeed als een Turkse mijnwerker in Duitsland.
### 5.4 Voor- en nadelen van veldonderzoek
#### 5.4.1 Voordelen
* **Toegang tot marginale groepen en moeilijke settings**: Veldonderzoek maakt het mogelijk om groepen te bestuderen die anders ontoegankelijk zouden zijn.
* **Observatie in natuurlijke omgeving**: Onderzoek vindt plaats in de authentieke context van de onderzochten.
* **Interne validiteit**: Er zijn geen rigide classificatie- of meetinstrumenten die de waarneming kunnen vertekenen. De taalgebruik van de onderzochten kan direct worden bestudeerd.
* **Geringe afstand object-onderzoeker**: Dit kan leiden tot dieper inzicht.
* **Waarneming van gedrag**: Veldonderzoek is geschikt voor het observeren van daadwerkelijk gedrag, in tegenstelling tot attitudes en opinies die bij andere methoden (zoals enquêtes) worden bevraagd.
* **Longitudinale waarnemingen**: Mogelijk om de sequentie van gebeurtenissen bij individuen te bestuderen.
* **Historisch perspectief**: Tijdsreeksen zijn vaak beschikbaar, waardoor trends kunnen worden gemeten.
* **Kostenbesparend**: Kan efficiënter zijn dan andere methoden, waardoor meer tijd overblijft voor analyse.
#### 5.4.2 Nadelen
* **Moeilijke toegang**: Toegang tot gesloten groepen kan complex zijn en vereist specifieke vaardigheden.
* **Gevaar voor subjectivisme**: De interpretatie van de onderzoeker kan gekleurd zijn door empathie en de 'going native' neiging.
* **Herhaalbaarheid**: Veldonderzoek is vaak situationeel gebonden en eenmalig, waardoor het moeilijk te herhalen is.
* **Ethiek**: De aanwezigheid van de onderzoeker kan een stimulus zijn die het gedrag van de groep beïnvloedt. Er kunnen ook ethische dilemma's ontstaan met betrekking tot misleiding en privacy.
* **Systematiseren van waarnemingen**: Het maken van notities tijdens veldwerk kan lastig zijn, zeker bij een verborgen rol. Notities zijn vaak gebaseerd op impressies en herinneringen.
* **Sympathie en onderzoekerbias**: De rapportage kan gekenmerkt worden door sympathie voor de bestudeerde groep, waardoor afstand bewaren moeilijk wordt. Informatie wordt gefilterd door de onderzoeker.
* **'Going native'**: Onderzoekers kunnen hun onderzoeksrol verliezen door te veel op te gaan in de wereld van de onderzochten.
* **Betrouwbaarheid en generaliseerbaarheid**: De resultaten zijn vaak niet direct herhaalbaar en de waarneming beperkt zich tot een specifieke locatie, wat de generaliseerbaarheid kan beperken. Tegengestelde resultaten, zoals bij Mead en Freeman, illustreren dit.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Niet-reactief onderzoek | Onderzoek waarbij de onderzoeker de gedragingen of reacties van de onderzochten niet beïnvloedt, omdat de data worden verzameld zonder dat de onderzochten zich bewust zijn van het onderzoeksproces. |
| Secundaire data-analyse | Het gebruik van gegevens die oorspronkelijk door anderen zijn verzameld voor een ander onderzoeksdoel. Dit kan variëren van officiële statistieken tot eerder uitgevoerde enquêtes. |
| Unobtrusive measurement | Een meetmethode die minimale of geen interactie met de onderzochte personen vereist, waardoor de kans op reactiviteit en vertekening van de resultaten wordt verminderd. |
| Reactieve databronnen | Bronnen van informatie waarbij de gegevensverzameling direct uitgelokt wordt door de onderzoeker, wat kan leiden tot beïnvloeding van het gedrag van de onderzochten. |
| Niet-reactieve databronnen | Bronnen van informatie die onafhankelijk bestaan van de onderzoeker en dus niet worden beïnvloed door diens aanwezigheid of acties. |
| Primaire data | Gegevens die direct door de onderzoeker voor het eigen onderzoek worden verzameld door middel van methoden zoals enquêtes of experimenten. |
| Secundaire data | Gegevens die al bestaan en door derden zijn verzameld, zoals overheidsstatistieken, archiefmateriaal of data van eerdere onderzoeken. |
| Ambtelijk statistisch materiaal | Kwantitatieve gegevens verzameld en gepubliceerd door overheidsinstanties voor officiële doeleinden, zoals bevolkingsstatistieken en economische indicatoren. |
| Inhoudsanalyse | Een onderzoeksmethode om systematisch en objectief de manifeste of latente inhoud van communicatie (zoals teksten, beelden of geluid) te beschrijven en te kwantificeren. |
| Analyse-eenheden | De basiseenheden die worden geanalyseerd binnen een inhoudsanalyse, zoals individuele woorden, zinnen, alinea's, artikelen of zelfs hele documenten. |
| Codeerschema | Een gestructureerde tabel die wordt gebruikt om de inhoud van de analyse-eenheden te classificeren volgens vooraf gedefinieerde categorieën en dimensies. |
| Codeurshandleiding | Een document met gedetailleerde instructies voor de codeurs om consistentie en objectiviteit te waarborgen bij het toewijzen van codes aan de inhoud van de analyse-eenheden. |
| Codeurbetrouwbaarheid | De mate van overeenstemming tussen de resultaten van verschillende codeurs die dezelfde data analyseren met hetzelfde codeerschema. |
| Manifest coderen | Het objectief en ondubbelzinnig coderen van elementen die direct waarneembaar zijn in de inhoud, zoals de frequentie van specifieke woorden. |
| Latent coderen | Het interpreteren en coderen van de betekenis of de onderliggende boodschap van de inhoud, wat subjectiever kan zijn en meer interpretatie vereist. |
| Officiële statistieken | Gegevens verzameld door overheidsinstanties over diverse maatschappelijke fenomenen, zoals demografie, economie en onderwijs, voor beleidsvorming en onderzoek. |
| Volkstelling (census) | Een periodieke en alomvattende registratie van de bevolking van een land of regio, inclusief demografische, sociale en economische kenmerken. |
| Big data | Grote en complexe datasets die zo omvangrijk, snel veranderend en gevarieerd zijn dat traditionele dataverwerkingsmethoden ontoereikend zijn. |
| Volume (Big Data) | De enorme hoeveelheid data die gegenereerd en opgeslagen wordt, vaak in de orde van terabytes, petabytes of zelfs exabytes. |
| Velocity (Big Data) | De snelheid waarmee data wordt gegenereerd, verzameld en verwerkt, vaak in real-time of bijna real-time. |
| Variety (Big Data) | De diverse soorten data die kunnen worden verzameld, waaronder gestructureerde data (databases), semi-gestructureerde data (XML, JSON) en ongestructureerde data (tekst, afbeeldingen, video). |
| Veldonderzoek | Een kwalitatieve onderzoeksmethode waarbij de onderzoeker voor langere tijd deelneemt aan of observeert binnen de natuurlijke leefomgeving van de te bestuderen groep of gemeenschap. |
| Participerende observatie | Een veldonderzoekstechniek waarbij de onderzoeker niet alleen observeert, maar ook actief deelneemt aan de activiteiten van de groep om een dieper inzicht te krijgen in hun sociale leven en cultuur. |
| Etnografie | Een gedetailleerde, beschrijvende studie van een specifieke cultuur of sociale groep, vaak gebaseerd op langdurig veldonderzoek en participerende observatie. |
| Verborgen onderzoek (covert research) | Een vorm van veldonderzoek waarbij de onderzoeker zijn identiteit als onderzoeker verbergt en zich voordoet als een gewoon lid van de groep die wordt bestudeerd. |
| Open onderzoek (overt research) | Een vorm van veldonderzoek waarbij de onderzoeker zijn identiteit en onderzoeksdoelen kenbaar maakt aan de onderzochte groep. |
| Veldwerknotities | Gedetailleerde aantekeningen, dagboeken, observaties en reflecties die de onderzoeker tijdens het veldonderzoek maakt om data te verzamelen en te documenteren. |
| Going native | De toestand waarbij een onderzoeker zich zo sterk identificeert met de bestudeerde groep dat hij zijn eigen onderzoeksrol en objectiviteit verliest. |
| Onderzoekerbias | Vertekening van onderzoeksresultaten door de persoonlijke opvattingen, vooroordelen of verwachtingen van de onderzoeker. |