Cover
Inizia ora gratuitamente Student - Hoorcollege 11 - Kiezen van de juiste toets.pptx
Summary
# Planning van resterende lessen en vragenbehandeling
Dit document beschrijft de planning van de resterende lessen, de te behandelen leerstof en de richtlijnen voor het stellen van vragen.
## 1. Planning van resterende lessen en vragenbehandeling
### 1.1 Overzicht van resterende colleges en werkcolleges
De resterende onderwijsactiviteiten omvatten:
* Hoorcollege over statistiek in wetenschappelijk onderzoek (Hoofdstuk 11).
* Werkcollege 3.
* Hoorcollege over kwalitatieve data-analyse.
* Werkcollege 4.
* De laatste les is gewijd aan de voorbereiding op het examen en een vragencollege.
### 1.2 Richtlijnen voor het stellen van vragen
Het stellen van vragen gedurende het semester is cruciaal voor een goed begrip van de leerstof. De volgende kanalen en methoden worden aanbevolen:
* **Vragen via het forum:**
* Stel resterende vragen over de leerstof via het online forum.
* Deze vragen worden gebundeld en behandeld tijdens de colleges.
* De deadline voor het stellen van vragen via het forum is **voor de kerstvakantie**.
* Na de kerstvakantie worden in principe geen vragen meer beantwoord via het forum.
* **Vragen tijdens en na colleges:**
* Stel vragen aan de docent direct **voor, tijdens of na** de hoorcolleges.
* Werkcolleges bieden een uitgelezen gelegenheid om **individuele vragen** te stellen.
* **Ondersteuning via het handboek:**
* Raadpleeg het handboek voor verdere opheldering van de leerstof.
* **Signaleren van problemen:**
* Signaleer specifieke problemen met de leerstof tijdig aan de docent.
### 1.3 Recap: kritieke waarde methode bij 2-zijdig toetsen
Deze methode wordt toegepast om te bepalen of een toets significant is. De stappen zijn:
1. Bereken de waarde van de toets-statistiek.
2. Zoek de kritieke waarde van de toets-statistiek op.
Vervolgens wordt de absolute waarde van de toets-statistiek vergeleken met de kritieke waarde:
* Als de absolute waarde van de toets-statistiek groter is dan de kritieke waarde, is de toets significant en wordt de nulhypothese ($H_0$) verworpen.
* Zo niet, dan is de toets niet significant en wordt de nulhypothese ($H_0$) behouden.
Dit geldt zowel voor positieve als negatieve toets-statistieken.
### 1.4 Leerdoelen en studiestrategie
Het examen is ontworpen om de leerdoelen te evalueren. Het is daarom essentieel om de leerdoelen bij de hand te houden tijdens het studeren.
### 1.5 Hoofdstuk 11: Hoe kies je de juiste toets?
Het kiezen van de juiste statistische toets is een belangrijke vaardigheid. Dit proces vereist een grondige analyse van de onderzoeksvraag en de data.
#### 1.5.1 Overzicht van geziene technieken en toetsen
De volgende toetsen zijn behandeld, onderverdeeld per hoofdstuk:
* **Hoofdstuk 4: Toetsen voor één populatie**
* Parametrisch (P): z-toets / t-toets voor één gemiddelde
* Non-parametrisch (NP): Chi-kwadraattoets voor frequenties
* **Hoofdstuk 5: Toetsen voor twee onafhankelijke populaties**
* Parametrisch (P): t-toets voor twee onafhankelijke steekproeven
* Non-parametrisch (NP): Wilcoxon rank-sum test
* **Hoofdstuk 6: Toetsen voor twee afhankelijke populaties**
* Parametrisch (P): t-toets voor twee afhankelijke steekproeven
* Non-parametrisch (NP): Niet gespecificeerd in het document
* **Hoofdstuk 7: Toetsen voor meer dan 2 (onafhankelijke populaties)**
* Parametrisch (P): One-way ANOVA (variantieanalyse)
* Non-parametrisch (NP): Niet gespecificeerd in het document
* **Hoofdstuk 9: Toetsen voor het verband tussen twee variabelen**
* Parametrisch (P): Pearson correlatietoets
* Non-parametrisch (NP): Spearman rank correlation, Chi-kwadraattoets voor kruistabellen
> **Tip:** Houd een overzicht bij van deze toetsen, de voorwaarden waaraan voldaan moet zijn en wanneer ze toepasbaar zijn.
#### 1.5.2 Het stappenplan voor het kiezen van de juiste toets
Het kiezen van de juiste toets omvat de volgende zeven stappen:
1. **Ontleed de onderzoeksvraag:** Begrijp goed wat er onderzocht wordt.
2. **Bepaal de afhankelijke en onafhankelijke variabelen:** Identificeer welke variabele de uitkomstmaat is en welke de voorspeller of oorzaak is. Een effect gaat over de impact van X op Y, terwijl een verband de relatie tussen X en Y onderzoekt zonder noodzakelijk een causale richting aan te geven.
3. **Bepaal het meetniveau van de variabelen:**
* **Nominaal:** Categorieën zonder volgorde (bv. geslacht).
* **Ordinaal:** Categorieën met een logische volgorde (bv. opleidingsniveau).
* **Interval:** Gelijke intervallen tussen waarden, geen absoluut nulpunt (bv. temperatuur in Celsius).
* **Ratio:** Gelijke intervallen en een absoluut nulpunt (bv. lengte, gewicht).
* Het meetniveau is cruciaal voor de toetskeuze. Een lager meetniveau mag altijd verlaagd worden (bv. interval naar ordinaal), maar niet verhoogd.
4. **Bepaal het aantal te bestuderen populaties:** Dit wordt bepaald door het aantal niveaus of categorieën van de onafhankelijke variabele.
5. **Bepaal of het om onafhankelijke of afhankelijke steekproeven gaat:**
* **Onafhankelijke steekproeven:** De samenstelling van de ene steekproef heeft geen invloed op de andere.
* **Afhankelijke steekproeven:** Dezelfde deelnemers worden op verschillende momenten gemeten (bv. voor- en nameting), of er is sprake van gematchte paren.
6. **Bepaal of we parametrisch of non-parametrisch moeten toetsen:**
* **Parametrische toetsen** hebben doorgaans strengere voorwaarden (zoals normale verdeling van de data, interval/ratio niveau van de afhankelijke variabele). Ze hebben meer "power" als aan de voorwaarden is voldaan.
* **Non-parametrische toetsen** zijn robuuster en kunnen gebruikt worden als aan de voorwaarden van parametrische toetsen niet is voldaan.
* In SPSS kunnen de **Kolmogorov-Smirnov** en **Shapiro-Wilk toetsen** gebruikt worden om normaliteit te toetsen. De Shapiro-Wilk toets wordt als accurater beschouwd. Een p-waarde $\ge 0.05$ duidt op normale verdeling, een p-waarde $< 0.05$ duidt op niet-normaal verdeelde data.
7. **Bepaal of we eenzijdig of tweezijdig toetsen:**
* **Tweezijdig toetsen** is de standaardmethode om geen effecten te missen.
* **Eenzijdig toetsen** wordt in de praktijk zelden toegepast en vereist een duidelijke, vooraf bepaalde richting van het verwachte effect. Het is belangrijk het verschil tussen eenzijdige en tweezijdige hypotheses te kennen.
#### 1.5.3 Het schema toegepast: voorbeelden
De volgende voorbeelden illustreren de toepassing van het stappenplan:
* **Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag**
* Onderzoeksvraag: Is er een verband tussen materialisme en agressief rijgedrag bij autobestuurders?
* Onderzoekseenheden: 564 mannen en vrouwen (18-55 jaar).
* Variabelen: Materialisme (OV, berekend uit Likert-items, score 0-150), Agressief rijgedrag (AV, berekend uit Likert-items, score 0-90).
* Meetniveau: Beide variabelen worden als intervalvariabelen beschouwd (combinatie van Likert-items).
* Aantal populaties: Eén populatie wordt bestudeerd.
* Steekproeven: Niet van toepassing, er is één steekproef.
* Parametrisch/Non-parametrisch: Parametrisch, omdat de afhankelijke variabele (materialisme) op intervalniveau is en de steekproefgrootte (N=564) groot is, wat normale verdeling suggereert. De **Pearson correlatietoets** is hier geschikt.
* Eenzijdig/Tweezijdig: Standaard tweezijdig.
* **Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen**
* Onderzoeksvraag: Verschillen mannen en vrouwen in agressief rijgedrag?
* Onderzoekseenheden: 32 deelnemers, geobserveerd gedurende één week.
* Variabelen: Geslacht (OV, nominaal), Agressief rijgedrag (AV, score 1-5, geheel getal).
* Meetniveau: Geslacht is nominaal, agressief rijgedrag is ordinaal.
* Aantal populaties: Twee populaties (mannen en vrouwen).
* Steekproeven: Onafhankelijke steekproeven (deelnemers zijn geen familie of partners).
* Parametrisch/Non-parametrisch: Non-parametrisch, omdat de afhankelijke variabele (agressief rijgedrag) op ordinaal niveau is. De **Wilcoxon rank-sum toets** is hier geschikt.
* Eenzijdig/Tweezijdig: Standaard tweezijdig.
* **Voorbeeld 3: Effect van energiedrank/repen op loopprestaties**
* Onderzoeksvraag: Welk middel (energiedrank, energierepen, beide, geen) heeft het beste effect op de loopprestaties van langeafstandslopers?
* Onderzoekseenheden: 180 langeafstandslopers, verdeeld over vier condities.
* Variabelen: Energiemiddel (OV, nominaal: geen, drank, reep, beide), Loopprestaties (AV, tijd in minuten).
* Meetniveau: Energiemiddel is nominaal, loopprestaties (tijd) is ratio.
* Aantal populaties: Vier populaties (de vier condities).
* Steekproeven: Onafhankelijke steekproeven (lpers zijn verdeeld over condities).
* Parametrisch/Non-parametrisch: Parametrisch, omdat de afhankelijke variabele (tijd) op rationiveau is en de steekproefgrootte per groep (N=180/4=45) voldoende is voor normale verdeling. De **one-way ANOVA** is hier geschikt.
* Eenzijdig/Tweezijdig: Standaard tweezijdig.
#### 1.5.4 Alternatief toetsoverzicht
Een samenvattend schema kan helpen bij het kiezen van de juiste toets:
| | 1 populatie | 2 populaties | Meer dan 2 populaties |
| :------------------------ | :----------------------------------------- | :------------------------------------------------------------------------ | :------------------------------------------ |
| **Verschil in gemiddelden** | P: z-/t-toets voor 1 gem.
NP: - | P: t-toets voor 2 onafh. gem.
NP: Wilcoxon rank-sum toets | P: One-way ANOVA
NP: - | | **Verband** | P: -
NP: Chi-kwadraat toets | P: t-toets voor 2 afh. gem.
NP: Wilcoxon signed rank toets | P: -
NP: - | | **Correlatie** | P: Pearson correlatietoets
NP: Spearman rank correlation | | | | **Frequentietabellen** | P: -
NP: Chi-kwadraat toets | | | **Parametrisch:** Wanneer Afhankelijke Variabele (AV) minstens intervalniveau heeft en de AV normaal verdeeld is. **Non-parametrisch:** Wanneer AV < intervalniveau of AV niet normaal verdeeld is. #### 1.5.5 Extra oefeningen Er worden diverse oefeningen aangeboden die het toepassen van het stappenplan voor het kiezen van de juiste toets versterken, waarbij steeds motivatie voor de gekozen toets gevraagd wordt, rekening houdend met meetniveau en de aard van de data. --- # Leerdoelen en overzicht van statistische toetsen Dit gedeelte definieert de leerdoelen met betrekking tot het kiezen van de juiste statistische toets en biedt een overzicht van diverse statistische technieken, inclusief parametrische en non-parametrische toetsen. ### 2.1 Leerdoelen voor hoorcollege 11 Het examen zal de volgende leerdoelen evalueren: * Het selecteren van de juiste statistische toets op basis van de onderzoeksvraag en de kenmerken van de data. * Het begrijpen en toepassen van het stappenplan voor het kiezen van een statistische toets. ### 2.2 Overzicht van statistische technieken De keuze voor de juiste statistische toets kan uitdagend zijn. Hieronder volgt een overzicht van de besproken toetsen, georganiseerd naar het aantal populaties en het type onderzoeksvraag. #### 2.2.1 Toetsen voor één populatie * **Parametrisch:** * $z$-toets / $t$-toets voor één gemiddelde. * **Non-parametrisch:** * Chi-kwadraattoets voor frequenties. #### 2.2.2 Toetsen voor twee onafhankelijke populaties * **Parametrisch:** * $t$-toets voor twee onafhankelijke steekproeven. * **Non-parametrisch:** * Wilcoxon rank-sum test. #### 2.2.3 Toetsen voor twee afhankelijke populaties * **Parametrisch:** * $t$-toets voor twee afhankelijke steekproeven. * **Non-parametrisch:** * Wilcoxon signed-rank toets. #### 2.2.4 Toetsen voor meer dan twee onafhankelijke populaties * **Parametrisch:** * One-way ANOVA (variantieanalyse). * **Non-parametrisch:** * (Niet besproken in dit hoofdstuk). #### 2.2.5 Toetsen voor het verband tussen twee variabelen * **Parametrisch:** * Pearson correlatietoets. * **Non-parametrisch:** * Spearman rank correlation. * Chi-kwadraattoets voor kruistabellen. #### 2.2.6 Samenvattend overzicht van toetsen | Studieontwerp / Aantal populaties | Onderzoeksvraag: Verschil in gemiddelden | Onderzoeksvraag: Verband | | :--------------------------------- | :---------------------------------------- | :----------------------- | | **1 Populatie** | Parametrisch: $z$/$t$-toets voor één gemiddelde
Non-parametrisch: Chi-kwadraattoets voor frequenties | - | | **2 Onafhankelijke Populaties** | Parametrisch: $t$-toets voor 2 onafhankelijke steekproeven
Non-parametrisch: Wilcoxon rank-sum test | - | | **2 Afhankelijke Populaties** | Parametrisch: $t$-toets voor 2 afhankelijke steekproeven
Non-parametrisch: Wilcoxon signed-rank toets | - | | **Meer dan 2 Onafhankelijke Populaties** | Parametrisch: One-way ANOVA
Non-parametrisch: - | - | | **Verband tussen 2 Variabelen** | - | Parametrisch: Pearson correlatie
Non-parametrisch: Spearman correlatie, Chi-kwadraattoets voor kruistabellen | #### 2.2.7 Parametrisch versus Non-parametrisch * **Parametrische toetsen:** * Vereisen dat de afhankelijke variabele (AV) minstens van intervalniveau is. * Vereisen dat de AV normaal verdeeld is binnen de populatie(s). * Worden over het algemeen verkozen boven non-parametrische toetsen indien de voorwaarden voldaan zijn, omdat ze meer power hebben. * **Non-parametrische toetsen:** * Worden gebruikt wanneer de AV een lager meetniveau heeft (nominaal of ordinaal) of wanneer de data niet normaal verdeeld zijn. ### 2.3 Stappenplan voor het kiezen van de juiste toets Het correct kiezen van een statistische toets vereist een systematische aanpak. De volgende stappen helpen bij het ontleden van de onderzoeksvraag en het selecteren van de geschikte analyse. #### 2.3.1 Stap 1: Begrijp de onderzoeksvraag * Wat is de centrale vraag die beantwoord moet worden? * Gaat het om het vaststellen van een effect (variabele X op Y) of een verband (tussen X en Y)? #### 2.3.2 Stap 2: Identificeer de variabelen * Wat zijn de afhankelijke en onafhankelijke variabelen in het onderzoek? * Een effect-onderzoek focust op de invloed van de onafhankelijke variabele (OV) op de afhankelijke variabele (AV). * Een verband-onderzoek onderzoekt de relatie tussen twee variabelen, waarbij de richting niet noodzakelijk vaststaat (correlatie ≠ causaliteit). #### 2.3.3 Stap 3: Bepaal het meetniveau van de variabelen Het meetniveau van de variabelen is cruciaal voor de toetskeuze. * **Nominaal:** Categorieën zonder rangorde (bv. geslacht, haarkleur). * **Ordinaal:** Categorieën met een logische rangorde, maar ongelijke intervallen (bv. Likert-schalen, opleidingsniveau). * **Interval:** Gelijkwaardige intervallen tussen waarden, geen absoluut nulpunt (bv. temperatuur in Celsius, IQ-score). * **Ratio:** Gelijkwaardige intervallen én een absoluut nulpunt (bv. lengte, gewicht, leeftijd, reactietijd). > **Tip:** Het verlagen van een meetniveau (bv. van interval naar ordinaal) is altijd mogelijk, maar het verhogen ervan niet. #### 2.3.4 Stap 4: Bepaal het aantal te bestuderen populaties Dit wordt bepaald door het aantal niveaus of categorieën van de onafhankelijke variabele. #### 2.3.5 Stap 5: Ga na of de steekproeven afhankelijk of onafhankelijk zijn * **Onafhankelijke steekproeven:** De selectie van de ene steekproef heeft geen invloed op de selectie van de andere. * **Afhankelijke steekproeven:** De steekproeven zijn gerelateerd. Dit kan komen doordat dezelfde deelnemers op meerdere momenten gemeten worden (bv. voor- en nameting) of doordat paren van deelnemers gematcht zijn. #### 2.3.6 Stap 6: Kies tussen parametrische en non-parametrische toetsen * Controleer of de AV minstens intervalniveau heeft en voldoet aan de aannames van normaliteit. Indien ja, kies een parametrische toets. * Indien de AV ordinaal of nominaal is, of niet normaal verdeeld is, kies een non-parametrische toets. * In SPSS kan de normaliteit worden nagegaan met de Kolmogorov-Smirnov en Shapiro-Wilk toetsen. De Shapiro-Wilk toets wordt als accuraater beschouwd. * Een $p$-waarde groter dan of gelijk aan 0.05 suggereert normaliteit. * Een $p$-waarde kleiner dan 0.05 suggereert niet-normaal verdeelde data. #### 2.3.7 Stap 7: Bepaal of de toets eenzijdig of tweezijdig is * **Tweezijdig toetsen:** Standaard in de praktijk om alle mogelijke effecten of verbanden te detecteren. De nulhypothese ($H_0$) stelt dat er geen verschil of verband is, en de alternatieve hypothese ($H_1$) stelt dat er wel een verschil of verband is, zonder specificatie van de richting. * **Eenzijdig toetsen:** Wordt enkel gebruikt wanneer er een sterke theoretische onderbouwing is om een specifieke richting van het effect of verband te verwachten. De alternatieve hypothese specificeert de richting van het verschil of verband. > **Tip:** Tenzij er een zeer duidelijke theoretische reden is, is het aan te raden om altijd tweezijdig te toetsen om geen potentiële effecten te missen. ### 2.4 Voorbeelden van toetskeuzes #### 2.4.1 Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag * **Onderzoeksvraag:** Zoeken naar het verband tussen materialisme en agressief rijgedrag van autobestuurders. * **Variabelen:** * OV: Materialisme (gemeten via Likert-items, totaalscore omgerekend naar 0-150). * AV: Agressief rijgedrag (gemeten via Likert-items, totaalscore 0-90). * **Meetniveau:** Beide variabelen worden als interval beschouwd (combinatie van Likert-schalen resulteert in intervalniveau). * **Aantal populaties:** Eén populatie (bestuurders). * **Steekproeven:** Niet van toepassing, er is één steekproef. * **Parametrisch/Non-parametrisch:** Parametrisch, omdat de AV intervalniveau heeft en met een grote steekproef ($N=564$) aangenomen kan worden dat de data (ongeveer) normaal verdeeld zijn. * **Toets:** Pearson correlatietoets. * **Eenzijdig/Tweezijdig:** Tweezijdig, om een eventueel verband in beide richtingen te detecteren. #### 2.4.2 Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen * **Onderzoeksvraag:** Zoeken naar een verschil tussen mannen en vrouwen op gebied van agressief rijgedrag. * **Variabelen:** * OV: Geslacht (man/vrouw). * AV: Agressief rijgedrag (gemeten op een schaal van 1 tot 5, geheel getal). * **Meetniveau:** Geslacht is nominaal. Agressief rijgedrag is ordinaal (rangorde, maar de intervallen zijn niet per se gelijk). * **Aantal populaties:** Twee populaties (mannen en vrouwen). * **Steekproeven:** Onafhankelijke steekproeven (mannen en vrouwen zijn geen familie/partners van elkaar). * **Parametrisch/Non-parametrisch:** Non-parametrisch, omdat de AV ordinaal is. * **Toets:** Wilcoxon rank-sum test. * **Eenzijdig/Tweezijdig:** Tweezijdig. #### 2.4.3 Voorbeeld 3: Effect van energiedrank/repen op prestaties * **Onderzoeksvraag:** Welk middel (energiedrank, energierepen, beide, of geen) heeft het beste effect op de loopprestaties van langeafstandslopers? * **Variabelen:** * OV: Energiemiddel (geen, energiedrank, energierepen, beide). * AV: Prestatietijd in minuten. * **Meetniveau:** Energiemiddel is nominaal. Prestatietijd is ratio. * **Aantal populaties:** Vier condities (die als vier populaties beschouwd kunnen worden). * **Steekproeven:** Onafhankelijke steekproeven (verschillende groepen lopers). * **Parametrisch/Non-parametrisch:** Parametrisch, omdat de AV ratio is en de steekproefgrootte ($N=180$, verdeeld over 4 groepen, dus $N \approx 45$ per groep) suggereert dat de normaliteitsassumptie redelijk zal gelden. * **Toets:** One-way ANOVA. * **Eenzijdig/Tweezijdig:** Tweezijdig. ### 2.5 Belangrijke overwegingen * De keuze van de statistische methode is sterk afhankelijk van het onderzoeksdesign. * Het is aan te raden om al vóór het uitvoeren van het onderzoek na te denken over de te gebruiken statistische methoden. * Non-parametrische toetsen worden bij voorkeur vermeden indien de voorwaarden voor parametrische toetsen vervuld zijn, vanwege hun lagere power. > **Tip:** Gebruik dit stappenplan consequent bij het oefenen met verschillende onderzoeksvoorbeelden om de vaardigheid in het kiezen van de juiste toets te verbeteren. --- # Stappenplan voor het kiezen van de juiste statistische toets Dit hoofdstuk biedt een systematisch stappenplan om de geschikte statistische toets te selecteren voor een gegeven onderzoeksvraag, beginnend bij de vraag zelf en eindigend met de overweging tussen een eenzijdige of tweezijdige toets. ### 3.1 De zeven stappen voor het kiezen van de juiste toets Het selecteren van de correcte statistische toets is cruciaal voor de validiteit van onderzoeksresultaten. Dit proces kan worden opgedeeld in zeven logische stappen: #### 3.1.1 Stap 1: Ontleed de onderzoeksvraag De allereerste stap is het grondig begrijpen van de onderzoeksvraag. Hierbij is het essentieel om te identificeren welke variabelen bestudeerd worden en wat de onderzoekseenheden (bijvoorbeeld personen, groepen, objecten) zijn. #### 3.1.2 Stap 2: Bepaal de afhankelijke en onafhankelijke variabelen Vervolgens moeten de afhankelijke variabele (AV) en de onafhankelijke variabele (OV) worden vastgesteld. Dit onderscheid is fundamenteel voor het bepalen van de meetniveaus en het begrijpen van de aard van het onderzochte verband: * **Effect:** Onderzoek naar het effect van variabele X op variabele Y. * **Verband:** Onderzoek naar de relatie tussen variabele X en variabele Y, waarbij de richting (causaliteit) niet noodzakelijk wordt bepaald. #### 3.1.3 Stap 3: Bepaal het meetniveau van de variabelen Het meetniveau van de variabelen (nominaal, ordinaal, interval, ratio) is een van de meest bepalende factoren voor de keuze van de statistische toets. Daarnaast zijn de voorwaarden die aan verschillende toetsen verbonden zijn (zoals normaliteit van de verdeling, intervalniveau van de AV) hier ook van belang. Het verlagen van een meetniveau is toegestaan (bijvoorbeeld van interval naar ordinaal), maar het verhogen ervan niet. De vier meetniveaus zijn: * **Nominaal:** Categorieën zonder rangorde (bv. geslacht). * **Ordinaal:** Categorieën met een rangorde, maar zonder gelijke intervallen (bv. opleidingsniveau). * **Interval:** Gelijkwaardige intervallen tussen waarden, maar geen absoluut nulpunt (bv. temperatuur in Celsius). * **Ratio:** Gelijkwaardige intervallen en een absoluut nulpunt (bv. lengte, gewicht). #### 3.1.4 Stap 4: Bepaal het aantal te bestuderen populaties Sommige statistische toetsen vereisen een duidelijk inzicht in het aantal te bestuderen populaties. Dit aantal wordt bepaald door het aantal niveaus of categorieën van de onafhankelijke variabele. #### 3.1.5 Stap 5: Bepaal of het om onafhankelijke of afhankelijke steekproeven gaat Het onderscheid tussen onafhankelijke en afhankelijke steekproeven is cruciaal: * **Onafhankelijke steekproeven:** De samenstelling van de ene steekproef heeft geen invloed op de samenstelling van de andere. * **Afhankelijke steekproeven:** Dezelfde deelnemers worden op meerdere momenten gemeten (longitudinaal) of er is sprake van gematchte paren. #### 3.1.6 Stap 6: Bepaal of we parametrisch of non-parametrisch moeten toetsen Over het algemeen heeft een parametrische toets de voorkeur boven een non-parametrische toets, mits aan de specifieke voorwaarden van de toets wordt voldaan (zoals eerder behandeld). Parametrische toetsen maken gebruik van informatie over de verdeling van de populatie (bv. gemiddelde, standaarddeviatie), terwijl non-parametrische toetsen hier minder strenge eisen aan stellen. Non-parametrische toetsen zijn geschikt wanneer de afhankelijke variabele een lager meetniveau heeft dan interval (ordinaal) of wanneer niet aan de assumpties van normaliteit voor parametrische toetsen is voldaan. #### 3.1.7 Stap 7: Bepaal of we eenzijdig of tweezijdig toetsen In de praktijk wordt doorgaans tweezijdig getoetst om te voorkomen dat men effecten mist. Eenzijdig toetsen is uitzonderlijk en wordt alleen toegepast wanneer er een zeer specifieke, theoretisch onderbouwde verwachting is over de richting van het effect. Het is echter wel belangrijk het verschil tussen eenzijdige en tweezijdige hypotheses te kennen. > **Tip:** Bij het toetsen van normaliteit in SPSS kunnen de Kolmogorov-Smirnov en Shapiro-Wilk toetsen worden gebruikt. De Shapiro-Wilk toets wordt als het meest accuraat beschouwd. Een $p$-waarde groter of gelijk aan $0.05$ wijst op normaliteit, terwijl een $p$-waarde kleiner dan $0.05$ op niet-normaal verdeelde data duidt. ### 3.2 Overzicht van statistische toetsen op basis van onderzoeksvraag Het volgende schema geeft een overzicht van veelgebruikte statistische toetsen, gerangschikt naar het aantal bestudeerde populaties, het type steekproef en het meetniveau van de variabelen. | Situatie | Parametrisch (AV minstens interval, normaal verdeeld) | Non-parametrisch (AV < interval of niet normaal verdeeld) | | :--------------------------------- | :---------------------------------------------------- | :------------------------------------------------------- | | **1 populatie** | Z-toets / T-toets voor één gemiddelde | Chi-kwadraattoets voor frequenties | | **2 onafhankelijke populaties** | T-toets voor twee onafhankelijke steekproeven | Wilcoxon rank-sum test | | **2 afhankelijke populaties** | T-toets voor twee afhankelijke steekproeven | Wilcoxon signed-rank toets | | **Meer dan 2 onafhankelijke populaties** | One-way ANOVA (variantieanalyse) | Kruskal-Wallis toets (niet expliciet genoemd maar analogie) | | **Verband tussen 2 variabelen** | Pearson correlatietoets | Spearman rank correlation, Chi-kwadraattoets voor kruistabellen | ### 3.3 Toepassingsvoorbeelden Hieronder worden enkele voorbeelden uitgewerkt aan de hand van het zeven-stappenplan. #### 3.3.1 Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag **Onderzoeksvraag:** Is er een verband tussen materialisme en agressief rijgedrag bij autobestuurders? * **Stap 1 (Onderzoeksvraag):** Verband tussen materialisme en agressief rijgedrag. * **Stap 2 (AV/OV):** Onafhankelijke variabele: materialisme. Afhankelijke variabele: agressief rijgedrag. * **Stap 3 (Meetniveau):** Beide variabelen worden gemeten met Likert-items, waarbij de totaalscore wordt berekend en omgerekend naar een score op een schaal. Dit leidt tot intervalvariabelen. * **Stap 4 (Aantal populaties):** Eén populatie (alle bestuurders in de steekproef van 564 mannen en vrouwen). * **Stap 5 (Afhankelijk/Onafhankelijk):** Er is sprake van één enkele steekproef; de vraag naar afhankelijke of onafhankelijke steekproeven is hier niet van toepassing. * **Stap 6 (Parametrisch/Non-parametrisch):** Aangezien de afhankelijke variabele van intervalniveau is en de steekproef groot ($N=564$) is, kan worden aangenomen dat de data redelijk normaal verdeeld zijn. Een parametrische toets is aangewezen. * **Stap 7 (Eenzijdig/Tweezijdig):** Standaard tweezijdig toetsen. **Gekozen toets:** Pearson correlatietoets (voor het verband tussen twee intervalvariabelen). #### 3.3.2 Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen **Onderzoeksvraag:** Verschillen mannen en vrouwen in agressief rijgedrag? * **Stap 1 (Onderzoeksvraag):** Verschil in agressief rijgedrag tussen geslachten. * **Stap 2 (AV/OV):** Onafhankelijke variabele: geslacht. Afhankelijke variabele: agressief rijgedrag. * **Stap 3 (Meetniveau):** Geslacht is een nominale variabele. Agressief rijgedrag wordt gemeten met een Likert-schaal met scores van 1 tot 5 (gehele getallen), wat duidt op een ordinaal meetniveau. * **Stap 4 (Aantal populaties):** Twee populaties (mannen en vrouwen). * **Stap 5 (Afhankelijk/Onafhankelijk):** Dit zijn onafhankelijke steekproeven, omdat de mannen en vrouwen geen familie of partners zijn van elkaar. * **Stap 6 (Parametrisch/Non-parametrisch):** Omdat de afhankelijke variabele (agressief rijgedrag) van ordinaal niveau is, kan geen parametrische toets zoals de t-toets voor onafhankelijke steekproeven worden gebruikt. Een non-parametrische toets is noodzakelijk. * **Stap 7 (Eenzijdig/Tweezijdig):** Standaard tweezijdig toetsen. **Gekozen toets:** Wilcoxon rank-sum test (voor het vergelijken van twee onafhankelijke groepen op een ordinale variabele). #### 3.3.3 Voorbeeld 3: Effect van energiedrank/repen op loopprestaties **Onderzoeksvraag:** Welk energievorm (energiedrank, energierepen, beide, geen) heeft het beste effect op de loopprestaties van langeafstandslopers? * **Stap 1 (Onderzoeksvraag):** Vergelijken van loopprestaties tussen verschillende condities van energietoevoer. * **Stap 2 (AV/OV):** Onafhankelijke variabele: energievorm (vier condities). Afhankelijke variabele: loopprestaties (tijd in minuten). * **Stap 3 (Meetniveau):** De onafhankelijke variabele (energievorm) is nominaal. De afhankelijke variabele (looptijd in minuten) is een ratio-variabele, wat ook als interval kan worden beschouwd voor statistische analyses. * **Stap 4 (Aantal populaties):** Vier populaties, overeenkomend met de vier condities. * **Stap 5 (Afhankelijk/Onafhankelijk):** De lopers worden in vier *verschillende* groepen verdeeld, wat duidt op onafhankelijke steekproeven. * **Stap 6 (Parametrisch/Non-parametrisch):** Aangezien de afhankelijke variabele van ratio-/intervalniveau is en er meer dan twee groepen zijn, is een variantieanalyse (ANOVA) geschikt. Bij een grote steekproef ($N=180$) en een interval-/ratiovariabele, kan een parametrische toets worden overwogen. * **Stap 7 (Eenzijdig/Tweezijdig):** Standaard tweezijdig toetsen. **Gekozen toets:** One-way ANOVA (voor het vergelijken van gemiddelden van meer dan twee onafhankelijke groepen op een interval-/ratiovariabele). --- # Toepassingen en voorbeelden van toetskeuze Dit onderdeel illustreert het keuzeproces van statistische toetsen aan de hand van concrete onderzoeksvoorbeelden, waarbij de stappen van een beslisschema worden doorlopen om de geschikte toets te motiveren. ### 4.1 Het proces van toetskeuze Het kiezen van de juiste statistische toets kan een uitdaging zijn en vereist een systematische aanpak. Dit proces kan worden gevisualiseerd aan de hand van een schema dat de onderzoeker door de belangrijkste beslissingsmomenten leidt. #### 4.1.1 De stappen in het keuzeproces Het keuzeproces van een statistische toets kan worden opgedeeld in de volgende essentiële stappen: 1. **Begrip van de onderzoeksvraag:** Zorg ervoor dat de onderzoeksvraag volledig wordt begrepen. Wat wil men precies onderzoeken of aantonen? 2. **Identificatie van variabelen:** Bepaal welke variabelen worden bestudeerd en identificeer de afhankelijke en onafhankelijke variabelen. Een effect wordt onderzocht wanneer er een invloed is van variabele X op variabele Y. Een verband wordt onderzocht wanneer de relatie tussen X en Y centraal staat, zonder noodzakelijk een causale richting te bepalen. 3. **Bepaling van het meetniveau:** Het meetniveau van de variabelen is cruciaal voor de keuze van de toets. * **Nominaal:** Categorieën zonder natuurlijke ordening (bv. geslacht, kleur). * **Ordinaal:** Categorieën met een natuurlijke ordening, maar ongelijke afstanden tussen de categorieën (bv. opleidingsniveau, rangschikking). * **Interval:** Gelijke afstanden tussen waarden, maar geen absoluut nulpunt (bv. temperatuur in Celsius). * **Ratio:** Gelijke afstanden tussen waarden én een absoluut nulpunt (bv. lengte, gewicht, leeftijd). Het verlagen van een meetniveau (bv. van interval naar ordinaal) is altijd mogelijk, maar het verhogen ervan niet. 4. **Aantal populaties:** Bepaal hoeveel populaties er worden bestudeerd. Dit wordt vaak bepaald door het aantal niveaus of categorieën van een onafhankelijke variabele. 5. **Onafhankelijke of afhankelijke steekproeven:** Ga na of de steekproeven onafhankelijk zijn (steekproeven trekken zonder rekening te houden met eerdere steekproeven) of afhankelijk (dezelfde deelnemers worden herhaaldelijk gemeten, of er zijn gematchte paren). 6. **Parametrisch of non-parametrisch toetsen:** Kies tussen parametrische en non-parametrische toetsen. Parametrische toetsen hebben strengere voorwaarden (bv. normaliteit van de afhankelijke variabele, interval- of rationiveau). Non-parametrische toetsen zijn geschikter wanneer deze voorwaarden niet voldaan zijn. Over het algemeen hebben parametrische toetsen meer power als aan de voorwaarden is voldaan. * **Validiteit van normaliteit:** In software zoals SPSS kan de normaliteit van de data worden nagegaan met de Kolmogorov-Smirnov-test of de Shapiro-Wilk-test. De Shapiro-Wilk-test wordt als accurater beschouwd. * **Interpretatie:** Een p-waarde groter dan of gelijk aan 0.05 indiceert dat de data normaal verdeeld zijn. Een p-waarde kleiner dan 0.05 suggereert dat de data niet normaal verdeeld zijn. 7. **Eenzijdig of tweezijdig toetsen:** Bepaal of de hypothese eenzijdig of tweezijdig is. In de praktijk wordt vrijwel altijd tweezijdig getoetst om geen mogelijke effecten te missen. Wel is het belangrijk het verschil tussen eenzijdige en tweezijdige hypotheses te kennen. > **Tip:** Het is raadzaam om al vóór het starten van het onderzoek na te denken over het onderzoeksdesign en de keuze van de statistische methode. Probeer non-parametrische toetsen te vermijden indien mogelijk door te zorgen dat aan de voorwaarden voor parametrische toetsen wordt voldaan. #### 4.1.2 Overzicht van technieken Een overzicht van veelgebruikte statistische toetsen, ingedeeld naar het aantal populaties en het type toets (parametrisch/non-parametrisch), helpt bij de keuze: **Toetsen voor één populatie:** * **Parametrisch:** $z$-toets of $t$-toets voor één gemiddelde. * **Non-parametrisch:** Chi-kwadraattoets voor frequenties. **Toetsen voor twee onafhankelijke populaties:** * **Parametrisch:** $t$-toets voor twee onafhankelijke steekproeven. * **Non-parametrisch:** Wilcoxon rank-sum test. **Toetsen voor twee afhankelijke populaties:** * **Parametrisch:** $t$-toets voor twee afhankelijke steekproeven. * **Non-parametrisch:** Wilcoxon signed-rank test. **Toetsen voor meer dan twee onafhankelijke populaties:** * **Parametrisch:** One-way ANOVA (variantieanalyse). **Toetsen voor het verband tussen twee variabelen:** * **Parametrisch:** Pearson correlatietoets. * **Non-parametrisch:** Spearman rank correlation; Chi-kwadraattoets voor kruistabellen. ### 4.2 Illustratieve voorbeelden Om het keuzeproces te verduidelijken, worden de stappen toegepast op verschillende onderzoeksscenario's. #### 4.2.1 Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag **Onderzoeksvraag:** Wat is het verband tussen materialisme en agressief rijgedrag van autobestuurders? * **Onderzoekseenheden:** 564 mannen en vrouwen tussen 18 en 55 jaar. * **Variabelen:** * Onafhankelijke variabele (OV): Materialisme (gemeten met een vragenlijst, totaalscore omgezet naar een score van 0-150). * Afhankelijke variabele (AV): Agressief rijgedrag (gemeten met een vragenlijst, totaalscore van 0-90). * **Meetniveau:** Beide variabelen worden beschouwd als intervalvariabelen, aangezien ze zijn opgebouwd uit een som van Likert-items en een breed scorebereik hebben. * **Aantal populaties:** Eén populatie wordt bestudeerd. * **Steekproeven:** Er is sprake van één steekproef van bestuurders. * **Parametrisch/Non-parametrisch:** Aangezien de afhankelijke variabele (en ook de onafhankelijke variabele) een intervalniveau heeft en de steekproefomvang groot is ($N = 564$), kan worden aangenomen dat de data voldoen aan de voorwaarden voor parametrische toetsen. * **Toetskeuze:** **Pearson correlatietoets.** * **Eenzijdig/Tweezijdig:** Tweezijdig, omdat men zoekt naar een verband zonder voorafgaande specifieke richting te definiëren. #### 4.2.2 Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen **Onderzoeksvraag:** Is er een verschil in agressief rijgedrag tussen mannen en vrouwen? * **Onderzoekseenheden:** 32 deelnemers. * **Variabelen:** * Onafhankelijke variabele (OV): Geslacht (man/vrouw). * Afhankelijke variabele (AV): Agressief rijgedrag (toegewezen score van 1-5 na observatie). * **Meetniveau:** Geslacht is een nominaal variabele. Agressief rijgedrag, gemeten op een schaal van 1 tot 5 met gehele getallen, kan als ordinaal worden beschouwd. * **Aantal populaties:** Twee populaties worden vergeleken (mannen en vrouwen). * **Steekproeven:** Deelnemende mannen en vrouwen mogen geen familie of partners zijn, wat duidt op onafhankelijke steekproeven. * **Parametrisch/Non-parametrisch:** Omdat de afhankelijke variabele ordinaal is, is een non-parametrische toets noodzakelijk. * **Toetskeuze:** **Wilcoxon rank-sum toets.** * **Eenzijdig/Tweezijdig:** Tweezijdig, om een eventueel verschil in beide richtingen te kunnen detecteren. #### 4.2.3 Voorbeeld 3: Effect van energiedrank en energierepen op loopprestaties **Onderzoeksvraag:** Welk middel (energiedrank, energierepen, beide, of geen) heeft het beste effect op de loopprestaties van langeafstandslopers? * **Onderzoekseenheden:** 180 langeafstandslopers van hetzelfde niveau. * **Variabelen:** * Onafhankelijke variabele (OV): Energiemiddel (vier condities: geen, energiedrank, energierepen, beide). Dit is een nominale variabele. * Afhankelijke variabele (AV): Loopprestatie (tijd in minuten voor een halve marathon). Dit is een ratio variabele. * **Meetniveau:** De onafhankelijke variabele is nominaal, de afhankelijke variabele is ratio. * **Aantal populaties:** Vier groepen (condities) worden vergeleken, wat neerkomt op het vergelijken van vier populaties. * **Steekproeven:** De lopers worden verdeeld in vier groepen, wat duidt op onafhankelijke steekproeven. * **Parametrisch/Non-parametrisch:** Aangezien de afhankelijke variabele een ratio niveau heeft en de steekproefomvang binnen elke groep groot genoeg is ($180/4 = 45$), wordt voldaan aan de voorwaarden voor parametrische toetsen. * **Toetskeuze:** **One-way ANOVA (variantieanalyse).** * **Eenzijdig/Tweezijdig:** Tweezijdig, om eventuele verschillen tussen de groepen te kunnen detecteren. #### 4.2.4 Extra voorbeeld: Onderzoek naar studie-uren en examenresultaten **Onderzoeksvraag:** Is er een verband tussen het aantal studie-uren en het examenresultaat van studenten? * **Onderzoekseenheden:** Een steekproef van studenten. * **Variabelen:** * OV: Aantal studie-uren. * AV: Examenresultaat. * **Meetniveau:** Beide variabelen zijn waarschijnlijk interval- of rationiveau (bv. studie-uren kunnen worden gemeten in uren en minuten, examenresultaten als een score op 100). * **Aantal populaties:** Eén populatie. * **Steekproeven:** Eén steekproef. * **Parametrisch/Non-parametrisch:** Parametrisch, gezien de waarschijnlijke meetniveaus. * **Toetskeuze:** **Pearson correlatietoets.** * **Eenzijdig/Tweezijdig:** Tweezijdig. #### 4.2.5 Extra voorbeeld: Vergelijking van effectiviteit van drie leermethoden **Onderzoeksvraag:** Verschillen de examenresultaten tussen studenten die drie verschillende leermethoden hebben gevolgd? * **Onderzoekseenheden:** Studenten verdeeld over drie groepen. * **Variabelen:** * OV: Leermethode (nominaal, 3 niveaus). * AV: Examenresultaat (interval/ratio). * **Meetniveau:** Leermethode is nominaal, examenresultaat is interval/ratio. * **Aantal populaties:** Drie populaties (één voor elke leermethode). * **Steekproeven:** Onafhankelijke steekproeven. * **Parametrisch/Non-parametrisch:** Parametrisch, omdat de AV een interval/ratio niveau heeft. * **Toetskeuze:** **One-way ANOVA.** * **Eenzijdig/Tweezijdig:** Tweezijdig. #### 4.2.6 Extra voorbeeld: Verschil in tevredenheid tussen drie afdelingen **Onderzoeksvraag:** Verschilt de tevredenheid van medewerkers tussen drie verschillende afdelingen? * **Onderzoekseenheden:** Medewerkers van drie afdelingen. * **Variabelen:** * OV: Afdeling (nominaal, 3 niveaus). * AV: Tevredenheid (bv. gemeten op een Likertschaal, ordinaal/interval). * **Meetniveau:** Afdeling is nominaal. Tevredenheid kan als ordinaal of interval worden beschouwd. Als ordinaal moet een non-parametrische toets worden overwogen. Als interval met normaal verdeelde data een parametrische toets. * **Aantal populaties:** Drie populaties (één voor elke afdeling). * **Steekproeven:** Onafhankelijke steekproeven. * **Parametrisch/Non-parametrisch:** Indien tevredenheid ordinaal is, de **Kruskal-Wallis test** (non-parametrisch alternatief voor ANOVA). Indien tevredenheid interval en data normaal verdeeld, de **One-way ANOVA**. * **Eenzijdig/Tweezijdig:** Tweezijdig. #### 4.2.7 Extra voorbeeld: Relatie tussen stress en slaapkwaliteit **Onderzoeksvraag:** Bestaat er een verband tussen de mate van stress en de ervaren slaapkwaliteit? * **Onderzoekseenheden:** Een groep deelnemers. * **Variabelen:** * Stress: gemeten op een schaal. * Slaapkwaliteit: gemeten op een schaal. * **Meetniveau:** Beide variabelen zijn waarschijnlijk intervalniveau. * **Aantal populaties:** Eén populatie. * **Steekproeven:** Eén steekproef. * **Parametrisch/Non-parametrisch:** Parametrisch. * **Toetskeuze:** **Pearson correlatietoets.** * **Eenzijdig/Tweezijdig:** Tweezijdig. --- ## Veelgemaakte fouten om te vermijden - Bestudeer alle onderwerpen grondig voor examens - Let op formules en belangrijke definities - Oefen met de voorbeelden in elke sectie - Memoriseer niet zonder de onderliggende concepten te begrijpen
NP: - | P: t-toets voor 2 onafh. gem.
NP: Wilcoxon rank-sum toets | P: One-way ANOVA
NP: - | | **Verband** | P: -
NP: Chi-kwadraat toets | P: t-toets voor 2 afh. gem.
NP: Wilcoxon signed rank toets | P: -
NP: - | | **Correlatie** | P: Pearson correlatietoets
NP: Spearman rank correlation | | | | **Frequentietabellen** | P: -
NP: Chi-kwadraat toets | | | **Parametrisch:** Wanneer Afhankelijke Variabele (AV) minstens intervalniveau heeft en de AV normaal verdeeld is. **Non-parametrisch:** Wanneer AV < intervalniveau of AV niet normaal verdeeld is. #### 1.5.5 Extra oefeningen Er worden diverse oefeningen aangeboden die het toepassen van het stappenplan voor het kiezen van de juiste toets versterken, waarbij steeds motivatie voor de gekozen toets gevraagd wordt, rekening houdend met meetniveau en de aard van de data. --- # Leerdoelen en overzicht van statistische toetsen Dit gedeelte definieert de leerdoelen met betrekking tot het kiezen van de juiste statistische toets en biedt een overzicht van diverse statistische technieken, inclusief parametrische en non-parametrische toetsen. ### 2.1 Leerdoelen voor hoorcollege 11 Het examen zal de volgende leerdoelen evalueren: * Het selecteren van de juiste statistische toets op basis van de onderzoeksvraag en de kenmerken van de data. * Het begrijpen en toepassen van het stappenplan voor het kiezen van een statistische toets. ### 2.2 Overzicht van statistische technieken De keuze voor de juiste statistische toets kan uitdagend zijn. Hieronder volgt een overzicht van de besproken toetsen, georganiseerd naar het aantal populaties en het type onderzoeksvraag. #### 2.2.1 Toetsen voor één populatie * **Parametrisch:** * $z$-toets / $t$-toets voor één gemiddelde. * **Non-parametrisch:** * Chi-kwadraattoets voor frequenties. #### 2.2.2 Toetsen voor twee onafhankelijke populaties * **Parametrisch:** * $t$-toets voor twee onafhankelijke steekproeven. * **Non-parametrisch:** * Wilcoxon rank-sum test. #### 2.2.3 Toetsen voor twee afhankelijke populaties * **Parametrisch:** * $t$-toets voor twee afhankelijke steekproeven. * **Non-parametrisch:** * Wilcoxon signed-rank toets. #### 2.2.4 Toetsen voor meer dan twee onafhankelijke populaties * **Parametrisch:** * One-way ANOVA (variantieanalyse). * **Non-parametrisch:** * (Niet besproken in dit hoofdstuk). #### 2.2.5 Toetsen voor het verband tussen twee variabelen * **Parametrisch:** * Pearson correlatietoets. * **Non-parametrisch:** * Spearman rank correlation. * Chi-kwadraattoets voor kruistabellen. #### 2.2.6 Samenvattend overzicht van toetsen | Studieontwerp / Aantal populaties | Onderzoeksvraag: Verschil in gemiddelden | Onderzoeksvraag: Verband | | :--------------------------------- | :---------------------------------------- | :----------------------- | | **1 Populatie** | Parametrisch: $z$/$t$-toets voor één gemiddelde
Non-parametrisch: Chi-kwadraattoets voor frequenties | - | | **2 Onafhankelijke Populaties** | Parametrisch: $t$-toets voor 2 onafhankelijke steekproeven
Non-parametrisch: Wilcoxon rank-sum test | - | | **2 Afhankelijke Populaties** | Parametrisch: $t$-toets voor 2 afhankelijke steekproeven
Non-parametrisch: Wilcoxon signed-rank toets | - | | **Meer dan 2 Onafhankelijke Populaties** | Parametrisch: One-way ANOVA
Non-parametrisch: - | - | | **Verband tussen 2 Variabelen** | - | Parametrisch: Pearson correlatie
Non-parametrisch: Spearman correlatie, Chi-kwadraattoets voor kruistabellen | #### 2.2.7 Parametrisch versus Non-parametrisch * **Parametrische toetsen:** * Vereisen dat de afhankelijke variabele (AV) minstens van intervalniveau is. * Vereisen dat de AV normaal verdeeld is binnen de populatie(s). * Worden over het algemeen verkozen boven non-parametrische toetsen indien de voorwaarden voldaan zijn, omdat ze meer power hebben. * **Non-parametrische toetsen:** * Worden gebruikt wanneer de AV een lager meetniveau heeft (nominaal of ordinaal) of wanneer de data niet normaal verdeeld zijn. ### 2.3 Stappenplan voor het kiezen van de juiste toets Het correct kiezen van een statistische toets vereist een systematische aanpak. De volgende stappen helpen bij het ontleden van de onderzoeksvraag en het selecteren van de geschikte analyse. #### 2.3.1 Stap 1: Begrijp de onderzoeksvraag * Wat is de centrale vraag die beantwoord moet worden? * Gaat het om het vaststellen van een effect (variabele X op Y) of een verband (tussen X en Y)? #### 2.3.2 Stap 2: Identificeer de variabelen * Wat zijn de afhankelijke en onafhankelijke variabelen in het onderzoek? * Een effect-onderzoek focust op de invloed van de onafhankelijke variabele (OV) op de afhankelijke variabele (AV). * Een verband-onderzoek onderzoekt de relatie tussen twee variabelen, waarbij de richting niet noodzakelijk vaststaat (correlatie ≠ causaliteit). #### 2.3.3 Stap 3: Bepaal het meetniveau van de variabelen Het meetniveau van de variabelen is cruciaal voor de toetskeuze. * **Nominaal:** Categorieën zonder rangorde (bv. geslacht, haarkleur). * **Ordinaal:** Categorieën met een logische rangorde, maar ongelijke intervallen (bv. Likert-schalen, opleidingsniveau). * **Interval:** Gelijkwaardige intervallen tussen waarden, geen absoluut nulpunt (bv. temperatuur in Celsius, IQ-score). * **Ratio:** Gelijkwaardige intervallen én een absoluut nulpunt (bv. lengte, gewicht, leeftijd, reactietijd). > **Tip:** Het verlagen van een meetniveau (bv. van interval naar ordinaal) is altijd mogelijk, maar het verhogen ervan niet. #### 2.3.4 Stap 4: Bepaal het aantal te bestuderen populaties Dit wordt bepaald door het aantal niveaus of categorieën van de onafhankelijke variabele. #### 2.3.5 Stap 5: Ga na of de steekproeven afhankelijk of onafhankelijk zijn * **Onafhankelijke steekproeven:** De selectie van de ene steekproef heeft geen invloed op de selectie van de andere. * **Afhankelijke steekproeven:** De steekproeven zijn gerelateerd. Dit kan komen doordat dezelfde deelnemers op meerdere momenten gemeten worden (bv. voor- en nameting) of doordat paren van deelnemers gematcht zijn. #### 2.3.6 Stap 6: Kies tussen parametrische en non-parametrische toetsen * Controleer of de AV minstens intervalniveau heeft en voldoet aan de aannames van normaliteit. Indien ja, kies een parametrische toets. * Indien de AV ordinaal of nominaal is, of niet normaal verdeeld is, kies een non-parametrische toets. * In SPSS kan de normaliteit worden nagegaan met de Kolmogorov-Smirnov en Shapiro-Wilk toetsen. De Shapiro-Wilk toets wordt als accuraater beschouwd. * Een $p$-waarde groter dan of gelijk aan 0.05 suggereert normaliteit. * Een $p$-waarde kleiner dan 0.05 suggereert niet-normaal verdeelde data. #### 2.3.7 Stap 7: Bepaal of de toets eenzijdig of tweezijdig is * **Tweezijdig toetsen:** Standaard in de praktijk om alle mogelijke effecten of verbanden te detecteren. De nulhypothese ($H_0$) stelt dat er geen verschil of verband is, en de alternatieve hypothese ($H_1$) stelt dat er wel een verschil of verband is, zonder specificatie van de richting. * **Eenzijdig toetsen:** Wordt enkel gebruikt wanneer er een sterke theoretische onderbouwing is om een specifieke richting van het effect of verband te verwachten. De alternatieve hypothese specificeert de richting van het verschil of verband. > **Tip:** Tenzij er een zeer duidelijke theoretische reden is, is het aan te raden om altijd tweezijdig te toetsen om geen potentiële effecten te missen. ### 2.4 Voorbeelden van toetskeuzes #### 2.4.1 Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag * **Onderzoeksvraag:** Zoeken naar het verband tussen materialisme en agressief rijgedrag van autobestuurders. * **Variabelen:** * OV: Materialisme (gemeten via Likert-items, totaalscore omgerekend naar 0-150). * AV: Agressief rijgedrag (gemeten via Likert-items, totaalscore 0-90). * **Meetniveau:** Beide variabelen worden als interval beschouwd (combinatie van Likert-schalen resulteert in intervalniveau). * **Aantal populaties:** Eén populatie (bestuurders). * **Steekproeven:** Niet van toepassing, er is één steekproef. * **Parametrisch/Non-parametrisch:** Parametrisch, omdat de AV intervalniveau heeft en met een grote steekproef ($N=564$) aangenomen kan worden dat de data (ongeveer) normaal verdeeld zijn. * **Toets:** Pearson correlatietoets. * **Eenzijdig/Tweezijdig:** Tweezijdig, om een eventueel verband in beide richtingen te detecteren. #### 2.4.2 Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen * **Onderzoeksvraag:** Zoeken naar een verschil tussen mannen en vrouwen op gebied van agressief rijgedrag. * **Variabelen:** * OV: Geslacht (man/vrouw). * AV: Agressief rijgedrag (gemeten op een schaal van 1 tot 5, geheel getal). * **Meetniveau:** Geslacht is nominaal. Agressief rijgedrag is ordinaal (rangorde, maar de intervallen zijn niet per se gelijk). * **Aantal populaties:** Twee populaties (mannen en vrouwen). * **Steekproeven:** Onafhankelijke steekproeven (mannen en vrouwen zijn geen familie/partners van elkaar). * **Parametrisch/Non-parametrisch:** Non-parametrisch, omdat de AV ordinaal is. * **Toets:** Wilcoxon rank-sum test. * **Eenzijdig/Tweezijdig:** Tweezijdig. #### 2.4.3 Voorbeeld 3: Effect van energiedrank/repen op prestaties * **Onderzoeksvraag:** Welk middel (energiedrank, energierepen, beide, of geen) heeft het beste effect op de loopprestaties van langeafstandslopers? * **Variabelen:** * OV: Energiemiddel (geen, energiedrank, energierepen, beide). * AV: Prestatietijd in minuten. * **Meetniveau:** Energiemiddel is nominaal. Prestatietijd is ratio. * **Aantal populaties:** Vier condities (die als vier populaties beschouwd kunnen worden). * **Steekproeven:** Onafhankelijke steekproeven (verschillende groepen lopers). * **Parametrisch/Non-parametrisch:** Parametrisch, omdat de AV ratio is en de steekproefgrootte ($N=180$, verdeeld over 4 groepen, dus $N \approx 45$ per groep) suggereert dat de normaliteitsassumptie redelijk zal gelden. * **Toets:** One-way ANOVA. * **Eenzijdig/Tweezijdig:** Tweezijdig. ### 2.5 Belangrijke overwegingen * De keuze van de statistische methode is sterk afhankelijk van het onderzoeksdesign. * Het is aan te raden om al vóór het uitvoeren van het onderzoek na te denken over de te gebruiken statistische methoden. * Non-parametrische toetsen worden bij voorkeur vermeden indien de voorwaarden voor parametrische toetsen vervuld zijn, vanwege hun lagere power. > **Tip:** Gebruik dit stappenplan consequent bij het oefenen met verschillende onderzoeksvoorbeelden om de vaardigheid in het kiezen van de juiste toets te verbeteren. --- # Stappenplan voor het kiezen van de juiste statistische toets Dit hoofdstuk biedt een systematisch stappenplan om de geschikte statistische toets te selecteren voor een gegeven onderzoeksvraag, beginnend bij de vraag zelf en eindigend met de overweging tussen een eenzijdige of tweezijdige toets. ### 3.1 De zeven stappen voor het kiezen van de juiste toets Het selecteren van de correcte statistische toets is cruciaal voor de validiteit van onderzoeksresultaten. Dit proces kan worden opgedeeld in zeven logische stappen: #### 3.1.1 Stap 1: Ontleed de onderzoeksvraag De allereerste stap is het grondig begrijpen van de onderzoeksvraag. Hierbij is het essentieel om te identificeren welke variabelen bestudeerd worden en wat de onderzoekseenheden (bijvoorbeeld personen, groepen, objecten) zijn. #### 3.1.2 Stap 2: Bepaal de afhankelijke en onafhankelijke variabelen Vervolgens moeten de afhankelijke variabele (AV) en de onafhankelijke variabele (OV) worden vastgesteld. Dit onderscheid is fundamenteel voor het bepalen van de meetniveaus en het begrijpen van de aard van het onderzochte verband: * **Effect:** Onderzoek naar het effect van variabele X op variabele Y. * **Verband:** Onderzoek naar de relatie tussen variabele X en variabele Y, waarbij de richting (causaliteit) niet noodzakelijk wordt bepaald. #### 3.1.3 Stap 3: Bepaal het meetniveau van de variabelen Het meetniveau van de variabelen (nominaal, ordinaal, interval, ratio) is een van de meest bepalende factoren voor de keuze van de statistische toets. Daarnaast zijn de voorwaarden die aan verschillende toetsen verbonden zijn (zoals normaliteit van de verdeling, intervalniveau van de AV) hier ook van belang. Het verlagen van een meetniveau is toegestaan (bijvoorbeeld van interval naar ordinaal), maar het verhogen ervan niet. De vier meetniveaus zijn: * **Nominaal:** Categorieën zonder rangorde (bv. geslacht). * **Ordinaal:** Categorieën met een rangorde, maar zonder gelijke intervallen (bv. opleidingsniveau). * **Interval:** Gelijkwaardige intervallen tussen waarden, maar geen absoluut nulpunt (bv. temperatuur in Celsius). * **Ratio:** Gelijkwaardige intervallen en een absoluut nulpunt (bv. lengte, gewicht). #### 3.1.4 Stap 4: Bepaal het aantal te bestuderen populaties Sommige statistische toetsen vereisen een duidelijk inzicht in het aantal te bestuderen populaties. Dit aantal wordt bepaald door het aantal niveaus of categorieën van de onafhankelijke variabele. #### 3.1.5 Stap 5: Bepaal of het om onafhankelijke of afhankelijke steekproeven gaat Het onderscheid tussen onafhankelijke en afhankelijke steekproeven is cruciaal: * **Onafhankelijke steekproeven:** De samenstelling van de ene steekproef heeft geen invloed op de samenstelling van de andere. * **Afhankelijke steekproeven:** Dezelfde deelnemers worden op meerdere momenten gemeten (longitudinaal) of er is sprake van gematchte paren. #### 3.1.6 Stap 6: Bepaal of we parametrisch of non-parametrisch moeten toetsen Over het algemeen heeft een parametrische toets de voorkeur boven een non-parametrische toets, mits aan de specifieke voorwaarden van de toets wordt voldaan (zoals eerder behandeld). Parametrische toetsen maken gebruik van informatie over de verdeling van de populatie (bv. gemiddelde, standaarddeviatie), terwijl non-parametrische toetsen hier minder strenge eisen aan stellen. Non-parametrische toetsen zijn geschikt wanneer de afhankelijke variabele een lager meetniveau heeft dan interval (ordinaal) of wanneer niet aan de assumpties van normaliteit voor parametrische toetsen is voldaan. #### 3.1.7 Stap 7: Bepaal of we eenzijdig of tweezijdig toetsen In de praktijk wordt doorgaans tweezijdig getoetst om te voorkomen dat men effecten mist. Eenzijdig toetsen is uitzonderlijk en wordt alleen toegepast wanneer er een zeer specifieke, theoretisch onderbouwde verwachting is over de richting van het effect. Het is echter wel belangrijk het verschil tussen eenzijdige en tweezijdige hypotheses te kennen. > **Tip:** Bij het toetsen van normaliteit in SPSS kunnen de Kolmogorov-Smirnov en Shapiro-Wilk toetsen worden gebruikt. De Shapiro-Wilk toets wordt als het meest accuraat beschouwd. Een $p$-waarde groter of gelijk aan $0.05$ wijst op normaliteit, terwijl een $p$-waarde kleiner dan $0.05$ op niet-normaal verdeelde data duidt. ### 3.2 Overzicht van statistische toetsen op basis van onderzoeksvraag Het volgende schema geeft een overzicht van veelgebruikte statistische toetsen, gerangschikt naar het aantal bestudeerde populaties, het type steekproef en het meetniveau van de variabelen. | Situatie | Parametrisch (AV minstens interval, normaal verdeeld) | Non-parametrisch (AV < interval of niet normaal verdeeld) | | :--------------------------------- | :---------------------------------------------------- | :------------------------------------------------------- | | **1 populatie** | Z-toets / T-toets voor één gemiddelde | Chi-kwadraattoets voor frequenties | | **2 onafhankelijke populaties** | T-toets voor twee onafhankelijke steekproeven | Wilcoxon rank-sum test | | **2 afhankelijke populaties** | T-toets voor twee afhankelijke steekproeven | Wilcoxon signed-rank toets | | **Meer dan 2 onafhankelijke populaties** | One-way ANOVA (variantieanalyse) | Kruskal-Wallis toets (niet expliciet genoemd maar analogie) | | **Verband tussen 2 variabelen** | Pearson correlatietoets | Spearman rank correlation, Chi-kwadraattoets voor kruistabellen | ### 3.3 Toepassingsvoorbeelden Hieronder worden enkele voorbeelden uitgewerkt aan de hand van het zeven-stappenplan. #### 3.3.1 Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag **Onderzoeksvraag:** Is er een verband tussen materialisme en agressief rijgedrag bij autobestuurders? * **Stap 1 (Onderzoeksvraag):** Verband tussen materialisme en agressief rijgedrag. * **Stap 2 (AV/OV):** Onafhankelijke variabele: materialisme. Afhankelijke variabele: agressief rijgedrag. * **Stap 3 (Meetniveau):** Beide variabelen worden gemeten met Likert-items, waarbij de totaalscore wordt berekend en omgerekend naar een score op een schaal. Dit leidt tot intervalvariabelen. * **Stap 4 (Aantal populaties):** Eén populatie (alle bestuurders in de steekproef van 564 mannen en vrouwen). * **Stap 5 (Afhankelijk/Onafhankelijk):** Er is sprake van één enkele steekproef; de vraag naar afhankelijke of onafhankelijke steekproeven is hier niet van toepassing. * **Stap 6 (Parametrisch/Non-parametrisch):** Aangezien de afhankelijke variabele van intervalniveau is en de steekproef groot ($N=564$) is, kan worden aangenomen dat de data redelijk normaal verdeeld zijn. Een parametrische toets is aangewezen. * **Stap 7 (Eenzijdig/Tweezijdig):** Standaard tweezijdig toetsen. **Gekozen toets:** Pearson correlatietoets (voor het verband tussen twee intervalvariabelen). #### 3.3.2 Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen **Onderzoeksvraag:** Verschillen mannen en vrouwen in agressief rijgedrag? * **Stap 1 (Onderzoeksvraag):** Verschil in agressief rijgedrag tussen geslachten. * **Stap 2 (AV/OV):** Onafhankelijke variabele: geslacht. Afhankelijke variabele: agressief rijgedrag. * **Stap 3 (Meetniveau):** Geslacht is een nominale variabele. Agressief rijgedrag wordt gemeten met een Likert-schaal met scores van 1 tot 5 (gehele getallen), wat duidt op een ordinaal meetniveau. * **Stap 4 (Aantal populaties):** Twee populaties (mannen en vrouwen). * **Stap 5 (Afhankelijk/Onafhankelijk):** Dit zijn onafhankelijke steekproeven, omdat de mannen en vrouwen geen familie of partners zijn van elkaar. * **Stap 6 (Parametrisch/Non-parametrisch):** Omdat de afhankelijke variabele (agressief rijgedrag) van ordinaal niveau is, kan geen parametrische toets zoals de t-toets voor onafhankelijke steekproeven worden gebruikt. Een non-parametrische toets is noodzakelijk. * **Stap 7 (Eenzijdig/Tweezijdig):** Standaard tweezijdig toetsen. **Gekozen toets:** Wilcoxon rank-sum test (voor het vergelijken van twee onafhankelijke groepen op een ordinale variabele). #### 3.3.3 Voorbeeld 3: Effect van energiedrank/repen op loopprestaties **Onderzoeksvraag:** Welk energievorm (energiedrank, energierepen, beide, geen) heeft het beste effect op de loopprestaties van langeafstandslopers? * **Stap 1 (Onderzoeksvraag):** Vergelijken van loopprestaties tussen verschillende condities van energietoevoer. * **Stap 2 (AV/OV):** Onafhankelijke variabele: energievorm (vier condities). Afhankelijke variabele: loopprestaties (tijd in minuten). * **Stap 3 (Meetniveau):** De onafhankelijke variabele (energievorm) is nominaal. De afhankelijke variabele (looptijd in minuten) is een ratio-variabele, wat ook als interval kan worden beschouwd voor statistische analyses. * **Stap 4 (Aantal populaties):** Vier populaties, overeenkomend met de vier condities. * **Stap 5 (Afhankelijk/Onafhankelijk):** De lopers worden in vier *verschillende* groepen verdeeld, wat duidt op onafhankelijke steekproeven. * **Stap 6 (Parametrisch/Non-parametrisch):** Aangezien de afhankelijke variabele van ratio-/intervalniveau is en er meer dan twee groepen zijn, is een variantieanalyse (ANOVA) geschikt. Bij een grote steekproef ($N=180$) en een interval-/ratiovariabele, kan een parametrische toets worden overwogen. * **Stap 7 (Eenzijdig/Tweezijdig):** Standaard tweezijdig toetsen. **Gekozen toets:** One-way ANOVA (voor het vergelijken van gemiddelden van meer dan twee onafhankelijke groepen op een interval-/ratiovariabele). --- # Toepassingen en voorbeelden van toetskeuze Dit onderdeel illustreert het keuzeproces van statistische toetsen aan de hand van concrete onderzoeksvoorbeelden, waarbij de stappen van een beslisschema worden doorlopen om de geschikte toets te motiveren. ### 4.1 Het proces van toetskeuze Het kiezen van de juiste statistische toets kan een uitdaging zijn en vereist een systematische aanpak. Dit proces kan worden gevisualiseerd aan de hand van een schema dat de onderzoeker door de belangrijkste beslissingsmomenten leidt. #### 4.1.1 De stappen in het keuzeproces Het keuzeproces van een statistische toets kan worden opgedeeld in de volgende essentiële stappen: 1. **Begrip van de onderzoeksvraag:** Zorg ervoor dat de onderzoeksvraag volledig wordt begrepen. Wat wil men precies onderzoeken of aantonen? 2. **Identificatie van variabelen:** Bepaal welke variabelen worden bestudeerd en identificeer de afhankelijke en onafhankelijke variabelen. Een effect wordt onderzocht wanneer er een invloed is van variabele X op variabele Y. Een verband wordt onderzocht wanneer de relatie tussen X en Y centraal staat, zonder noodzakelijk een causale richting te bepalen. 3. **Bepaling van het meetniveau:** Het meetniveau van de variabelen is cruciaal voor de keuze van de toets. * **Nominaal:** Categorieën zonder natuurlijke ordening (bv. geslacht, kleur). * **Ordinaal:** Categorieën met een natuurlijke ordening, maar ongelijke afstanden tussen de categorieën (bv. opleidingsniveau, rangschikking). * **Interval:** Gelijke afstanden tussen waarden, maar geen absoluut nulpunt (bv. temperatuur in Celsius). * **Ratio:** Gelijke afstanden tussen waarden én een absoluut nulpunt (bv. lengte, gewicht, leeftijd). Het verlagen van een meetniveau (bv. van interval naar ordinaal) is altijd mogelijk, maar het verhogen ervan niet. 4. **Aantal populaties:** Bepaal hoeveel populaties er worden bestudeerd. Dit wordt vaak bepaald door het aantal niveaus of categorieën van een onafhankelijke variabele. 5. **Onafhankelijke of afhankelijke steekproeven:** Ga na of de steekproeven onafhankelijk zijn (steekproeven trekken zonder rekening te houden met eerdere steekproeven) of afhankelijk (dezelfde deelnemers worden herhaaldelijk gemeten, of er zijn gematchte paren). 6. **Parametrisch of non-parametrisch toetsen:** Kies tussen parametrische en non-parametrische toetsen. Parametrische toetsen hebben strengere voorwaarden (bv. normaliteit van de afhankelijke variabele, interval- of rationiveau). Non-parametrische toetsen zijn geschikter wanneer deze voorwaarden niet voldaan zijn. Over het algemeen hebben parametrische toetsen meer power als aan de voorwaarden is voldaan. * **Validiteit van normaliteit:** In software zoals SPSS kan de normaliteit van de data worden nagegaan met de Kolmogorov-Smirnov-test of de Shapiro-Wilk-test. De Shapiro-Wilk-test wordt als accurater beschouwd. * **Interpretatie:** Een p-waarde groter dan of gelijk aan 0.05 indiceert dat de data normaal verdeeld zijn. Een p-waarde kleiner dan 0.05 suggereert dat de data niet normaal verdeeld zijn. 7. **Eenzijdig of tweezijdig toetsen:** Bepaal of de hypothese eenzijdig of tweezijdig is. In de praktijk wordt vrijwel altijd tweezijdig getoetst om geen mogelijke effecten te missen. Wel is het belangrijk het verschil tussen eenzijdige en tweezijdige hypotheses te kennen. > **Tip:** Het is raadzaam om al vóór het starten van het onderzoek na te denken over het onderzoeksdesign en de keuze van de statistische methode. Probeer non-parametrische toetsen te vermijden indien mogelijk door te zorgen dat aan de voorwaarden voor parametrische toetsen wordt voldaan. #### 4.1.2 Overzicht van technieken Een overzicht van veelgebruikte statistische toetsen, ingedeeld naar het aantal populaties en het type toets (parametrisch/non-parametrisch), helpt bij de keuze: **Toetsen voor één populatie:** * **Parametrisch:** $z$-toets of $t$-toets voor één gemiddelde. * **Non-parametrisch:** Chi-kwadraattoets voor frequenties. **Toetsen voor twee onafhankelijke populaties:** * **Parametrisch:** $t$-toets voor twee onafhankelijke steekproeven. * **Non-parametrisch:** Wilcoxon rank-sum test. **Toetsen voor twee afhankelijke populaties:** * **Parametrisch:** $t$-toets voor twee afhankelijke steekproeven. * **Non-parametrisch:** Wilcoxon signed-rank test. **Toetsen voor meer dan twee onafhankelijke populaties:** * **Parametrisch:** One-way ANOVA (variantieanalyse). **Toetsen voor het verband tussen twee variabelen:** * **Parametrisch:** Pearson correlatietoets. * **Non-parametrisch:** Spearman rank correlation; Chi-kwadraattoets voor kruistabellen. ### 4.2 Illustratieve voorbeelden Om het keuzeproces te verduidelijken, worden de stappen toegepast op verschillende onderzoeksscenario's. #### 4.2.1 Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag **Onderzoeksvraag:** Wat is het verband tussen materialisme en agressief rijgedrag van autobestuurders? * **Onderzoekseenheden:** 564 mannen en vrouwen tussen 18 en 55 jaar. * **Variabelen:** * Onafhankelijke variabele (OV): Materialisme (gemeten met een vragenlijst, totaalscore omgezet naar een score van 0-150). * Afhankelijke variabele (AV): Agressief rijgedrag (gemeten met een vragenlijst, totaalscore van 0-90). * **Meetniveau:** Beide variabelen worden beschouwd als intervalvariabelen, aangezien ze zijn opgebouwd uit een som van Likert-items en een breed scorebereik hebben. * **Aantal populaties:** Eén populatie wordt bestudeerd. * **Steekproeven:** Er is sprake van één steekproef van bestuurders. * **Parametrisch/Non-parametrisch:** Aangezien de afhankelijke variabele (en ook de onafhankelijke variabele) een intervalniveau heeft en de steekproefomvang groot is ($N = 564$), kan worden aangenomen dat de data voldoen aan de voorwaarden voor parametrische toetsen. * **Toetskeuze:** **Pearson correlatietoets.** * **Eenzijdig/Tweezijdig:** Tweezijdig, omdat men zoekt naar een verband zonder voorafgaande specifieke richting te definiëren. #### 4.2.2 Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen **Onderzoeksvraag:** Is er een verschil in agressief rijgedrag tussen mannen en vrouwen? * **Onderzoekseenheden:** 32 deelnemers. * **Variabelen:** * Onafhankelijke variabele (OV): Geslacht (man/vrouw). * Afhankelijke variabele (AV): Agressief rijgedrag (toegewezen score van 1-5 na observatie). * **Meetniveau:** Geslacht is een nominaal variabele. Agressief rijgedrag, gemeten op een schaal van 1 tot 5 met gehele getallen, kan als ordinaal worden beschouwd. * **Aantal populaties:** Twee populaties worden vergeleken (mannen en vrouwen). * **Steekproeven:** Deelnemende mannen en vrouwen mogen geen familie of partners zijn, wat duidt op onafhankelijke steekproeven. * **Parametrisch/Non-parametrisch:** Omdat de afhankelijke variabele ordinaal is, is een non-parametrische toets noodzakelijk. * **Toetskeuze:** **Wilcoxon rank-sum toets.** * **Eenzijdig/Tweezijdig:** Tweezijdig, om een eventueel verschil in beide richtingen te kunnen detecteren. #### 4.2.3 Voorbeeld 3: Effect van energiedrank en energierepen op loopprestaties **Onderzoeksvraag:** Welk middel (energiedrank, energierepen, beide, of geen) heeft het beste effect op de loopprestaties van langeafstandslopers? * **Onderzoekseenheden:** 180 langeafstandslopers van hetzelfde niveau. * **Variabelen:** * Onafhankelijke variabele (OV): Energiemiddel (vier condities: geen, energiedrank, energierepen, beide). Dit is een nominale variabele. * Afhankelijke variabele (AV): Loopprestatie (tijd in minuten voor een halve marathon). Dit is een ratio variabele. * **Meetniveau:** De onafhankelijke variabele is nominaal, de afhankelijke variabele is ratio. * **Aantal populaties:** Vier groepen (condities) worden vergeleken, wat neerkomt op het vergelijken van vier populaties. * **Steekproeven:** De lopers worden verdeeld in vier groepen, wat duidt op onafhankelijke steekproeven. * **Parametrisch/Non-parametrisch:** Aangezien de afhankelijke variabele een ratio niveau heeft en de steekproefomvang binnen elke groep groot genoeg is ($180/4 = 45$), wordt voldaan aan de voorwaarden voor parametrische toetsen. * **Toetskeuze:** **One-way ANOVA (variantieanalyse).** * **Eenzijdig/Tweezijdig:** Tweezijdig, om eventuele verschillen tussen de groepen te kunnen detecteren. #### 4.2.4 Extra voorbeeld: Onderzoek naar studie-uren en examenresultaten **Onderzoeksvraag:** Is er een verband tussen het aantal studie-uren en het examenresultaat van studenten? * **Onderzoekseenheden:** Een steekproef van studenten. * **Variabelen:** * OV: Aantal studie-uren. * AV: Examenresultaat. * **Meetniveau:** Beide variabelen zijn waarschijnlijk interval- of rationiveau (bv. studie-uren kunnen worden gemeten in uren en minuten, examenresultaten als een score op 100). * **Aantal populaties:** Eén populatie. * **Steekproeven:** Eén steekproef. * **Parametrisch/Non-parametrisch:** Parametrisch, gezien de waarschijnlijke meetniveaus. * **Toetskeuze:** **Pearson correlatietoets.** * **Eenzijdig/Tweezijdig:** Tweezijdig. #### 4.2.5 Extra voorbeeld: Vergelijking van effectiviteit van drie leermethoden **Onderzoeksvraag:** Verschillen de examenresultaten tussen studenten die drie verschillende leermethoden hebben gevolgd? * **Onderzoekseenheden:** Studenten verdeeld over drie groepen. * **Variabelen:** * OV: Leermethode (nominaal, 3 niveaus). * AV: Examenresultaat (interval/ratio). * **Meetniveau:** Leermethode is nominaal, examenresultaat is interval/ratio. * **Aantal populaties:** Drie populaties (één voor elke leermethode). * **Steekproeven:** Onafhankelijke steekproeven. * **Parametrisch/Non-parametrisch:** Parametrisch, omdat de AV een interval/ratio niveau heeft. * **Toetskeuze:** **One-way ANOVA.** * **Eenzijdig/Tweezijdig:** Tweezijdig. #### 4.2.6 Extra voorbeeld: Verschil in tevredenheid tussen drie afdelingen **Onderzoeksvraag:** Verschilt de tevredenheid van medewerkers tussen drie verschillende afdelingen? * **Onderzoekseenheden:** Medewerkers van drie afdelingen. * **Variabelen:** * OV: Afdeling (nominaal, 3 niveaus). * AV: Tevredenheid (bv. gemeten op een Likertschaal, ordinaal/interval). * **Meetniveau:** Afdeling is nominaal. Tevredenheid kan als ordinaal of interval worden beschouwd. Als ordinaal moet een non-parametrische toets worden overwogen. Als interval met normaal verdeelde data een parametrische toets. * **Aantal populaties:** Drie populaties (één voor elke afdeling). * **Steekproeven:** Onafhankelijke steekproeven. * **Parametrisch/Non-parametrisch:** Indien tevredenheid ordinaal is, de **Kruskal-Wallis test** (non-parametrisch alternatief voor ANOVA). Indien tevredenheid interval en data normaal verdeeld, de **One-way ANOVA**. * **Eenzijdig/Tweezijdig:** Tweezijdig. #### 4.2.7 Extra voorbeeld: Relatie tussen stress en slaapkwaliteit **Onderzoeksvraag:** Bestaat er een verband tussen de mate van stress en de ervaren slaapkwaliteit? * **Onderzoekseenheden:** Een groep deelnemers. * **Variabelen:** * Stress: gemeten op een schaal. * Slaapkwaliteit: gemeten op een schaal. * **Meetniveau:** Beide variabelen zijn waarschijnlijk intervalniveau. * **Aantal populaties:** Eén populatie. * **Steekproeven:** Eén steekproef. * **Parametrisch/Non-parametrisch:** Parametrisch. * **Toetskeuze:** **Pearson correlatietoets.** * **Eenzijdig/Tweezijdig:** Tweezijdig. --- ## Veelgemaakte fouten om te vermijden - Bestudeer alle onderwerpen grondig voor examens - Let op formules en belangrijke definities - Oefen met de voorbeelden in elke sectie - Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Toets-statistiek | Een statistische waarde die wordt berekend uit steekproefgegevens om te beslissen over het verwerpen of behouden van de nulhypothese. De waarde helpt bij het beoordelen van de significantie van de gevonden resultaten in relatie tot de hypothetische populatieparameters. |
| Kritieke waarde | Een drempelwaarde in de verdeling van de toetsstatistiek die wordt gebruikt om te bepalen of een resultaat statistisch significant is. Als de berekende toetsstatistiek deze waarde overschrijdt, wordt de nulhypothese verworpen. |
| Significant | Een resultaat wordt als significant beschouwd wanneer het waarschijnlijk is dat het niet door toeval is ontstaan, maar een echt effect of verband in de populatie weerspiegelt. Dit wordt meestal bepaald aan de hand van een vooraf vastgesteld significantieniveau. |
| Nulhypothese (H0) | Een statistische hypothese die stelt dat er geen significant effect of verband is tussen variabelen, of dat er geen verschil is tussen groepen. Het is de hypothese die we proberen te weerleggen met ons onderzoek. |
| Parametrische toets | Een statistische toets die bepaalde aannames maakt over de verdeling van de populatieparameters, zoals normaliteit en gelijke varianties. Deze toetsen zijn doorgaans krachtiger dan non-parametrische toetsen indien aan de voorwaarden is voldaan. |
| Non-parametrische toets | Een statistische toets die minder strikte aannames maakt over de verdeling van de populatieparameters. Ze zijn geschikt wanneer de data niet voldoen aan de voorwaarden voor parametrische toetsen, bijvoorbeeld bij ordinale data of scheve verdelingen. |
| Meetniveau | De schaal waarop een variabele wordt gemeten, wat bepaalt welke statistische analyses mogelijk zijn. De meest voorkomende meetniveaus zijn nominaal, ordinaal, interval en ratio. |
| Onafhankelijke variabele | De variabele die wordt gemanipuleerd of die wordt beschouwd als de oorzaak in een onderzoek. Het effect van deze variabele op de afhankelijke variabele wordt bestudeerd. |
| Afhankelijke variabele | De variabele die wordt gemeten om het effect van de onafhankelijke variabele te observeren. Deze variabele wordt beschouwd als het gevolg of de uitkomst van de manipulatie van de onafhankelijke variabele. |
| Steekproef | Een subset van de populatie die wordt geselecteerd voor onderzoek. De resultaten van de steekproef worden gebruikt om conclusies te trekken over de gehele populatie. |
| Steekproefdesign | De manier waarop de steekproeven worden getrokken en hoe de relatie tussen verschillende groepen of metingen is gestructureerd, wat kan leiden tot afhankelijke of onafhankelijke steekproeven. |
| Eenzijdige toets | Een statistische toets waarbij de hypothese een specifieke richting van een effect of verschil aangeeft (bijvoorbeeld, A is groter dan B). De alternatieve hypothese specificeert een richting. |
| Tweezijdige toets | Een statistische toets waarbij de hypothese aangeeft dat er een verschil of effect is, zonder een specifieke richting te specificeren (bijvoorbeeld, A is niet gelijk aan B). Dit is de standaard in veel onderzoek. |
| P-waarde | De waarschijnlijkheid om de geobserveerde resultaten te verkrijgen, of extremere resultaten, gegeven dat de nulhypothese waar is. Een lage p-waarde (typisch < 0.05) leidt tot verwerping van de nulhypothese. |
| Variantieanalyse (ANOVA) | Een statistische techniek die wordt gebruikt om de gemiddelden van drie of meer groepen te vergelijken. Het deelt de totale variantie in de data op in verschillende bronnen. |
| t-toets | Een statistische toets die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen. Er zijn varianten voor één gemiddelde, twee onafhankelijke gemiddelden en twee afhankelijke gemiddelden. |
| Pearsoncorrelatie | Een statistische maat die de sterkte en richting van een lineair verband tussen twee continue variabelen kwantificeert. De waarde varieert van -1 (perfect negatieve correlatie) tot +1 (perfect positieve correlatie). |
| Spearman rangcorrelatie | Een non-parametrische maat die de sterkte en richting van een monotoon verband tussen twee variabelen meet. Het is geschikt voor ordinale data of wanneer de aannames van Pearsoncorrelatie niet worden voldaan. |
| Chi-kwadraattoets | Een statistische toets die wordt gebruikt om te bepalen of er een significant verband is tussen categorische variabelen, vaak door middel van kruistabellen. Het kan ook gebruikt worden om te toetsen of de geobserveerde frequenties afwijken van de verwachte frequenties. |
| Kolmogorov-Smirnov toets | Een non-parametrische toets die wordt gebruikt om te bepalen of een steekproef afkomstig is uit een specifieke theoretische verdeling, zoals de normale verdeling. Het vergelijkt de empirische cumulatieve verdelingsfunctie met de theoretische. |
| Shapiro-Wilk toets | Een krachtige statistische toets die specifiek wordt gebruikt om de normaliteit van een dataset te toetsen. Het wordt over het algemeen als accurater beschouwd dan de Kolmogorov-Smirnov toets voor het testen van normaliteit. |