Cover
Comença ara de franc Student - Hoorcollege 11 - Kiezen van de juiste toets.pptx
Summary
# Voorbereiding op het kiezen van de juiste statistische toets
Het correct kiezen van een statistische toets is cruciaal voor het beantwoorden van een onderzoeksvraag en wordt bepaald door verschillende factoren die ontleed moeten worden uit de onderzoeksvraag en de data.
### 1.1 De stappen voor het kiezen van de juiste statistische toets
Het proces van het selecteren van de juiste statistische toets omvat een systematische aanpak:
#### 1.1.1 Stap 1: Ontleding van de onderzoeksvraag
Het is essentieel om de onderzoeksvraag grondig te begrijpen. Hierbij wordt gekeken naar:
* Welke variabelen worden onderzocht?
* Wat zijn de onderzoekseenheden of cases (bijvoorbeeld personen, groepen, scholen)?
#### 1.1.2 Stap 2: Identificatie van de afhankelijke en onafhankelijke variabelen
Dit is een belangrijke stap die de keuze van de meetniveaus beïnvloedt.
* **Effect:** Bij een effect is er sprake van de invloed van variabele X op variabele Y.
* **Verband:** Bij een verband wordt gekeken naar de relatie tussen variabele X en variabele Y, waarbij de richting van de relatie niet noodzakelijk bepaald kan worden (correlatie impliceert geen causaliteit).
#### 1.1.3 Stap 3: Bepaling van het meetniveau van de variabelen
Het meetniveau van de variabelen is bepalend voor de keuze van de statistische toets. Het bepaalt ook aan welke voorwaarden (zoals normaliteit van de verdeling of het intervalniveau van de afhankelijke variabele) voor een bepaalde toets voldaan moet worden.
* Het verlagen van een meetniveau is altijd toegestaan (bijvoorbeeld van interval naar ordinaal), maar het verhogen niet.
**Recap: Meetniveaus**
* Nominaal
* Ordinaal
* Interval
* Ratio
#### 1.1.4 Stap 4: Vaststellen van het aantal te bestuderen populaties
Dit wordt bepaald door het aantal niveaus of categorieën van een onafhankelijke variabele.
#### 1.1.5 Stap 5: Bepalen of het om onafhankelijke of afhankelijke steekproeven gaat
* **Onafhankelijke steekproeven:** Bij het trekken van de tweede steekproef wordt geen rekening gehouden met de samenstelling van de eerste steekproef.
* **Afhankelijke steekproeven:** Beide steekproeven bevatten dezelfde deelnemers tijdens verschillende meetmomenten (bijvoorbeeld voor- en nameting), of er is sprake van gematchte steekproeven.
#### 1.1.6 Stap 6: Keuze tussen parametrische en non-parametrische toetsen
Parametrische toetsen hebben vaak de voorkeur boven non-parametrische toetsen, mits aan de bijbehorende voorwaarden wordt voldaan.
**In SPSS:**
* Normaliteit kan worden nagegaan met de Kolmogorov-Smirnov toets of de Shapiro-Wilk toets.
* De Shapiro-Wilk toets wordt als het meest accuraat beschouwd.
* Een P-waarde groter of gelijk aan .05 duidt op een normale verdeling.
* Een P-waarde kleiner dan .05 duidt op niet-normaal verdeelde data.
#### 1.1.7 Stap 7: Keuze tussen eenzijdige en tweezijdige toetsing
* In de praktijk wordt doorgaans tweezijdig getoetst om geen effecten te missen. Het is echter belangrijk het verschil tussen éénzijdige en tweezijdige hypothesen te kennen.
### 1.2 Overzicht van statistische toetsen
Het volgende schema geeft een overzicht van veelgebruikte toetsen, waarbij P staat voor parametrisch en NP voor non-parametrisch.
| Populaties | Variabele(n) | Parametrisch (P) | Non-parametrisch (NP) |
| --------------- | ------------------------------------------ | ----------------------------------------------- | --------------------------------- |
| **1 populatie** | Gemiddelde | Z-toets / t-toets voor één gemiddelde | - |
| | Frequenties | - | Chi-kwadraattoets voor frequenties|
| **2 populaties**| Verschil in gemiddelden (onafhankelijk) | t-toets voor twee onafhankelijke steekproeven | Wilcoxon rank-sum test |
| | Verschil in gemiddelden (afhankelijk) | t-toets voor twee afhankelijke steekproeven | Wilcoxon signed-rank toets |
| **Meer dan 2** | Verschil in gemiddelden (onafhankelijk) | One-way ANOVA (variantieanalyse) | - |
| **Verband** | Tussen twee variabelen | Pearson correlatietoets | Spearman rank correlation |
| | Tussen twee variabelen (categorisch) | - | Chi-kwadraattoets voor kruistabellen|
**Voorwaarden parametrische toetsen:**
* Afhankelijke variabele (AV) minimaal intervalniveau.
* AV normaal verdeeld.
**Voorwaarden non-parametrische toetsen:**
* AV lager dan intervalniveau of AV niet normaal verdeeld.
### 1.3 Toepassingsvoorbeelden
#### 1.3.1 Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag
* **Onderzoeksvraag:** Wat is het verband tussen materialisme en agressief rijgedrag van autobestuurders?
* **Onderzoekseenheden:** 564 mannen en vrouwen (18-55 jaar).
* **Variabelen:**
* Materialisme (OV): gemeten via vragenlijst, totaalscore omgezet naar score tussen 0 en 150 (hogere score = meer materialistisch).
* Agressief rijgedrag (AV): gemeten via zelfrapportering, totaalscore tussen 0 en 90 (hogere score = meer agressiviteit).
* **Meetniveau:** Beide variabelen zijn intervalvariabelen (door combinatie van Likert-items).
* **Aantal populaties:** Eén populatie wordt bestudeerd.
* **Steekproeven:** Niet van toepassing, er is één steekproef.
* **Toets:** Parametrisch, aangezien de AV intervalniveau heeft en de steekproefomvang (N=564) normaliteit suggereert: **Pearson correlatietoets**.
* **Toetsing:** Tweezijdig.
#### 1.3.2 Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen
* **Onderzoeksvraag:** Is er een verschil tussen mannen en vrouwen op gebied van agressief rijgedrag?
* **Onderzoekseenheden:** 32 deelnemers, geobserveerd gedurende één week.
* **Variabelen:**
* Geslacht (OV): nominaal (mannen/vrouwen).
* Agressieniveau (AV): toegekend na observatie, variërend van 1 tot 5 (geheel getal).
* **Meetniveau:** Geslacht is nominaal, agressieniveau is ordinaal.
* **Aantal populaties:** Twee populaties (mannen en vrouwen).
* **Steekproeven:** Onafhankelijke steekproeven (mannen en vrouwen zijn geen familie/partners).
* **Toets:** Non-parametrisch, aangezien de AV ordinaal is: **Wilcoxon rank-sum toets**.
* **Toetsing:** Tweezijdig.
#### 1.3.3 Voorbeeld 3: Effect van energiedrank/repen op loopprestaties
* **Onderzoeksvraag:** Welk energiemiddel heeft het beste effect op de loopprestaties van langeafstandslopers?
* **Onderzoekseenheden:** 180 langeafstandslopers.
* **Variabelen:**
* Energievorm (OV): nominaal (geen, enkel drank, enkel repen, drank én repen).
* Looptijd (AV): geregistreerd in aantal minuten (ratio).
* **Meetniveau:** OV is nominaal, AV is ratio.
* **Aantal populaties:** Vier populaties (de vier condities).
* **Steekproeven:** Onafhankelijke steekproeven (lopers zijn verdeeld over vier groepen).
* **Toets:** Parametrisch, aangezien de AV rationiveau heeft en N=80 (per groep, 180/4=45) normaliteit kan aannemen: **One-way ANOVA**.
* **Toetsing:** Tweezijdig.
> **Tip:** De keuze van de statistische methode is sterk afhankelijk van het onderzoeksdesign. Het is aan te raden om hierover reeds voorafgaand aan het onderzoek na te denken en waar mogelijk non-parametrische toetsen te vermijden door te voldoen aan de voorwaarden voor parametrische toetsen.
---
# Overzicht van statistische toetsen en hun toepassingen
Dit gedeelte biedt een systematisch overzicht van statistische toetsen, waarbij de keuze voor de juiste toets wordt bepaald door de onderzoeksvraag, het meetniveau van variabelen, het aantal populaties, de steekproefafhankelijkheid en de aannames van parametrische toetsen.
### 2.1 De keuze voor de juiste toets: een stappenplan
Het kiezen van de juiste statistische toets kan een uitdaging zijn. Een gestructureerde aanpak helpt hierbij. De belangrijkste stappen zijn:
1. **Ontleed de onderzoeksvraag:** Begrijp de kern van de onderzoeksvraag en identificeer wat er onderzocht wordt.
2. **Identificeer variabelen:** Bepaal welke variabelen bestudeerd worden en of het gaat om een effect (invloed van variabele X op variabele Y) of een verband (relatie tussen X en Y, zonder causaliteit aan te tonen).
3. **Bepaal het meetniveau van de variabelen:** Het meetniveau (nominaal, ordinaal, interval, ratio) is cruciaal voor de toetskeuze.
* **Tip:** Het verlagen van een meetniveau is altijd mogelijk (bv. van interval naar ordinaal), maar het verhogen niet.
4. **Bepaal het aantal populaties:** Dit wordt bepaald door het aantal niveaus of categorieën van een onafhankelijke variabele.
5. **Onderscheid afhankelijke en onafhankelijke steekproeven:**
* **Onafhankelijke steekproeven:** De samenstelling van de ene steekproef heeft geen invloed op de andere.
* **Afhankelijke steekproeven:** Betreffen dezelfde deelnemers (bv. voor- en nameting) of gematchte paren.
6. **Kies tussen parametrische en non-parametrische toetsen:** Parametrische toetsen worden geprefereerd indien aan de voorwaarden (zoals normaal verdeelde data en interval/ratio niveau van de afhankelijke variabele) is voldaan, omdat ze meer power hebben.
* **Tip:** Non-parametrische toetsen worden gebruikt wanneer de afhankelijke variabele een lager meetniveau heeft (ordinaal) of wanneer de assumpties van normaliteit niet voldaan zijn.
7. **Bepaal of eenzijdig of tweezijdig wordt getoetst:** In de praktijk wordt meestal tweezijdig getoetst om geen potentiële effecten te missen. Het onderscheid tussen éénzijdige en tweezijdige hypotheses is echter belangrijk.
#### 2.1.1 Meetniveaus van variabelen
* **Nominaal:** Categorieën zonder inherente volgorde (bv. geslacht, haarkleur).
* **Ordinaal:** Categorieën met een inherente volgorde, maar de afstand tussen de categorieën is niet per se gelijk (bv. opleidingsniveau, Likert-schaal scores).
* **Interval:** Numerieke schaal met gelijke afstanden tussen opeenvolgende waarden, maar zonder een absoluut nulpunt (bv. temperatuur in Celsius).
* **Ratio:** Numerieke schaal met gelijke afstanden en een absoluut nulpunt, waardoor verhoudingen zinvol zijn (bv. lengte, gewicht, inkomen).
#### 2.1.2 Kenmerken van parametrische en non-parametrische toetsen
* **Parametrisch:** Vereisen aannames over de populatieverdeling, meestal normaliteit en voldoende steekproefgrootte. De afhankelijke variabele (AV) moet minimaal intervalniveau hebben. Voorbeelden zijn de t-toetsen en ANOVA.
* **Non-parametrisch:** Stellen minder stringente eisen aan de populatieverdeling en kunnen gebruikt worden bij ordinale data of wanneer aan de assumpties van parametrische toetsen niet wordt voldaan. Voorbeelden zijn de Chi-kwadraat toets, Wilcoxon rang-sum test, en Spearman correlatie.
#### 2.1.3 Normaal verdeeldheid nagaan in SPSS
De normaliteit van data kan worden getoetst in SPSS met de Kolmogorov-Smirnov en Shapiro-Wilk toetsen. De Shapiro-Wilk toets wordt als accurater beschouwd.
* Als de p-waarde groter of gelijk is aan $.05$, wordt de data als normaal verdeeld beschouwd.
* Als de p-waarde kleiner is dan $.05$, wordt de data als niet normaal verdeeld beschouwd.
### 2.2 Overzicht van specifieke statistische toetsen
De keuze van de statistische toets hangt af van het onderzoeksdesign en de kenmerken van de variabelen. Hieronder volgt een overzicht van veelgebruikte toetsen, onderverdeeld naar het aantal populaties en het type variabele.
#### 2.2.1 Toetsen voor één populatie
* **Parametrisch:**
* $z$-toets / $t$-toets voor één gemiddelde: Gebruikt om te toetsen of het gemiddelde van een populatie significant verschilt van een hypothetische waarde.
* **Non-parametrisch:**
* Chi-kwadraat toets voor frequenties: Gebruikt om te toetsen of waargenomen frequenties significant afwijken van verwachte frequenties in één populatie.
#### 2.2.2 Toetsen voor twee onafhankelijke populaties
* **Parametrisch:**
* $t$-toets voor twee onafhankelijke steekproeven: Gebruikt om de gemiddelden van twee onafhankelijke groepen te vergelijken. Vereist dat de afhankelijke variabele minstens intervalniveau heeft en bij voorkeur normaal verdeeld is binnen elke groep.
* **Non-parametrisch:**
* Wilcoxon rank-sum test: De non-parametrische tegenhanger van de onafhankelijke t-toets, gebruikt bij ordinale data of wanneer aan de normaliteitsaannames niet wordt voldaan.
#### 2.2.3 Toetsen voor twee afhankelijke populaties
* **Parametrisch:**
* $t$-toets voor twee afhankelijke steekproeven: Gebruikt om de gemiddelden van twee gerelateerde metingen binnen dezelfde groep te vergelijken (bv. voor- en nameting).
* **Non-parametrisch:**
* Wilcoxon signed-rank test: De non-parametrische tegenhanger van de afhankelijke t-toets.
#### 2.2.4 Toetsen voor meer dan twee (onafhankelijke) populaties
* **Parametrisch:**
* One-way ANOVA (variantieanalyse): Gebruikt om de gemiddelden van drie of meer onafhankelijke groepen te vergelijken. Vereist dat de afhankelijke variabele minstens intervalniveau heeft en normaal verdeeld is binnen de groepen.
* **Non-parametrisch:**
* Er zijn non-parametrische equivalenten voor ANOVA, zoals de Kruskal-Wallis toets, maar deze worden niet specifiek in dit overzicht genoemd als aparte sectie.
#### 2.2.5 Toetsen voor het verband tussen twee variabelen
* **Parametrisch:**
* Pearson correlatiecoëfficiënt ($r$): Meet de lineaire sterkte en richting van het verband tussen twee interval- of ratiovariabelen.
* **Non-parametrisch:**
* Spearman rangcorrelatiecoëfficiënt ($r_s$): Meet de sterkte en richting van het monotone verband tussen twee ordinale variabelen, of tussen twee variabelen waarvan één of beide variabelen niet voldoen aan de assumpties voor Pearson correlatie.
* Chi-kwadraat toets voor kruistabellen: Gebruikt om de associatie te toetsen tussen twee categorische (nominale of ordinale) variabelen.
### 2.3 Schema voor het kiezen van de juiste toets
Het onderstaande schema, gebaseerd op de stappen 1 tot en met 7 hierboven, helpt bij het bepalen van de geschikte statistische toets:
| Aantal populaties | Variabelen | Type steekproef | Parametrisch (AV min. interval, normaal verdeeld) | Non-parametrisch (AV < interval of niet normaal) |
| :---------------- | :------------------------------- | :-------------- | :-------------------------------------------------------------------------------- | :-------------------------------------------------------------------------------- |
| **1** | Gemiddelde | N.v.t. | $z$-toets / $t$-toets voor één gemiddelde | |
| | Frequenties | N.v.t. | | Chi-kwadraat toets voor frequenties |
| **2** | Verschil in gemiddelden | Onafhankelijk | $t$-toets voor twee onafhankelijke steekproeven | Wilcoxon rank-sum test |
| | Verschil in gemiddelden | Afhankelijk | $t$-toets voor twee afhankelijke steekproeven | Wilcoxon signed-rank test |
| **> 2** | Verschil in gemiddelden | Onafhankelijk | One-way ANOVA | Kruskal-Wallis toets (niet expliciet in dit document uitgewerkt) |
| **Verband** | Tussen 2 interval/ratio variabelen | N.v.t. | Pearson correlatiecoëfficiënt ($r$) | |
| | Tussen 2 ordinale variabelen | N.v.t. | | Spearman rangcorrelatiecoëfficiënt ($r_s$) |
| | Tussen 2 categorische variabelen | N.v.t. | | Chi-kwadraat toets voor kruistabellen |
#### 2.3.1 Voorbeelden van toetskeuze
> **Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag**
>
> * **Onderzoeksvraag:** Verband tussen materialisme en agressief rijgedrag.
> * **Variabelen:** Materialisme (onafhankelijk, OV), agressief rijgedrag (afhankelijk, AV).
> * **Meetniveau:** Beide zijn intervalvariabelen (gecombineerde Likert-schalen).
> * **Aantal populaties:** Eén populatie (alle bestuurders).
> * **Steekproef:** Eén steekproef van 564 deelnemers.
> * **Keuze:** Parametrisch (interval AV, grote steekproef veronderstelt normaliteit).
> * **Toets:** Pearson correlatiecoëfficiënt.
> * **Toetsing:** Standaard tweezijdig.
> **Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen**
>
> * **Onderzoeksvraag:** Verschil in agressief rijgedrag tussen mannen en vrouwen.
> * **Variabelen:** Geslacht (OV, nominaal), agressief rijgedrag (AV, ordinaal).
> * **Meetniveau:** Geslacht is nominaal; agressief rijgedrag is ordinaal.
> * **Aantal populaties:** Twee (mannen en vrouwen).
> * **Steekproef:** Onafhankelijke steekproeven (mannen en vrouwen zijn niet aan elkaar gerelateerd).
> * **Keuze:** Non-parametrisch (AV is ordinaal).
> * **Toets:** Wilcoxon rank-sum test.
> * **Toetsing:** Standaard tweezijdig.
> **Voorbeeld 3: Effect van energiedrank/repen op loopprestaties**
>
> * **Onderzoeksvraag:** Welk middel heeft het beste effect op loopprestaties?
> * **Variabelen:** Energiedrank/repen conditie (OV, nominaal met 4 niveaus), loopprestaties in minuten (AV, ratio).
> * **Meetniveau:** OV is nominaal; AV is ratio.
> * **Aantal populaties:** Vier (de vier condities).
> * **Steekproef:** Onafhankelijke steekproeven (lopers zijn verdeeld over de condities).
> * **Keuze:** Parametrisch (AV is ratio, N=180 verdeeld over 4 groepen, dus ca. 45 per groep, wat als voldoende wordt beschouwd voor normaliteitsaanname).
> * **Toets:** One-way ANOVA.
> * **Toetsing:** Standaard tweezijdig.
### 2.4 Slotopmerkingen over toetskeuze
De keuze van de statistische methode is inherent verbonden aan het onderzoeksdesign. Het is aan te raden om hierover voorafgaand aan het onderzoek na te denken en, waar mogelijk, parametrische toetsen te prefereren boven non-parametrische toetsen vanwege hun grotere sensitiviteit en power, mits aan hun voorwaarden is voldaan. Eenzijdig toetsen is in de praktijk uitzonderlijk en tweezijdig toetsen is de standaard om geen mogelijke effecten te missen.
---
# Toepassing van het toetskeuzeschema met voorbeelden
Dit onderdeel demonstreert de praktische toepassing van het stappenplan voor het kiezen van de juiste statistische toets aan de hand van concrete onderzoeksvoorbeelden.
### 3.1 De stappen in het toetskeuzeschema
Het correct kiezen van een statistische toets vereist een systematische aanpak, waarbij de volgende stappen worden doorlopen:
#### 3.1.1 Stap 1: Ontleed de onderzoeksvraag
Een grondige analyse van de onderzoeksvraag is cruciaal om te begrijpen welke variabelen worden onderzocht en wat de onderzoekseenheden zijn (bv. personen, koppels, scholen, groepen).
#### 3.1.2 Stap 2: Bepaal de afhankelijke en onafhankelijke variabelen
Het identificeren van de afhankelijke variabele (AV) en de onafhankelijke variabele(n) (OV) is essentieel, met name voor het bepalen van de meetniveaus. Er kan onderscheid gemaakt worden tussen:
* **Effect:** Het effect van variabele X op variabele Y.
* **Verband:** Een relatie tussen variabele X en variabele Y, waarbij de richting niet noodzakelijk bepaald kan worden (correlatie ≠ causaliteit).
#### 3.1.3 Stap 3: Bepaal het meetniveau van de variabelen
Het meetniveau van de variabelen is een belangrijke determinant voor de keuze van de statistische toets. Het bepaalt ook aan welke voorwaarden een toets moet voldoen (bv. normaal verdeeld zijn, intervalvariabele als AV).
**Recap: meetniveaus**
* Nominaal
* Ordinaal
* Interval
* Ratio
Het verlagen van een meetniveau (bv. van interval naar ordinaal) is altijd toegestaan, het verhogen niet.
#### 3.1.4 Stap 4: Bepaal het aantal te bestuderen populaties
Sommige toetsen vereisen duidelijkheid over het aantal te bestuderen populaties. Dit wordt bepaald door het aantal niveaus of categorieën van een onafhankelijke variabele.
#### 3.1.5 Stap 5: Bepaal of het om onafhankelijke of afhankelijke steekproeven gaat
* **Onafhankelijke steekproeven:** Bij het trekken van de tweede steekproef wordt geen rekening gehouden met de samenstelling van de eerste steekproef.
* **Afhankelijke steekproeven:** Beide steekproeven bevatten dezelfde deelnemers (bv. bij voor- en nametingen) of gematchte deelnemers.
#### 3.1.6 Stap 6: Bepaal of we parametrisch of non-parametrisch moeten toetsen
Parametrische toetsen hebben doorgaans de voorkeur boven non-parametrische toetsen, mits de voorwaarden van de specifieke toets voldaan zijn (zie vorige lessen). De keuze hangt af van het meetniveau van de AV en de verdeling van de data.
**Voorwaarden voor parametrische toetsen:**
* AV is minstens van intervalniveau.
* AV is normaal verdeeld (dit kan worden nagegaan met de Kolmogorov-Smirnov of Shapiro-Wilk toetsen in SPSS; de Shapiro-Wilk toets is het meest accuraat).
* Als de p-waarde van deze toetsen groter of gelijk is aan $0.05$, wordt de data als normaal verdeeld beschouwd.
* Als de p-waarde kleiner is dan $0.05$, is de data niet normaal verdeeld.
**Non-parametrische toetsen:** Worden gebruikt wanneer de AV een lager meetniveau heeft (nominaal of ordinaal) of wanneer de data niet normaal verdeeld is.
#### 3.1.7 Stap 7: Bepaal of we eenzijdig of tweezijdig toetsen
In de praktijk wordt er standaard tweezijdig getoetst om geen mogelijke effecten te missen. Eenzijdig toetsen is uitzonderlijk. Het is echter belangrijk om het verschil tussen eenzijdige en tweezijdige hypothesen te kennen.
### 3.2 Voorbeelden van toetskeuzes
#### 3.2.1 Voorbeeld 1: Verband tussen materialisme en agressief rijgedrag
**Onderzoeksvraag:** Wat is het verband tussen materialisme en agressief rijgedrag van autobestuurders?
**Studieopzet:** 564 mannen en vrouwen tussen 18 en 55 jaar nemen deel. Materialisme en agressief rijgedrag worden gemeten via vragenlijsten (Likert-items).
1. **Onderzoeksvraag ontleed:** Het onderzoekt het verband tussen twee concepten bij autobestuurders.
2. **Variabelen:**
* Onafhankelijke variabele (OV): Materialisme (door middel van een totaalscore tussen 0 en 150, hogere score = meer materialisme).
* Afhankelijke variabele (AV): Agressief rijgedrag (door middel van een totaalscore tussen 0 en 90, hogere score = meer agressiviteit).
3. **Meetniveau:** Beide variabelen worden gemeten met Likert-schalen en gecombineerd tot totaalscores, wat resulteert in intervalvariabelen.
4. **Aantal populaties:** Er wordt één populatie van bestuurders onderzocht.
5. **Steekproeven:** Er is één steekproef van 564 bestuurders, dus er is geen sprake van afhankelijke of onafhankelijke steekproeven in de zin van vergelijkingen tussen groepen.
6. **Parametrisch/Non-parametrisch:** Aangezien de AV een intervalniveau heeft en de steekproefgrootte ($N = 564$) groot is (wat normaliteit suggereert), wordt een parametrische toets gekozen.
7. **Eenzijdig/Tweezijdig:** Standaard wordt tweezijdig getoetst.
**Gekozen toets:** Pearson correlatietoets. Deze toets onderzoekt het lineaire verband tussen twee intervalvariabelen.
#### 3.2.2 Voorbeeld 2: Verschil in agressief rijgedrag tussen mannen en vrouwen
**Onderzoeksvraag:** Is er een verschil tussen mannen en vrouwen op het gebied van agressief rijgedrag?
**Studieopzet:** 32 deelnemers worden geobserveerd en krijgen een agressieniveau toegekend (1-5). Mannen en vrouwen zijn geen familie of partners.
1. **Onderzoeksvraag ontleed:** Vergelijkt agressief rijgedrag tussen twee groepen (mannen en vrouwen).
2. **Variabelen:**
* Onafhankelijke variabele (OV): Geslacht (man/vrouw).
* Afhankelijke variabele (AV): Agressief rijgedrag (niveau van 1 tot 5).
3. **Meetniveau:**
* Geslacht: Nominaal.
* Agressief rijgedrag: Ordinaal (uitgedrukt in gehele getallen van 1 tot 5).
4. **Aantal populaties:** Er worden twee populaties bestudeerd: mannen en vrouwen.
5. **Steekproeven:** De deelnemende mannen en vrouwen zijn geen familie of partners van elkaar, wat duidt op onafhankelijke steekproeven.
6. **Parametrisch/Non-parametrisch:** Omdat de AV ordinaal is, wordt een non-parametrische toets gebruikt.
7. **Eenzijdig/Tweezijdig:** Standaard wordt tweezijdig getoetst.
**Gekozen toets:** Wilcoxon rank-sum toets (ook bekend als de Mann-Whitney U toets). Deze toets vergelijkt de verdelingen van twee onafhankelijke groepen op een ordinale variabele.
#### 3.2.3 Voorbeeld 3: Effect van energiedrank en energierepen op prestaties
**Onderzoeksvraag:** Welk middel (energiedrank, energierepen, beide, of geen) heeft het beste effect op de loopprestaties van langeafstandslopers?
**Studieopzet:** 180 langeafstandslopers worden verdeeld in vier condities (geen, enkel drank, enkel repen, drank én repen). De tijden voor een halve marathon worden geregistreerd.
1. **Onderzoeksvraag ontleed:** Vergelijkt de effectiviteit van vier verschillende condities op de loopprestaties.
2. **Variabelen:**
* Onafhankelijke variabele (OV): Energiemiddel (conditie: geen, drank, repen, drank + repen).
* Afhankelijke variabele (AV): Loopprestaties (tijd in minuten).
3. **Meetniveau:**
* Energiemiddel: Nominaal.
* Loopprestaties: Ratio (tijd in minuten is een continue variabele met een absoluut nulpunt).
4. **Aantal populaties:** Er worden vier groepen (populaties) vergeleken, gebaseerd op de vier condities.
5. **Steekproeven:** De lopers worden verdeeld over de condities, wat resulteert in onafhankelijke steekproeven.
6. **Parametrisch/Non-parametrisch:** Omdat de AV een rationiveau heeft en er meer dan twee groepen zijn, en met een redelijke steekproefgrootte per groep ($N = 180$ verdeeld over 4 groepen), wordt een parametrische toets gebruikt. De voorwaarde van normaliteit voor de AV binnen elke groep wordt verondersteld of getoetst.
7. **Eenzijdig/Tweezijdig:** Standaard wordt tweezijdig getoetst.
**Gekozen toets:** One-way ANOVA (variantieanalyse). Deze toets vergelijkt de gemiddelden van drie of meer onafhankelijke groepen op een interval- of rationiveau variabele.
### 3.3 Overzicht van toetsen en toepassingen
Een samenvattend overzicht van de meest voorkomende statistische toetsen en hun toepassingsgebieden op basis van het aantal populaties en het meetniveau van de afhankelijke variabele:
| Criterium | 1 Populatie | 2 Populaties (onafhankelijk) | 2 Populaties (afhankelijk) | Meer dan 2 Populaties (onafhankelijk) | Verband tussen 2 variabelen |
| :--------------------------------------- | :-------------------------------- | :---------------------------------- | :-------------------------------- | :------------------------------------ | :-------------------------- |
| **Parametrisch** (AV = interval/ratio, normaal verdeeld) | Z-toets / T-toets voor één gemiddelde | T-toets voor twee onafhankelijke steekproeven | T-toets voor twee afhankelijke steekproeven | One-way ANOVA | Pearson correlatietoets |
| **Non-parametrisch** (AV < interval of niet normaal verdeeld) | Chi-kwadraattoets voor frequenties | Wilcoxon rank-sum toets | Wilcoxon signed-rank toets | Kruskal-Wallis toets | Spearman rangcorrelatie, Chi-kwadraattoets voor kruistabellen |
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Toets-statistiek | Een waarde die wordt berekend uit steekproefgegevens om hypotheses te testen. Deze waarde wordt vergeleken met een kritieke waarde of een p-waarde om een beslissing te nemen over de nulhypothese. |
| Kritieke waarde | De drempelwaarde in een statistische toets. Als de berekende toets-statistiek deze waarde overschrijdt (of aan de andere kant van de verdeling ligt), wordt de nulhypothese verworpen. |
| H0 (Nulhypothese) | De hypothese die stelt dat er geen effect of verband is in de populatie. Het is de standaarduitgangspositie die we proberen te weerleggen met onze data. |
| Significante toets | Een toets die leidt tot het verwerpen van de nulhypothese. Dit betekent dat het waargenomen effect of verband in de steekproef waarschijnlijk ook in de populatie aanwezig is. |
| H0 behouden | De beslissing om de nulhypothese niet te verwerpen. Dit betekent niet dat de nulhypothese waar is, maar dat de data onvoldoende bewijs leveren om deze te verwerpen. |
| Parametrisch | Een klasse van statistische toetsen die aannames doen over de parameters van de populatie, zoals normaliteit van de verdeling en gelijke varianties. Deze toetsen zijn doorgaans krachtiger wanneer aan de voorwaarden is voldaan. |
| Non-parametrisch | Een klasse van statistische toetsen die minder strikte aannames doen over de populatieparameters. Ze zijn vaak geschikt voor data die niet aan de voorwaarden van parametrische toetsen voldoen, zoals ordinale data of scheve verdelingen. |
| Meetniveau | De eigenschappen van de waarden die een variabele kan aannemen. De belangrijkste meetniveaus zijn nominaal, ordinaal, interval en ratio, en bepalen welke statistische analyses mogelijk zijn. |
| Onafhankelijke variabele (OV) | De variabele die wordt gemanipuleerd of gemeten om een potentieel effect te veroorzaken of te verklaren. Het is de voorspellende of oorzakelijke variabele in een onderzoek. |
| Afhankelijke variabele (AV) | De variabele die wordt gemeten om het effect van de onafhankelijke variabele vast te stellen. Het is de uitkomst- of responsvariabele in een onderzoek. |
| Populatie | De gehele groep waarover een onderzoeker conclusies wil trekken. Een steekproef wordt getrokken uit deze populatie om informatie te verzamelen. |
| Steekproef | Een subset van de populatie die wordt geselecteerd voor onderzoek. De resultaten van de steekproef worden gebruikt om conclusies te trekken over de populatie. |
| Steekproefafhankelijkheid | Verwijst naar of de metingen in verschillende groepen (steekproeven) onafhankelijk van elkaar zijn of niet. Bij afhankelijke steekproeven zijn metingen aan dezelfde individuen gekoppeld. |
| Eenzijdig toetsen | Een statistische toets waarbij de richting van het verwachte effect van tevoren is gespecificeerd. De alternatieve hypothese stelt dat de parameter groter of kleiner is dan een bepaalde waarde. |
| Tweezijdig toetsen | Een statistische toets waarbij geen specifieke richting van het effect wordt aangenomen. De alternatieve hypothese stelt dat de parameter niet gelijk is aan een bepaalde waarde. |
| P-waarde | De kans op het observeren van de steekproefresultaten, of extremere resultaten, gegeven dat de nulhypothese waar is. Een lage p-waarde (< .05) leidt meestal tot het verwerpen van de nulhypothese. |
| Likert-schaal | Een psychometrische meetschaal die wordt gebruikt om de mate van overeenstemming of instemming met een stelling te meten. Respondenten geven antwoorden op een reeks items die variëren van sterk mee oneens tot sterk mee eens. |
| Variantieanalyse (ANOVA) | Een statistische techniek die wordt gebruikt om de verschillen tussen de gemiddelden van drie of meer groepen te analyseren. Het test of de variantie tussen de groepen significant groter is dan de variantie binnen de groepen. |
| Pearsoncorrelatietoets | Een parametrische toets die de sterkte en richting van de lineaire relatie tussen twee continue variabelen meet. Vereist dat de variabelen normaal verdeeld zijn. |
| Spearman rangcorrelatietoets | Een non-parametrische toets die de sterkte en richting van de monotone relatie tussen twee geordende variabelen meet. Geschikt voor ordinale data of wanneer de aannames van Pearson niet voldaan zijn. |
| Wilcoxon rank-sum test | Een non-parametrische toets die wordt gebruikt om te bepalen of er een significant verschil is tussen de medianen van twee onafhankelijke groepen. Een alternatief voor de onafhankelijke t-toets. |
| Kolmogorov-Smirnov toets | Een non-parametrische toets die wordt gebruikt om te bepalen of een steekproef afkomstig is uit een populatie met een specifieke verdeling, of om twee steekproeven te vergelijken. Vaak gebruikt om normaliteit te toetsen. |
| Shapiro-Wilk toets | Een parametrische toets die specifiek wordt gebruikt om de normaliteit van de verdeling van een steekproef te toetsen. Wordt beschouwd als een van de meest krachtige normaliteitstests. |