Cover
Aloita nyt ilmaiseksi Oplossingen WC 4.pptx
Summary
# Introductie tot statistische toetsen voor het verband tussen twee variabelen
Dit deel introduceert het algemene stramien voor het toetsen van hypothesen bij het onderzoeken van verbanden tussen twee variabelen, met een focus op de parametrische Pearson correlatietoets.
## 1. Introductie tot statistische toetsen voor het verband tussen twee variabelen
### 1.1 Het stramien voor het toetsen van hypothesen
Het toetsen van hypothesen bij het onderzoeken van verbanden tussen twee variabelen volgt een gestructureerd stramien:
1. **Toetsingssituatie:** Identificeer de gegevens in de vraag, de concrete toetsingssituatie en het type onderzoeksvraag.
2. **Voorwaarden:** Controleer of de statistische voorwaarden voor de gekozen toets vervuld zijn.
3. **Hypothesen:** Formuleer de nulhypothese ($H_0$) en de alternatieve hypothese ($H_1$) specifiek voor de toets.
4. **Toetsingsgrootheid:** Bereken de waarde van de toetsingsgrootheid en identificeer de bijbehorende kansverdeling.
5. **Beslissingsregel:** Bepaal of $H_0$ verworpen wordt op basis van overschrijdingskansen of kritieke waarden.
6. **Effectgrootte:** Beoordeel de importantie van het gevonden effect.
7. **Rapporteren:** Vermeld de resultaten op een correcte en gestructureerde manier.
### 1.2 Parametrische Pearson correlatietoets
De Pearson correlatietoets wordt gebruikt om het lineaire verband tussen twee interval- of ratio-variabelen te onderzoeken.
#### 1.2.1 Toetsingssituatie en voorbeeld
De Pearson correlatietoets wordt ingezet wanneer men een verband wil onderzoeken tussen twee continue variabelen, waarbij beide variabelen normaal verdeeld zijn in de populatie.
**Voorbeeld:**
Een onderzoeker wil weten of er een verband bestaat tussen de slaapkwaliteit van studenten tijdens de examenperiode en de mate van rust/kalmte die studenten ervaren. Er wordt aangenomen dat beide variabelen normaal verdeeld zijn in de populatie.
#### 1.2.2 Hypothesen
* $H_0$: Er bestaat geen lineair verband tussen de twee variabelen in de populatie ($\rho = 0$).
* $H_1$: Er bestaat wel een lineair verband tussen de twee variabelen in de populatie ($\rho \neq 0$).
#### 1.2.3 Toetsingsgrootheid
De toetsingsgrootheid voor de Pearson correlatietoets is de correlatiecoëfficiënt ($r$). Deze wordt getransformeerd naar een $t$-verdeling met $N-2$ vrijheidsgraden, waarbij $N$ het aantal paren is.
De formule voor de correlatiecoëfficiënt is:
$$r = \frac{\sum_{i=1}^{N}(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum_{i=1}^{N}(x_i - \bar{x})^2 \sum_{i=1}^{N}(y_i - \bar{y})^2}}$$
De $t$-toetsingsgrootheid wordt berekend als:
$$t = r \sqrt{\frac{N-2}{1-r^2}}$$
#### 1.2.4 Beslissingsregel
De nulhypothese ($H_0$) wordt verworpen als de berekende toetsingsgrootheid ($t_{berekend}$) groter is dan de kritieke waarde ($t_{kritiek}$) bij een tweezijdige toetsing, of als de $p$-waarde kleiner is dan het significantieniveau ($\alpha$).
**Voorbeeld interpretatie:**
Als de berekende $t$-waarde van 12.16 groter is dan de kritieke waarde van 3.182 (bij een bepaald aantal vrijheidsgraden), wordt de nulhypothese verworpen. Dit suggereert een significant verband tussen de variabelen.
#### 1.2.5 Effectgrootte
Bij de Pearson correlatietoets dient geen bijkomende berekening voor de effectgrootte gemaakt te worden. De correlatiecoëfficiënt ($r$) zelf wordt gebruikt als maat voor de effectgrootte.
* Een $r$ van .99 wordt als een groot verband beschouwd.
#### 1.2.6 Rapporteren
De resultaten worden gerapporteerd met de correlatiecoëfficiënt, de $p$-waarde, en het aantal waarnemingen.
**Voorbeeld rapportage:**
"Om het verband na te gaan tussen de slaapkwaliteit en de mate van rust/kalmte van studenten tijdens de examenperiode, werd een Pearson correlatie berekend. Hieruit bleek dat het verband tussen beide variabelen groot was, en significant verschillend van nul ($r=.99$, $p<.05$, $N=5$)."
#### 1.2.7 SPSS Output
Bij het interpreteren van SPSS output voor een Pearson correlatietoets, let men op de correlatiecoëfficiënt en de significantiewaarde ($p$).
**Voorbeeld interpretatie SPSS:**
Een correlatie van .44 met een $p$-waarde kleiner dan .001 geeft aan dat er een significant verband is tussen de twee variabelen.
#### 1.2.8 Extra oefening
**Onderzoeksvraag:** Is er een verband tussen de uitslag op een wiskundetoets en op het examen statistiek? Beide variabelen zijn normaal verdeeld.
* **Stap 3: Hypothesen:**
* $H_0$: Er is geen lineair verband tussen de scores op de wiskundetoets en het statistiekexamen ($\rho = 0$).
* $H_1$: Er is een lineair verband tussen de scores op de wiskundetoets en het statistiekexamen ($\rho \neq 0$).
* **Stap 4: Toetsingsgrootheid:**
* De correlatiecoëfficiënt wordt berekend.
* De toetsingsgrootheid volgt een $t$-verdeling met $N-2$ vrijheidsgraden. Voor $N=7$, zijn de vrijheidsgraden $7-2=5$.
* **Stap 5: Beslissingsregel:**
* Bij tweezijdige toetsing en een gegeven significantieniveau, wordt een kritieke waarde vergeleken met de berekende $t$-waarde.
* Als de berekende waarde (bv. 13.03) groter is dan de kritieke waarde (bv. 2.571), wordt $H_0$ verworpen.
* **Stap 6: Effectgrootte:**
* De correlatiecoëfficiënt ($r$) zelf dient als effectgrootte.
* **Stap 7: Rapporteren:**
* "Om het verband na te gaan tussen de score op een wiskundetoets en de eindscore voor het vak statistiek, werd een Pearson correlatie berekend. Hieruit bleek dat het verband tussen beide variabelen groot was, en significant verschillend van nul ($r=.98$, $p<.05$, $N=7$)."
### 1.3 Non-parametrische rangcorrelatie van Spearman
De rangcorrelatie van Spearman wordt gebruikt wanneer de voorwaarden voor parametrische toetsen geschonden zijn, zoals bij variabelen op ordinaal niveau, of wanneer de variabelen niet normaal verdeeld zijn.
#### 1.3.1 Toetsingssituatie en voorbeeld
Deze toets wordt gebruikt bij variabelen die minstens op ordinaal niveau gemeten zijn, of wanneer de normaliteitsvoorwaarde voor de Pearson correlatie niet voldaan is.
**Voorbeeld:**
Een onderzoeker wil het verband nagaan tussen het gebruik van sociale media en het zelfbeeld bij jongeren. Beide variabelen zijn gemeten op een Likert-schaal (ordinaal niveau).
#### 1.3.2 Voorwaarden
De belangrijkste voorwaarde is dat de variabelen minstens op ordinaal niveau gemeten zijn.
#### 1.3.3 Hypothesen
* $H_0$: Er bestaat geen monotoon verband tussen de twee variabelen in de populatie.
* $H_1$: Er bestaat wel een monotoon verband tussen de twee variabelen in de populatie.
#### 1.3.4 Toetsingsgrootheid
De toetsingsgrootheid wordt berekend op basis van de rangordes van de observaties. De berekening kan leiden tot een $t$-score, die dan getoetst wordt tegen een $t$-verdeling met $N-2$ vrijheidsgraden.
#### 1.3.5 Beslissingsregels
De nulhypothese wordt verworpen als de berekende toetsingsgrootheid buiten het betrouwbaarheidsinterval valt of als de $p$-waarde kleiner is dan het significantieniveau ($\alpha$).
**Voorbeeld interpretatie:**
Als een $t$-score van -3.53 wordt verkregen en dit kleiner is dan de kritieke waarde van -2.776 (bij 4 vrijheidsgraden en $\alpha=.05$ tweezijdig), wordt de nulhypothese verworpen.
#### 1.3.6 Effectgrootte
Net als bij de Pearson correlatie, kan de Spearman correlatiecoëfficiënt ($r$) gebruikt worden als maat voor de effectgrootte.
#### 1.3.7 Rapporteren
De rapportage volgt een vergelijkbaar patroon als bij de Pearson correlatie, met vermelding van de Spearman correlatiecoëfficiënt, $p$-waarde en steekproefgrootte.
**Voorbeeld rapportage:**
"Om het verband na te gaan tussen het gebruik van sociale media en zelfbeeld bij jongeren, werd een Spearman correlatie berekend. Hieruit bleek dat het verband tussen beide variabelen groot was, en significant verschillend van nul ($r = -,87$, $p<,05$, $N=6$)."
#### 1.3.8 Extra oefening
**Onderzoeksvraag:** Wat is het verband tussen intelligentie en leiderschap bij kinderen?
* **Stap 1: Toetsingssituatie:** Voorwaarden voor parametrische toetsen zijn geschonden, dus een non-parametrische toets is aangewezen.
* **Stap 2: Voorwaarden:** Variabelen zijn minstens van ordinaal niveau.
* **Stap 3: Hypothesen:**
* $H_0$: Er is geen monotoon verband tussen intelligentie en leiderschap.
* $H_1$: Er is een monotoon verband tussen intelligentie en leiderschap.
* **Stap 4: Toetsingsgrootheid:** De rangordes van de variabelen worden berekend en gebruikt om de correlatiecoëfficiënt te bepalen. De kansverdeling is een $t$-verdeling met $N-2$ vrijheidsgraden.
* **Stap 5: Beslissingsregel:** De berekende toetsingsgrootheid wordt vergeleken met de kritieke waarde. Als 2.25 niet groter is dan 2.306 (kritieke waarde), wordt $H_0$ *niet* verworpen.
* **Stap 6: Effectgrootte:** De correlatiecoëfficiënt dient als effectgrootte.
* **Stap 7: Rapporteren:** "Om na te gaan of er een verband bestaat tussen leiderschap en intelligentie, werd een Spearman correlatie berekend. Echter bleek dit verband niet significant verschillend van nul ($r = 0,62$, $p>,05$, $N=10$)."
### 1.4 Non-parametrische chikwadraat voor kruistabellen
De chikwadraattoets voor kruistabellen wordt gebruikt om het verband tussen twee nominale variabelen te onderzoeken.
#### 1.4.1 Toetsingssituatie en voorbeeld
Deze toets vergelijkt de geobserveerde frequenties in een kruistabel met de verwachte frequenties, om te bepalen of er een statistisch significant verband is tussen twee nominale variabelen.
**Voorbeeld:**
Men wil weten of er een betekenisvol verband bestaat tussen politieke voorkeur en de mening over het opleggen van een milieubelasting. Dit wordt onderzocht bij 85 mensen.
#### 1.4.2 Voorwaarden
* De variabelen zijn nominaal.
* De analyse is gebaseerd op frequenties, niet op percentages.
* Niet geschikt voor herhaalde metingen.
* De categorieën van de variabelen zijn wederzijds exclusief.
* De verwachte frequenties in de kruistabel mogen niet te klein zijn (maximaal 20% met een verwachte frequentie kleiner dan 5, en geen enkele verwachte frequentie kleiner dan 1).
#### 1.4.3 Hypothesen
* $H_0$: De twee nominale variabelen zijn onafhankelijk (er is geen verband).
* $H_1$: De twee nominale variabelen zijn afhankelijk (er is wel een verband).
* Dit is altijd een tweezijdige toets.
#### 1.4.4 Toetsingsgrootheid
De toetsingsgrootheid is de chikwadraat ($\chi^2$) waarde, die berekend wordt op basis van de geobserveerde ($f_o$) en verwachte ($f_e$) frequenties:
$$ \chi^2 = \sum \frac{(f_o - f_e)^2}{f_e} $$
De kansverdeling is een $\chi^2$-verdeling met een specifiek aantal vrijheidsgraden, afhankelijk van de dimensies van de kruistabel ($df = (rijen-1)(kolommen-1)$).
**Voorbeeld berekening verwachte frequentie ($f_e$):**
$$f_e = \frac{\text{Som van rij} \times \text{Som van kolom}}{\text{Totaal aantal observaties}}$$
#### 1.4.5 Beslissingsregels
De nulhypothese wordt verworpen als de berekende $\chi^2$-waarde groter is dan de kritieke $\chi^2$-waarde bij een gegeven significantieniveau en aantal vrijheidsgraden, of als de $p$-waarde kleiner is dan $\alpha$.
#### 1.4.6 Effectgrootte
De effectgrootte kan op verschillende manieren berekend worden, zoals de contingentiecoëfficiënt, $\phi$-coëfficiënt of Cramérs V. Cramérs V wordt vaak als meest aangewezen beschouwd.
* **Richtlijnen voor Cramérs V:**
* $r < 0.10$: triviaal
* $0.10 \leq r < 0.30$: klein
* $0.30 \leq r < 0.50$: medium
* $r \geq 0.50$: sterk
#### 1.4.7 Rapporteren
De rapportage omvat de $\chi^2$-waarde, het aantal vrijheidsgraden, de $p$-waarde en de berekende effectgrootte (bv. Cramérs V).
**Voorbeeld rapportage:**
"Het verband tussen de variabelen mening over milieubelasting en politieke voorkeur werd nagegaan aan de hand van een chikwadraattoets. Deze wees uit dat beide variabelen statistisch afhankelijk zijn ($\chi^2(4)=21,86$, $p<,001$). Het verband bleek matig te zijn (Cramérs V = .36)."
#### 1.4.8 Extra oefening
**Onderzoeksvraag:** Is er een verband tussen de wijze waarop vragenlijsten worden afgenomen en het al of niet willen meedoen met de enquête?
* **Stap 1: Toetsingssituatie:** Twee nominale variabelen, dus een kruistabel met frequenties.
* **Stap 2: Voorwaarden:** Categorieën sluiten elkaar uit. Verwachte frequenties niet te laag (minder dan 20% met $f_e < 5$ en geen enkele $f_e < 1$).
* **Stap 3: Hypothesen:**
* $H_0$: De wijze van afname en de deelnamebereidheid zijn onafhankelijk.
* $H_1$: De wijze van afname en de deelnamebereidheid zijn afhankelijk.
* **Stap 4: Toetsingsgrootheid:** De $\chi^2$-toetsingsgrootheid wordt berekend met de formule $\chi^2 = \sum \frac{(f_o - f_e)^2}{f_e}$.
* **Stap 5: Beslissingsregel:** De berekende $\chi^2$-waarde wordt vergeleken met de kritieke waarde. Als aan de voorwaarden is voldaan (0% van de cellen met $f_e < 5$ en minimum $f_e > 1$).
* **Stap 6: Effectgrootte:** Cramérs V wordt gebruikt als universeel geschikte maat.
* **Stap 7: Rapporteren:** "Om na te gaan of er een verband bestaat tussen de wijze waarop vragenlijsten worden afgenomen en het al of niet willen meedoen met de enquête werd een $\chi^2$-toets uitgevoerd, die uitwees dat er inderdaad een eerder zwak verband is tussen beide variabelen ($\chi^2 = 12.01$, $p = .002$, V = .16)."
### 1.5 Hoe kies je de juiste toets?
De keuze voor de juiste statistische toets hangt af van meerdere factoren:
* **Onderzoeksvraag:** Wat wil je precies weten (verschil, verband)?
* **Variabelen:** Wat zijn de afhankelijke en onafhankelijke variabelen?
* **Meetniveau van de variabelen:** Nominaal, ordinaal, interval/ratio?
* **Aantal populaties:** Één, twee, of meer dan twee?
* **Onafhankelijke of afhankelijke steekproeven:** Zijn de metingen onafhankelijk van elkaar (verschillende personen) of afhankelijk (dezelfde personen gemeten onder verschillende condities)?
* **Parametrisch of non-parametrisch:** Zijn de voorwaarden voor parametrische toetsen (o.a. normaliteit, interval/ratio niveau) voldaan?
* **Eenzijdig of tweezijdig toetsen:** Is er een specifieke verwachting over de richting van het effect?
**Overzicht van getoetste technieken:**
| Situatie | Parametrisch (P) | Non-parametrisch (NP) |
| :----------------------------- | :--------------------------------------------- | :-------------------------------------- |
| **1 populatie** | $z$-toets / $t$-toets voor één gemiddelde | Chi-kwadraattoets voor frequenties |
| **2 onafhankelijke populaties** | $t$-toets voor twee onafhankelijke steekproeven | Wilcoxon rank-sum test |
| **2 afhankelijke populaties** | $t$-toets voor twee afhankelijke steekproeven | Wilcoxon signed-rank test |
| **>2 onafhankelijke populaties** | One-way ANOVA (variantieanalyse) | Kruskal-Wallis toets (niet in dit document) |
| **Verband tussen 2 variabelen** | Pearson correlatietoets | Spearman rangcorrelatie, Chi-kwadraat |
**Parametrische toetsen** zijn geschikter wanneer de afhankelijke variabele minstens op intervalniveau gemeten is en normaal verdeeld is in de populatie.
**Non-parametrische toetsen** worden gebruikt wanneer de afhankelijke variabele van lager meetniveau is (nominaal of ordinaal) of niet normaal verdeeld is.
---
# Non-parametrische toetsen voor verbanden en categorische variabelen
Hieronder volgt een samenvatting van de non-parametrische toetsen voor verbanden en categorische variabelen, bedoeld als studiemateriaal voor je examen.
## 2. Non-parametrische toetsen voor verbanden en categorische variabelen
Dit deel behandelt non-parametrische methoden om verbanden tussen variabelen te onderzoeken, specifiek de rangcorrelatie van Spearman en de chikwadraattoets voor kruistabellen.
### 2.1 Rangcorrelatie van Spearman
De rangcorrelatie van Spearman is een non-parametrische toets die wordt gebruikt om de sterkte en richting van het verband tussen twee ordinale variabelen te meten, of wanneer de voorwaarden voor parametrische toetsen (zoals Pearson's r) geschonden zijn, bijvoorbeeld bij niet-normaal verdeelde interval/ratio variabelen of ordinale variabelen.
#### 2.1.1 Toetsingssituatie
De toetsingssituatie is gericht op het onderzoeken van een verband tussen twee variabelen die minimaal van ordinaal niveau zijn. Dit is met name nuttig wanneer de data niet voldoet aan de aannames van normaliteit die vereist zijn voor parametrische correlatietoetsen.
#### 2.1.2 Voorwaarden
De belangrijkste voorwaarde voor het toepassen van de Spearman rangcorrelatie is dat beide variabelen van minimaal ordinaal niveau zijn. Er zijn verder geen strenge aannames over de verdeling van de data.
#### 2.1.3 Hypothesen
* **Nulhypothese ($H_0$):** Er is geen verband (correlatie) tussen de twee variabelen in de populatie. De rangcorrelatiecoëfficiënt is gelijk aan nul ($\rho_s = 0$).
* **Alternatieve hypothese ($H_1$):** Er is wel een verband (correlatie) tussen de twee variabelen in de populatie. Dit kan eenzijdig (bijvoorbeeld $\rho_s > 0$ of $\rho_s < 0$) of tweezijdig ($\rho_s \neq 0$) geformuleerd worden, afhankelijk van de onderzoeksvraag.
#### 2.1.4 Toetsingsgrootheid
De rangcorrelatiecoëfficiënt van Spearman, aangeduid als $r_s$, wordt berekend op basis van de rangen van de geobserveerde data. De formule voor $r_s$ is:
$$ r_s = 1 - \frac{6 \sum d_i^2}{n(n^2 - 1)} $$
waarbij:
* $d_i$ het verschil is tussen de rangen van de observaties voor persoon $i$.
* $n$ het aantal paren van observaties is.
Voor kleine steekproeven wordt de toetsingsgrootheid vergeleken met een t-verdeling met $n-2$ vrijheidsgraden. Voor grotere steekproeven kan een z-toets gebruikt worden.
#### 2.1.5 Beslissingsregel
De nulhypothese wordt verworpen als de berekende toetsingsgrootheid (bijvoorbeeld een t-waarde) groter is in absolute waarde dan de kritieke waarde uit de t-tabel (met $n-2$ vrijheidsgraden) voor een gegeven significantieniveau ($\alpha$), of als de overschrijdingskans (p-waarde) kleiner is dan $\alpha$.
#### 2.1.6 Effectgrootte
De correlatiecoëfficiënt zelf, $r_s$, fungeert als maat voor de effectgrootte. Hierdoor is geen aparte berekening van de effectgrootte nodig. Een hogere absolute waarde van $r_s$ indiceert een sterkere relatie.
#### 2.1.7 Rapporteren
Bij het rapporteren van de resultaten van een Spearman rangcorrelatie worden de volgende elementen vermeld: het type toets, de richting van het verband (positief of negatief), de sterkte van het verband (de $r_s$ waarde), de significantie (p-waarde) en de steekproefgrootte ($n$).
Bijvoorbeeld: "Om het verband na te gaan tussen het gebruik van sociale media en zelfbeeld bij jongeren, werd een Spearman correlatie berekend. Hieruit bleek dat het verband tussen beide variabelen groot was, en significant verschillend van nul ($r_s = -0.87$, $p < 0.05$, $n=6$)."
### 2.2 Chikwadraattoets voor kruistabellen
De chikwadraattoets voor kruistabellen is een non-parametrische toets die wordt gebruikt om te bepalen of er een significant verband bestaat tussen twee categorische variabelen (nominaal of ordinaal). De toets vergelijkt de geobserveerde frequenties in een kruistabel met de verwachte frequenties onder de aanname van onafhankelijkheid.
#### 2.2.1 Toetsingssituatie
De toetsingssituatie betreft het onderzoeken of twee categorische variabelen afhankelijk van elkaar zijn. Dit wordt gedaan door de geobserveerde frequentieverdelingen van de ene variabele binnen de categorieën van de andere variabele te analyseren.
#### 2.2.2 Voorwaarden
De voorwaarden voor de chikwadraattoets zijn:
* De variabelen moeten minimaal van nominaal niveau zijn.
* De gegevens moeten op frequentieniveau worden geanalyseerd, niet op percentages.
* De categorieën van de variabelen moeten elkaar wederzijds uitsluiten en alle observaties moeten in een categorie passen.
* De verwachte frequenties ($F_e$) in de cellen van de kruistabel mogen niet te klein zijn. Een veelgebruikte vuistregel is dat maximaal 20% van de cellen een verwachte frequentie kleiner dan 5 mag hebben, en geen enkele cel mag een verwachte frequentie kleiner dan 1 hebben.
#### 2.2.3 Hypothesen
* **Nulhypothese ($H_0$):** De twee variabelen zijn onafhankelijk. Er is geen verband tussen de variabelen in de populatie.
* **Alternatieve hypothese ($H_1$):** De twee variabelen zijn afhankelijk. Er is wel een verband tussen de variabelen in de populatie. De chikwadraattoets is altijd tweezijdig.
#### 2.2.4 Toetsingsgrootheid
De toetsingsgrootheid is de chikwadraat ($\chi^2$) statistiek, die als volgt wordt berekend:
$$ \chi^2 = \sum_{i=1}^{k} \frac{(F_{o,i} - F_{e,i})^2}{F_{e,i}} $$
waarbij:
* $F_{o,i}$ de geobserveerde frequentie is in cel $i$.
* $F_{e,i}$ de verwachte frequentie is in cel $i$, berekend onder de aanname van onafhankelijkheid.
* $k$ het totale aantal cellen in de kruistabel is.
De verwachte frequentie ($F_e$) voor een specifieke cel wordt berekend als:
$$ F_e = \frac{(\text{rijtotaal}) \times (\text{kolomtotaal})}{\text{totaal aantal observaties}} $$
De chikwadraatstatistiek volgt een chikwadraatverdeling met vrijheidsgraden gelijk aan $(a-1)(b-1)$, waarbij $a$ en $b$ het aantal categorieën zijn van de respectievelijke variabelen.
#### 2.2.5 Beslissingsregel
De nulhypothese wordt verworpen als de berekende $\chi^2$ waarde groter is dan de kritieke $\chi^2$ waarde uit de chikwadraattabel (met de berekende vrijheidsgraden en het gekozen significantieniveau $\alpha$), of als de p-waarde kleiner is dan $\alpha$.
#### 2.2.6 Effectgrootte
Voor de chikwadraattoets zijn er verschillende maten voor effectgrootte, zoals de contingentiecoëfficiënt, de $\phi$-coëfficiënt, en Cramér's V. Cramér's V wordt vaak als de meest geschikte maat beschouwd, vooral bij kruistabellen groter dan 2x2.
Cramér's V wordt berekend als:
$$ V = \sqrt{\frac{\chi^2}{n(k-1)}} $$
waarbij:
* $\chi^2$ de berekende chikwadraatwaarde is.
* $n$ het totale aantal observaties is.
* $k$ het aantal categorieën is van de variabele met het kleinste aantal categorieën.
Interpretatie van Cramér's V:
* $V < 0.10$: triviaal effect
* $0.10 \leq V < 0.30$: klein effect
* $0.30 \leq V < 0.50$: medium effect
* $V \geq 0.50$: sterk effect
#### 2.2.7 Rapporteren
Bij het rapporteren van de resultaten van een chikwadraattoets worden de volgende elementen vermeld: het type toets, de vrijheidsgraden, de $\chi^2$ waarde, de p-waarde, de effectgrootte (bijvoorbeeld Cramér's V) en de steekproefgrootte ($n$).
Bijvoorbeeld: "Het verband tussen de variabelen mening over milieubelasting en politieke voorkeur werd nagegaan aan de hand van een chikwadraattoets. Deze wees uit dat beide variabelen statistisch afhankelijk zijn, $\chi^2(4)=21.86$, $p < 0.001$. Het verband bleek matig te zijn, Cramér's V $= 0.36$."
---
# Hoe de juiste statistische toets te kiezen en examenvoorbereiding
Hier is een gedetailleerde samenvatting voor het onderwerp "Hoe de juiste statistische toets te kiezen en examenvoorbereiding", gebaseerd op de verstrekte documentatie.
## 3. Hoe de juiste statistische toets te kiezen en examenvoorbereiding
Dit deel biedt een systematisch overzicht van statistische toetsen, presenteert een stappenplan voor de correcte selectie van een toets, en bereidt studenten voor op examens door middel van theorievragen en toepassingsvoorbeelden.
### 3.1 Overzicht van statistische toetsen
De keuze voor een statistische toets hangt af van de specifieke onderzoeksvraag en het meetniveau van de variabelen. Er wordt onderscheid gemaakt tussen parametrische en non-parametrische toetsen.
#### 3.1.1 Parametrische toetsen
Parametrische toetsen worden gebruikt wanneer de afhankelijke variabele minstens op intervalniveau gemeten is én de data in de populatie normaal verdeeld zijn.
* **Pearson correlatietoets:** Onderzoekt het lineaire verband tussen twee variabelen van interval- of rationiveau.
* **t-toetsen:** Worden gebruikt om gemiddelden te vergelijken.
* **One-sample t-test:** Vergelijkt het gemiddelde van één steekproef met een bekende populatiewaarde.
* **t-toets voor twee onafhankelijke steekproeven:** Vergelijkt de gemiddelden van twee onafhankelijke groepen (bv. verschillende afdelingen).
* **t-toets voor twee afhankelijke steekproeven (paired samples t-test):** Vergelijkt de gemiddelden van twee metingen bij dezelfde groep personen (bv. voor en na een interventie).
* **One-way ANOVA (variantieanalyse):** Vergelijkt de gemiddelden van meer dan twee onafhankelijke groepen.
#### 3.1.2 Non-parametrische toetsen
Non-parametrische toetsen worden toegepast wanneer de data op nominaal of ordinaal niveau gemeten zijn, of wanneer de aanname van normaliteit voor parametrische toetsen geschonden is.
* **Spearman rangcorrelatietoets:** Onderzoekt het verband tussen twee variabelen die minstens op ordinaal niveau gemeten zijn.
* **Chikwadraattoets voor kruistabellen (χ²-toets):** Onderzoekt het verband tussen twee nominale variabelen aan de hand van frequentieverdelingen in een kruistabel.
* **Wilcoxon rank-sum test:** Vergelijkt de verdelingen van twee onafhankelijke groepen op ordinaal niveau.
* **Wilcoxon signed-rank test:** Vergelijkt de verdelingen van twee afhankelijke metingen op ordinaal niveau.
#### 3.1.3 Toetsen voor het verband tussen twee variabelen
Dit betreft specifiek toetsen die kijken naar de relatie tussen twee variabelen.
* **Pearson correlatietoets:** Voor interval/ratio variabelen.
* **Spearman rangcorrelatietoets:** Voor ordinale variabelen.
* **Chikwadraattoets voor kruistabellen:** Voor nominale variabelen.
### 3.2 Stappenplan voor het kiezen van de juiste toets
Het selecteren van de juiste statistische toets vereist een systematische aanpak.
1. **Begrijp de onderzoeksvraag:** Wat wil de onderzoeker precies weten? Gaat het om een verschil, een verband, of een voorspelling?
2. **Identificeer de variabelen:** Wat zijn de afhankelijke variabelen (AV) en de onafhankelijke variabelen (OV)?
3. **Bepaal het meetniveau van de variabelen:** Is de variabele nominaal, ordinaal, interval of ratio?
4. **Bepaal het aantal populaties/groepen:** Worden één, twee of meer dan twee populaties vergeleken?
5. **Identificeer of de steekproeven afhankelijk of onafhankelijk zijn:** Zijn de metingen afkomstig van dezelfde personen of van verschillende, ongerelateerde groepen?
6. **Kies tussen parametrisch en non-parametrisch:** Zijn de voorwaarden voor parametrische toetsen (interval/ratio niveau, normaliteit) voldaan? Zo niet, kies dan voor een non-parametrische toets.
7. **Bepaal of de toets eenzijdig of tweezijdig is:** Is er een specifieke richting van het verwachte effect, of wordt er alleen gekeken of er *een* verschil is?
#### 3.2.1 Stramien voor het uitvoeren van een toets
Voor elke statistische toets wordt een standaard procedure gevolgd:
1. **Toetsingssituatie:** Beschrijf de context, het type onderzoeksvraag en de gegevens.
2. **Voorwaarden:** Controleer of aan de statistische voorwaarden voor de gekozen toets wordt voldaan.
3. **Hypothesen:** Formuleer de nulhypothese ($H_0$) en de alternatieve hypothese ($H_1$).
4. **Toetsingsgrootheid:** Bereken de waarde van de toetsingsgrootheid en identificeer de bijbehorende kansverdeling.
* *Formule voorbeeld Pearson correlatietoets:* De toetsingsgrootheid volgt een $t$-verdeling met $df = N - 2$ vrijheidsgraden, waar $N$ het aantal paren observaties is.
5. **Beslissingsregel:** Verwerp $H_0$ op basis van de overschrijdingskans ($p$-waarde) of kritieke waarden.
* *Tip:* Bij tweezijdige toetsing wordt de kritieke waarde uit de tabel gehaald op basis van de gevraagde $\alpha$ en het aantal vrijheidsgraden. Als de berekende toetsingsgrootheid groter is dan de positieve kritieke waarde (of kleiner dan de negatieve kritieke waarde), wordt $H_0$ verworpen.
6. **Effectgrootte:** Kwantificeer de omvang van het gevonden effect. Dit geeft aan hoe belangrijk het gevonden resultaat is, los van de statistische significantie.
* *Effectgrootte bij correlatietoetsen:* De correlatiecoëfficiënt ($r$) zelf dient vaak als effectgrootte.
* *Effectgrootte bij chikwadraattoets:* Kan worden berekend met de chi-kwadraat statistiek, maar ook met maten als Cramér's V. Cramér's V wordt vaak gebruikt en geïnterpreteerd als: $r < .10$ (triviaal), $.10 - .30$ (klein), $.30 - .50$ (medium), $>.50$ (sterk).
7. **Rapporteren:** Beschrijf de resultaten op een gestandaardiseerde en duidelijke manier, inclusief de toets, de significantie, de effectgrootte en de steekproefgrootte.
#### 3.2.2 Voorbeelden van toetsen en hun toepassing
##### Pearson correlatietoets
* **Onderzoeksvraag:** Bestaat er een verband tussen de slaapkwaliteit van studenten tijdens de examenperiode en de mate van rust/kalmte die studenten ervaren?
* **Voorwaarden:** Variabelen zijn interval/ratio niveau en normaal verdeeld in de populatie.
* **Hypothesen:**
* $H_0$: Er is geen lineair verband tussen slaapkwaliteit en ervaren rust/kalmte ($ρ = 0$).
* $H_1$: Er is een lineair verband tussen slaapkwaliteit en ervaren rust/kalmte ($ρ \neq 0$).
* **Toetsingsgrootheid:** $t$-verdeling met $df = N - 2$.
* **Effectgrootte:** De correlatiecoëfficiënt ($r$).
* **Rapportage:** "Om het verband na te gaan tussen de slaapkwaliteit en de mate van rust/kalmte van studenten tijdens de examenperiode, werd een Pearson correlatie berekend. Hieruit bleek dat het verband tussen beide variabelen groot was, en significant verschillend van nul ($r=.99$, $p<.05$, $N=5$)."
##### Rangcorrelatie van Spearman
* **Toetsingssituatie:** Geschikt wanneer parametrische voorwaarden geschonden zijn (bv. variabelen op ordinaal niveau) of wanneer de variabelen niet normaal verdeeld zijn.
* **Voorwaarden:** Minimaal ordinaal meetniveau.
* **Hypothesen:**
* $H_0$: Er is geen verband tussen de rangen van de variabelen.
* $H_1$: Er is wel een verband tussen de rangen van de variabelen.
* **Toetsingsgrootheid:** De berekening leidt tot een $t$-score, die wordt vergeleken met een kritieke waarde uit de $t$-tabel met $N-2$ vrijheidsgraden.
* **Effectgrootte:** De correlatiecoëfficiënt ($r$) kan gebruikt worden.
* **Rapportage:** "Om het verband na te gaan tussen het gebruik van sociale media en zelfbeeld bij jongeren, werd een Spearman correlatie berekend. Hieruit bleek dat het verband tussen beide variabelen groot was, en significant verschillend van nul ($r = -,87$, $p<,05$, $N=6$)."
##### Chikwadraat voor kruistabellen (χ²-toets)
* **Toetsingssituatie:** Onderzoekt het verband tussen twee nominale variabelen door de geobserveerde frequenties te vergelijken met de verwachte frequenties onder de nulhypothese van onafhankelijkheid.
* **Voorwaarden:**
* Nominale variabelen.
* Geen herhaalde metingen.
* Mutueel exclusieve categorieën.
* Verwachte frequenties ($f_e$) in de kruistabel mogen niet te klein zijn: maximaal 20% van de cellen mag een $f_e < 5$ hebben, en geen enkele cel mag een $f_e < 1$ hebben.
* **Hypothesen:**
* $H_0$: De variabelen zijn onafhankelijk; er is geen verband.
* $H_1$: De variabelen zijn afhankelijk; er is een verband.
* **Toetsingsgrootheid:** De $\chi^2$-statistiek, met $df = (aantal\;rijen - 1) \times (aantal\;kolommen - 1)$.
* **Effectgrootte:** Diverse maten zoals de contigentiecoëfficiënt, $\phi$-coëfficiënt of Cramér's V. Cramér's V wordt als meest aangewezen beschouwd.
* **Rapportage:** "Het verband tussen de variabelen mening over milieubelasting en politieke voorkeur werd nagegaan aan de hand van een chikwadraattoets. Deze wees uit dat beide variabelen statistisch afhankelijk zijn, $\chi^2(4)=21,86$, $p<,001$. Het verband bleek matig te zijn, Cramér’s V = .36."
### 3.3 Hoe de juiste toets te kiezen: een beslissingsboom
De keuze voor een toets kan worden gevisualiseerd met een reeks vragen:
1. **Wat is de onderzoeksvraag?**
* Verschil in gemiddelden? -> Ga naar vraag 2.
* Verband tussen variabelen? -> Ga naar vraag 3.
2. **Verschil in gemiddelden:**
* Aantal groepen?
* 1 groep: One-sample t-test / z-toets.
* 2 groepen:
* Onafhankelijke steekproeven: Independent t-test (parametrisch) of Wilcoxon rank-sum test (non-parametrisch).
* Afhankelijke steekproeven: Paired t-test (parametrisch) of Wilcoxon signed-rank test (non-parametrisch).
* Meer dan 2 groepen: One-way ANOVA (parametrisch).
3. **Verband tussen variabelen:**
* Meetniveau van variabelen?
* Interval/Ratio: Pearson correlatie.
* Ordinaal: Spearman correlatie.
* Nominaal: Chikwadraattoets voor kruistabellen.
#### 3.3.1 Parametrisch versus Non-parametrisch
* **Parametrisch:** Gebruik wanneer de afhankelijke variabele minstens intervalniveau heeft en de data normaal verdeeld zijn in de populatie.
* **Non-parametrisch:** Gebruik wanneer de afhankelijke variabele op ordinaal niveau is, of wanneer de normaliteitsassumptie van parametrische toetsen geschonden is.
#### 3.3.2 Eenzijdig versus Tweezijdig toetsen
* **Tweezijdig toetsen:** Wordt gebruikt wanneer er geen specifieke verwachting is over de richting van het effect (bv. "is er een verschil?"). Dit is de standaardkeuze bij gebrek aan eerdere kennis.
* **Eenzijdig toetsen:** Wordt gebruikt wanneer er een duidelijke theoretische verwachting is over de richting van het effect (bv. "is groep A *hoger* dan groep B?"). Dit leidt tot meer statistische power als de richting correct is voorspeld.
> **Tip:** Bij twijfel of gebrek aan eerdere onderzoekingen over de richting van een effect, kies altijd voor tweezijdig toetsen om geen mogelijke verbanden (positief of negatief) te missen.
### 3.4 Examenvoorbereiding en voorbeeldvragen
De examenvoorbereiding richt zich op zowel theoretische kennis als de praktische toepassing van statistische toetsen.
#### 3.4.1 Typen examenvragen
* **Theorievragen:** Vragen die het begrip van concepten toetsen, zoals de fasen van de empirische cyclus, de betekenis van significantie en effectgrootte, of de keuze tussen een- en tweezijdig toetsen.
* **Toepassingsvragen:** Vragen waarbij een specifieke onderzoekssituatie wordt geschetst en de student de juiste toets moet selecteren, hypothesen moet formuleren, berekeningen moet uitvoeren, resultaten moet interpreteren en rapporteren.
#### 3.4.2 Belangrijke concepten voor het examen
* **Significantie:** Geeft aan of een gevonden effect waarschijnlijk niet op toeval berust. Een $p$-waarde kleiner dan of gelijk aan $\alpha$ (meestal .05) leidt tot het verwerpen van de nulhypothese.
* **Effectgrootte:** Kwantificeert de omvang en betekenisvolheid van een gevonden effect. Het is een aanvulling op significantie en geeft inzicht in de robuustheid van het resultaat in de populatie.
* **Type I en Type II fouten:**
* **Type I fout (vals positief):** De nulhypothese wordt verworpen terwijl deze in werkelijkheid waar is. De kans hierop is gelijk aan $\alpha$.
* **Type II fout (vals negatief):** De nulhypothese wordt niet verworpen terwijl deze in werkelijkheid onjuist is. De kans hierop wordt aangeduid met $\beta$.
* **Empirische cyclus:** Het proces van onderzoek, bestaande uit observatie, inductie, deductie, toetsing en evaluatie.
#### 3.4.3 Voorbeeld van een toepassingsvraag (ANOVA)
**Situatie:** Een onderzoeker wil nagaan of er een verschil is in het beoordelingscijfer dat aan memes wordt gegeven, afhankelijk van welk vak studenten volgen (PW1, GPW, STAT2). Er zijn 45 studenten, met 15 studenten per vak.
**Hypothesen:**
* $H_0$: Er is geen significant verschil in het beoordelingscijfer van memes tussen de vakken.
* $H_1$: Er is minstens één significant verschil tussen de beoordelingscijfers van de memes tussen de vakken.
**Gegeven waarden:**
* Gemiddelde groep PW1: 7,54
* Gemiddelde groep GPW: 7,46
* Gemiddelde groep STAT2: 8,38
* Totaal gemiddelde: 7,79
* Sum of Squares (within-groups): 380,1705
* $\alpha = .05$
**Te berekenen:**
* Sum of Squares (between-groups)
* Vrijheidsgraden (between-groups en within-groups)
* Mean Sum of Squares (between-groups en within-groups)
* Toetsingsgrootheid ($F$-waarde)
* Kritieke waarde
* Conclusie en rapportage
**Uitwerking (voorbeeld met berekende waarden):**
* $SS_{between} = (7.54-7.79)^2 \times 15 + (7.46-7.79)^2 \times 15 + (8.38-7.79)^2 \times 15 \approx 27.07$
* $df_{between} = 3 - 1 = 2$
* $df_{within} = 45 - 3 = 42$
* $MS_{between} = SS_{between} / df_{between} \approx 27.07 / 2 \approx 13.535$
* $MS_{within} = SS_{within} / df_{within} \approx 380.1705 / 42 \approx 9.052$
* $F = MS_{between} / MS_{within} \approx 13.535 / 9.052 \approx 1.49$
* Kritieke waarde $F$ voor $df_1=2$, $df_2=42$, $\alpha=.05$ is ongeveer 3.23.
* **Conclusie:** Aangezien de berekende $F$-waarde (1.49) kleiner is dan de kritieke waarde (3.23), wordt de nulhypothese niet verworpen. Er is geen statistisch significant verschil in beoordelingscijfers voor memes tussen de vakken.
> **Tip:** Oefen met het correct rapporteren van resultaten. Dit omvat het vermelden van de toets, de vrijheidsgraden (indien van toepassing), de toetsingsgrootheid, de $p$-waarde, en de effectgrootte. Bij een significant resultaat in ANOVA is het belangrijk te vermelden dat er minstens één significant verschil is en dat post-hoc toetsen nodig zijn om specifieke groepsverschillen te identificeren.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Pearson correlatietoets | Een statistische toets die wordt gebruikt om de sterkte en richting van het lineaire verband tussen twee interval- of rationiveau variabelen te meten. Het resultaat is de Pearson correlatiecoëfficiënt (r). |
| Spearman correlatietoets | Een non-parametrische statistische toets die wordt gebruikt om de sterkte en richting van het monotone verband tussen twee geordende (ordinale) variabelen te meten. Het resultaat is de Spearman rangcorrelatiecoëfficiënt (rho). |
| Chikwadraat toets voor kruistabellen | Een non-parametrische statistische toets die wordt gebruikt om te bepalen of er een significant verband bestaat tussen twee nominale variabelen, georganiseerd in een kruistabel. |
| Toetsingssituatie | De specifieke context of onderzoeksvraag waarin een statistische toets wordt toegepast, inclusief de aard van de variabelen en het onderzoeksdoel (bijvoorbeeld het toetsen van een verband of een verschil). |
| Voorwaarden | De statistische aannames die voldaan moeten zijn om een specifieke statistische toets correct en betrouwbaar te kunnen toepassen. Schending van voorwaarden kan leiden tot ongeldige resultaten. |
| Hypothesen (H0 en H1) | Hypothesen zijn stellingen over de populatie die worden getoetst met statistische methoden. H0 (nulhypothese) stelt meestal geen effect of geen verband, terwijl H1 (alternatieve hypothese) wel een effect of verband stelt. |
| Toetsingsgrootheid | Een waarde die wordt berekend uit de steekproefgegevens en die wordt gebruikt om de nulhypothese te toetsen. De verdeling van deze grootheid onder de nulhypothese is bekend. |
| Kansverdeling | Een wiskundige functie die de waarschijnlijkheid beschrijft van het verkrijgen van verschillende uitkomsten in een willekeurig experiment of variabele. Bekende verdelingen zijn de t-verdeling, de chikwadraatverdeling en de F-verdeling. |
| Beslissingsregel | Een regel die bepaalt of de nulhypothese wordt verworpen of niet verworpen, gebaseerd op de waarde van de toetsingsgrootheid en een vooraf bepaald significantieniveau (alfa), of op basis van de overschrijdingskans (p-waarde). |
| Kritieke waarde | De grenswaarde in een kansverdeling die wordt gebruikt om de beslissingsregel te formuleren. Als de toetsingsgrootheid groter (of kleiner, afhankelijk van de toets) is dan de kritieke waarde, wordt de nulhypothese verworpen. |
| Overschrijdingskans (p-waarde) | De kans om een steekproefresultaat te verkrijgen dat minstens zo extreem is als het waargenomen resultaat, aangenomen dat de nulhypothese waar is. Een lage p-waarde (typisch <= .05) leidt tot het verwerpen van de nulhypothese. |
| Effectgrootte | Een maat die aangeeft hoe groot het waargenomen effect of verband is, onafhankelijk van de steekproefgrootte. Het kwantificeert de praktische significantie van een resultaat. |
| Rapporteren | Het correct en volledig presenteren van de resultaten van een statistische analyse, inclusief de toetsingsgrootheid, de overschrijdingskans, de effectgrootte en de conclusie in de context van de onderzoeksvraag. |
| Nominale variabele | Een categorische variabele waarbij de categorieën geen inherente volgorde hebben (bijvoorbeeld geslacht, politieke voorkeur). |
| Ordinale variabele | Een categorische variabele waarbij de categorieën een inherente volgorde hebben, maar de afstanden tussen de categorieën niet noodzakelijkerwijs gelijk zijn (bijvoorbeeld Likert-schaal, rangorde). |
| Intervalvariabele | Een variabele waarbij de afstanden tussen opeenvolgende waarden gelijk zijn, maar er geen absoluut nulpunt is (bijvoorbeeld temperatuur in Celsius). |
| Ratiovariabele | Een variabele waarbij de afstanden tussen opeenvolgende waarden gelijk zijn en er een absoluut nulpunt is, waardoor verhoudingen zinvol zijn (bijvoorbeeld lengte, gewicht). |
| Parametrische toets | Een statistische toets die aannames doet over de parameters van de populatie waaruit de steekproef is getrokken, met name over de vorm van de verdeling (vaak normaalverdeling). |
| Non-parametrische toets | Een statistische toets die minder strenge aannames doet over de populatieparameters en de verdeling van de gegevens, waardoor ze geschikt zijn voor ordinale en nominale data of wanneer de aannames van parametrische toetsen niet voldaan zijn. |
| Onafhankelijke steekproeven | Steekproeven waarbij de observaties in de ene steekproef geen invloed hebben op de observaties in de andere steekproef. De groepen zijn dus van elkaar gescheiden. |
| Afhankelijke steekproeven | Steekproeven waarbij de observaties binnen de steekproef gerelateerd zijn, bijvoorbeeld door herhaalde metingen bij dezelfde personen of door matching van paren (paired samples). |
| Variantieanalyse (ANOVA) | Een statistische methode die wordt gebruikt om de gemiddelden van drie of meer groepen te vergelijken door de totale variantie in de gegevens op te splitsen in variantie tussen groepen en variantie binnen groepen. |
| TYPE-I fout | De fout die gemaakt wordt wanneer de nulhypothese ten onrechte wordt verworpen. De kans hierop is gelijk aan het significantieniveau (alfa). |
| TYPE-II fout | De fout die gemaakt wordt wanneer de nulhypothese ten onrechte niet wordt verworpen, terwijl deze in werkelijkheid onwaar is. De kans hierop wordt aangeduid met bèta ($\beta$). |
| Empirische cyclus | Een proces in wetenschappelijk onderzoek dat bestaat uit observatie, inductie, deductie, toetsing en evaluatie, bedoeld om kennis te vergaren en theorieën te ontwikkelen of te verfijnen. |