Cover
Zacznij teraz za darmo Werkcollege 4_student.pptx
Summary
# Toetsen voor het verband tussen twee variabelen
Dit deel behandelt de statistische toetsen die gebruikt worden om het verband tussen twee variabelen te analyseren, inclusief parametrische en non-parametrische methoden.
## 1. Toetsen voor het verband tussen twee variabelen
Het stramien voor het uitvoeren van statistische toetsen volgt een logische volgorde:
1. **Toetsingssituatie:** Identificeer de gegevens en de specifieke onderzoeksvraag om de geschikte toets te bepalen.
2. **Voorwaarden:** Controleer of de statistische voorwaarden voor de gekozen toets voldaan zijn.
3. **Hypothesen:** Formuleer de nulhypothese ($H_0$) en de alternatieve hypothese ($H_1$) die de onderzoeksvraag weerspiegelen.
4. **Toetsingsgrootheid:** Bereken de waarde van de toetsingsgrootheid, gebaseerd op de data en de specifieke formule van de toets, en bepaal de bijbehorende kansverdeling.
5. **Beslissingsregel:** Neem een beslissing over het verwerpen of behouden van de nulhypothese, gebaseerd op de overschrijdingskans (p-waarde) of kritieke waarden.
6. **Effectgrootte:** Kwantificeer de omvang van het gevonden effect om de praktische relevantie te beoordelen.
7. **Rapporteren:** Communiceer de resultaten van de toets op een correcte en volledige manier.
### 1.1 Parametrische toetsen: Pearson correlatietoets
De Pearson correlatietoets wordt gebruikt om de sterkte en richting van het lineaire verband tussen twee kwantitatieve variabelen (interval/ratio) te meten, ervan uitgaande dat deze variabelen normaal verdeeld zijn in de populatie.
#### 1.1.1 Toetsingssituatie
De onderzoeksvraag richt zich op het bestaan van een lineair verband tussen twee variabelen die op interval- of rationiveau zijn gemeten.
#### 1.1.2 Voorwaarden
* De variabelen moeten op interval- of rationiveau gemeten zijn.
* De variabelen moeten (ongeveer) normaal verdeeld zijn in de populatie.
* Er mag geen sprake zijn van uitschieters die de correlatie sterk beïnvloeden.
#### 1.1.3 Hypothesen
* $H_0$: Er is geen lineair verband tussen de twee variabelen in de populatie ($\rho = 0$).
* $H_1$: Er is wel een lineair verband tussen de twee variabelen in de populatie ($\rho \neq 0$). Dit kan ook eenzijdig geformuleerd worden indien er een specifieke verwachting is over de richting van het verband.
#### 1.1.4 Toetsingsgrootheid
De toetsingsgrootheid is gebaseerd op de Pearson correlatiecoëfficiënt ($r$). Deze wordt getransformeerd tot een t-verdeling met $N-2$ vrijheidsgraden, waarbij $N$ het aantal waarnemingsparen is.
De formule voor de t-toets is:
$$ t = r \sqrt{\frac{N-2}{1-r^2}} $$
Waarbij:
* $r$ de Pearson correlatiecoëfficiënt is.
* $N$ het aantal waarnemingsparen is.
#### 1.1.5 Beslissingsregel
De nulhypothese wordt verworpen als de berekende t-waarde groter is dan de kritieke t-waarde (bij tweezijdige toetsing) of als de p-waarde kleiner is dan het significantieniveau ($\alpha$).
#### 1.1.6 Effectgrootte
De Pearson correlatiecoëfficiënt ($r$) zelf dient als maat voor de effectgrootte. Waarden variëren van -1 (perfecte negatieve correlatie) tot +1 (perfecte positieve correlatie). Een waarde van 0 geeft geen lineair verband aan.
#### 1.1.7 Rapporteren
De resultaten worden gerapporteerd met de correlatiecoëfficiënt, de p-waarde en het aantal waarnemingen. Bijvoorbeeld: "Er werd een significante positieve correlatie gevonden tussen variabele X en variabele Y ($r = \text{waarde}, p < \alpha, N = \text{aantal}$)."
> **Tip:** De interpretatie van de effectgrootte van $r$ kan als volgt zijn:
> * 0.10 - 0.30: Klein effect
> * 0.30 - 0.50: Medium effect
> * > 0.50: Groot effect
### 1.2 Non-parametrische toetsen
Non-parametrische toetsen worden gebruikt wanneer de voorwaarden voor parametrische toetsen niet voldaan zijn, met name wanneer variabelen op ordinaal niveau gemeten zijn of niet normaal verdeeld zijn.
#### 1.2.1 Rangcorrelatie van Spearman
De rangcorrelatie van Spearman meet de sterkte en richting van het monotone verband tussen twee variabelen die op minimaal ordinaal niveau gemeten zijn. De toets verwerkt de rangordes van de data in plaats van de ruwe data zelf.
##### 1.2.1.1 Toetsingssituatie
Onderzoeksvragen die gericht zijn op het verband tussen twee variabelen op minimaal ordinaal niveau, of wanneer de voorwaarden voor de Pearson correlatietoets niet voldaan zijn (bijv. schending van normaliteit).
##### 1.2.1.2 Voorwaarden
* De variabelen moeten op minimaal ordinaal niveau gemeten zijn.
* De observaties moeten onafhankelijk zijn.
##### 1.2.1.3 Hypothesen
* $H_0$: Er is geen verband tussen de rangordes van de twee variabelen in de populatie ($\rho_s = 0$).
* $H_1$: Er is wel een verband tussen de rangordes van de twee variabelen in de populatie ($\rho_s \neq 0$). Ook hier is een eenzijdige toets mogelijk.
##### 1.2.1.4 Toetsingsgrootheid
De toetsingsgrootheid is de Spearman rangcorrelatiecoëfficiënt ($r_s$). Voor kleine steekproeven ($N \leq 30$) kan een specifieke t-verdeling met $N-2$ vrijheidsgraden gebruikt worden. Voor grotere steekproeven wordt vaak een z-transformatie gebruikt, of wordt de normale verdeling benaderd.
De formule voor de t-transformatie is:
$$ t = r_s \sqrt{\frac{N-2}{1-r_s^2}} $$
##### 1.2.1.5 Beslissingsregel
Net als bij Pearson correlatie, wordt $H_0$ verworpen als de berekende toetsingsgrootheid (t-waarde) buiten het betrouwbaarheidsinterval valt of als de p-waarde kleiner is dan $\alpha$.
##### 1.2.1.6 Effectgrootte
De Spearman rangcorrelatiecoëfficiënt ($r_s$) zelf dient als maat voor de effectgrootte. De interpretatie van de sterkte van het verband is vergelijkbaar met die van Pearson $r$.
##### 1.2.1.7 Rapporteren
De rapportage omvat de Spearman rangcorrelatiecoëfficiënt, de p-waarde en het aantal waarnemingen. Bijvoorbeeld: "Er werd een significante negatieve correlatie gevonden tussen variabele X en variabele Y ($r_s = \text{waarde}, p < \alpha, N = \text{aantal}$).".
#### 1.2.2 Chikwadraattoets voor kruistabellen
De chikwadraattoets voor kruistabellen wordt gebruikt om te onderzoeken of er een verband bestaat tussen twee categorische variabelen (nominaal of ordinaal) die in een kruistabel worden weergegeven. De toets vergelijkt de geobserveerde frequenties met de verwachte frequenties onder de aanname van onafhankelijkheid.
##### 1.2.2.1 Toetsingssituatie
Onderzoeksvragen die nagaan of twee nominale of ordinale variabelen afhankelijk zijn van elkaar, weergegeven in een kruistabel.
##### 1.2.2.2 Voorwaarden
* De variabelen moeten nominaal of ordinaal zijn.
* De data moeten frequenties zijn (geen percentages).
* De categorieën van de variabelen moeten elkaar wederzijds uitsluiten.
* De verwachte frequenties ($f_e$) in de cellen van de kruistabel mogen niet te klein zijn: maximaal 20% van de cellen mag een verwachte frequentie kleiner dan 5 hebben, en geen enkele cel mag een verwachte frequentie kleiner dan 1 hebben.
##### 1.2.2.3 Hypothesen
* $H_0$: De twee variabelen zijn onafhankelijk; er is geen verband tussen de variabelen.
* $H_1$: De twee variabelen zijn afhankelijk; er is wel een verband tussen de variabelen.
> **Tip:** De chikwadraattoets voor kruistabellen is altijd een tweezijdige toets.
##### 1.2.2.4 Toetsingsgrootheid
De toetsingsgrootheid is de chikwadraat ($\chi^2$) waarde, die berekend wordt als de som van de gekwadrateerde verschillen tussen de geobserveerde frequenties ($f_o$) en de verwachte frequenties ($f_e$), gedeeld door de verwachte frequenties:
$$ \chi^2 = \sum \frac{(f_o - f_e)^2}{f_e} $$
De kansverdeling is een chikwadraatverdeling met $(k-1)(l-1)$ vrijheidsgraden, waarbij $k$ het aantal categorieën is van de ene variabele en $l$ het aantal categorieën van de andere variabele.
##### 1.2.2.5 Beslissingsregel
De nulhypothese wordt verworpen als de berekende $\chi^2$-waarde groter is dan de kritieke $\chi^2$-waarde uit de tabel, of als de p-waarde kleiner is dan het significantieniveau ($\alpha$).
##### 1.2.2.6 Effectgrootte
Er zijn verschillende maten voor effectgrootte beschikbaar voor de chikwadraattoets, zoals de contingentiecoëfficiënt, de $\phi$-coëfficiënt (voor 2x2 tabellen) en Cramér's V. Cramér's V is het meest aangewezen in algemene scenario's.
De vuistregels voor Cramér's V zijn:
* $0.10 \leq V < 0.30$: klein effect
* $0.30 \leq V < 0.50$: medium effect
* $V \geq 0.50$: sterk effect
##### 1.2.2.7 Rapporteren
De resultaten worden gerapporteerd met de $\chi^2$-waarde, het aantal vrijheidsgraden, de p-waarde en de effectgrootte (bijv. Cramér's V). Bijvoorbeeld: "Het verband tussen de variabelen A en B was significant, $\chi^2(\text{df}) = \text{waarde}, p < \alpha$. De effectgrootte (Cramér's V) was .XX."
> **Voorbeeld:** Om het verband tussen politieke voorkeur en de mening over een milieubelasting na te gaan, wordt een kruistabel opgesteld. De geobserveerde frequenties worden vergeleken met de verwachte frequenties onder de aanname van onafhankelijkheid. Als de $\chi^2$-toets significant is, betekent dit dat er een verband bestaat tussen politieke voorkeur en de mening over de milieubelasting.
### 1.3 Kiezen van de juiste toets
Het kiezen van de juiste toets hangt af van de onderzoeksvraag en de kenmerken van de data:
* **Meetniveau van de variabelen:** Nominaal, ordinaal, interval/ratio.
* **Aantal variabelen:** Eén, twee of meer.
* **Aantal populaties/groepen:** Eén, twee of meer.
* **Onafhankelijke of afhankelijke steekproeven:** Worden dezelfde proefpersonen meerdere keren gemeten?
* **Verdeling van de data:** Normaal verdeeld of niet normaal verdeeld.
Voor het analyseren van het verband tussen twee variabelen zijn de volgende toetsen relevant:
* **Parametrisch:** Pearson correlatietoets (interval/ratio variabelen, normaal verdeeld).
* **Non-parametrisch:**
* Spearman rangcorrelatie (ordinale variabelen, of wanneer normaliteitsschending).
* Chikwadraattoets voor kruistabellen (nominale variabelen, voor frequenties in kruistabellen).
---
# Hoe de juiste statistische toets te kiezen
Hier volgt een gedetailleerd studieoverzicht voor het kiezen van de juiste statistische toets, gebaseerd op de verstrekte documentatie.
## 2. Hoe de juiste statistische toets te kiezen
Het systematisch kiezen van de juiste statistische toets is essentieel voor het correct analyseren van onderzoeksdata en het beantwoorden van onderzoeksvragen.
### 2.1 Systematische aanpak voor toetskeuze
Een gestructureerde aanpak helpt bij het identificeren van de meest geschikte statistische toets, rekening houdend met de specifieke kenmerken van het onderzoek.
#### 2.1.1 Onderzoeksvraag en variabelen
De eerste stap is het grondig begrijpen van de onderzoeksvraag. Dit omvat het identificeren van:
* **Afhankelijke en onafhankelijke variabelen:** Wat wordt gemeten en wat wordt gemanipuleerd of gebruikt als voorspeller?
* **Meetniveau van de variabelen:** Is de variabele nominaal, ordinaal, interval of ratio? Dit is cruciaal voor het bepalen van parametrische versus non-parametrische toetsen.
* **Parametrische toetsen:** Vereisen variabelen van minimaal intervalniveau en normaliteit van de verdeling in de populatie.
* **Non-parametrische toetsen:** Gebruikt wanneer variabelen van nominaal of ordinaal niveau zijn, of wanneer de normaliteitsvoorwaarde voor parametrische toetsen geschonden is.
#### 2.1.2 Aantal populaties
Het aantal populaties dat bestudeerd wordt, bepaalt de complexiteit van de toets:
* **Eén populatie:** Toetsen om te kijken of een steekproefgemiddelde significant afwijkt van een bekend populatiegemiddelde (bv. een één-steekproef t-toets of z-toets).
* **Twee populaties:** Toetsen om verschillen tussen twee groepen te analyseren (bv. t-toetsen voor onafhankelijke of afhankelijke steekproeven, Wilcoxon rank-sum test).
* **Meer dan twee populaties:** Toetsen om verschillen tussen drie of meer groepen te vergelijken (bv. variantieanalyse of ANOVA).
#### 2.1.3 Afhankelijke of onafhankelijke steekproeven
De relatie tussen de steekproeven is bepalend:
* **Onafhankelijke steekproeven:** Metingen uit verschillende, niet-gerelateerde groepen (bv. vergelijking van twee verschillende afdelingen).
* **Afhankelijke steekproeven:** Metingen uit dezelfde groep op verschillende tijdstippen of onder verschillende condities (bv. voor- en nameting bij dezelfde personen, of paren van deelnemers).
#### 2.1.4 Eenzijdig of tweezijdig toetsen
De richting van de onderzoekshypothese bepaalt of een eenzijdige of tweezijdige toets gebruikt wordt:
* **Tweezijdig toetsen:** Wordt gebruikt wanneer er geen specifieke verwachting is over de richting van het effect of verschil (bv. "is er een verschil?"). Dit is de meest conservatieve benadering.
* **Eenzijdig toetsen:** Wordt gebruikt wanneer er een duidelijke verwachting is over de richting van het effect of verschil (bv. "is groep A beter dan groep B?"). Dit vereist sterke theoretische onderbouwing.
### 2.2 Overzicht van statistische toetsen
De keuze voor een toets kan worden voorgesteld in tabellen die het meetniveau, het aantal populaties, en het type vraag (verschil of verband) in kaart brengen.
#### 2.2.1 Toetsen voor één populatie
* **Parametrisch:**
* **Z-toets of t-toets voor één gemiddelde:** Om te toetsen of een steekproefgemiddelde significant afwijkt van een bekend populatiegemiddelde. Vereist interval/ratio niveau en normaliteit.
* **Non-parametrisch:**
* **Chi-kwadraattoets voor frequenties:** Om te toetsen of de frequentieverdeling in een steekproef overeenkomt met een verwachte verdeling in de populatie. Geschikt voor nominale variabelen.
#### 2.2.2 Toetsen voor twee populaties
* **Verschil in gemiddelden:**
* **Parametrisch:**
* **T-toets voor twee onafhankelijke steekproeven:** Vergelijkt gemiddelden van twee onafhankelijke groepen (interval/ratio, normaliteit vereist).
* **T-toets voor twee afhankelijke steekproeven:** Vergelijkt gemiddelden van twee gerelateerde metingen binnen dezelfde groep (interval/ratio, normaliteit van verschillen vereist).
* **Non-parametrisch:**
* **Wilcoxon rank-sum test (ook Mann-Whitney U test):** Vergelijkt rangorden tussen twee onafhankelijke groepen (ordinaal, of wanneer parametrische voorwaarden geschonden zijn).
* **Wilcoxon signed-rank test:** Vergelijkt rangorden tussen twee afhankelijke metingen (ordinaal, of wanneer parametrische voorwaarden geschonden zijn).
#### 2.2.3 Toetsen voor meer dan twee populaties (onafhankelijk)
* **Parametrisch:**
* **One-way ANOVA (Variantieanalyse):** Vergelijkt gemiddelden van drie of meer onafhankelijke groepen (interval/ratio, normaliteit vereist).
* **Non-parametrisch:**
* **Kruskal-Wallis H-toets:** Non-parametrisch alternatief voor ANOVA, vergelijkt rangorden tussen drie of meer onafhankelijke groepen (ordinaal, of wanneer parametrische voorwaarden geschonden zijn).
#### 2.2.4 Toetsen voor het verband tussen twee variabelen
Deze toetsen onderzoeken of er een relatie bestaat tussen twee variabelen.
* **Parametrisch:**
* **Pearson correlatietoets:** Meet de lineaire samenhang tussen twee continue variabelen (interval/ratio). Vereist normaliteit van beide variabelen.
* **Toetsingsgrootheid:** De t-verdeling met $N-2$ vrijheidsgraden, waarbij $N$ het aantal paren is.
* **Effectgrootte:** De correlatiecoëfficiënt ($r$) zelf.
* **Non-parametrisch:**
* **Spearman rangcorrelatietoets:** Meet de monotone samenhang tussen twee ordinale variabelen (of wanneer parametrische voorwaarden geschonden zijn).
* **Toetsingsgrootheid:** Vaak omgezet naar een t-statistiek, met afhankelijk van de $N$ en de berekeningsmethode.
* **Effectgrootte:** De correlatiecoëfficiënt ($r$) zelf.
* **Chi-kwadraattoets voor kruistabellen:** Onderzoekt de afhankelijkheid tussen twee nominale variabelen.
* **Voorwaarden:** Nominale variabelen, wederzijds uitsluitende categorieën, verwachte frequenties ($f_e$) mogen niet te klein zijn (max. 20% met $f_e < 5$, geen enkele $f_e < 1$).
* **Toetsingsgrootheid:** Chi-kwadraat ($\chi^2$).
* **Effectgrootte:** Contingentiecoëfficiënt, phi-coëfficiënt, of **Cramér's V** (meest aangewezen). Richtlijnen voor Cramér's V: $r < 0.10$ (triviaal), $0.10 - 0.30$ (klein), $0.30 - 0.50$ (medium), $> 0.50$ (sterk).
### 2.3 Stappenplan voor het uitvoeren van een statistische toets
Ongeacht de specifieke toets, volgt men doorgaans een vast stramien:
1. **Toetsingssituatie:** Begrijp de concrete onderzoeksvraag en identificeer de relevante variabelen en hun meetniveau.
2. **Voorwaarden:** Controleer of aan de statistische voorwaarden voor de gekozen toets is voldaan. Dit is cruciaal voor de validiteit van de resultaten.
> **Tip:** Bij schending van de voorwaarden voor een parametrische toets, overweeg dan een non-parametrisch alternatief.
3. **Hypothesen:** Formuleer de nulhypothese ($H_0$) en de alternatieve hypothese ($H_1$).
4. **Toetsingsgrootheid:** Bereken de waarde van de toetsingsgrootheid op basis van de data en identificeer de bijbehorende kansverdeling.
5. **Beslissingsregel:** Verwerp of behoud de nulhypothese op basis van de overschrijdingskans (p-waarde) of door de berekende toetsingsgrootheid te vergelijken met kritieke waarden.
6. **Effectgrootte:** Bereken de effectgrootte om de praktische significantie van het gevonden effect te kwantificeren.
7. **Rapporteren:** Rapporteer de resultaten op een duidelijke en gestructureerde manier, inclusief de toets, de toetsingsgrootheid, de vrijheidsgraden (indien van toepassing), de p-waarde en de effectgrootte.
### 2.4 Voorbereiding op examens
Effectieve voorbereiding voor statistische toetsvragen omvat:
* Het begrijpen van de theoretische concepten achter elke toets.
* Het oefenen met concrete toepassingsvragen die een systematische analyse vereisen.
* Het kunnen koppelen van uitspraken aan de verschillende fasen van de empirische cyclus.
* Het correct uitleggen van concepten zoals significantie en effectgrootte.
> **Tip:** Maak gebruik van overzichtstabellen en stroomdiagrammen om de relaties tussen verschillende toetsen en hun toepassingsgebieden te visualiseren. Oefen veel met voorbeeldvragen om vertrouwd te raken met de verschillende soorten vragen die gesteld kunnen worden.
---
# Voorbereiding op het examen
Dit gedeelte bevat voorbeeldvragen en oefeningen die bedoeld zijn om studenten te helpen bij de voorbereiding op hun examen. Het omvat zowel theorievragen als toepassingsvragen over verschillende statistische concepten en toetsen.
## 3. Voorbereiding op het examen
De voorbereiding op een statistisch examen vereist een systematische aanpak, waarbij zowel theoretische kennis als de praktische toepassing van statistische toetsen centraal staan. Dit omvat het begrijpen van het stramien van toetsen, het kiezen van de juiste statistische methode op basis van de onderzoeksvraag en data, en het correct interpreteren en rapporteren van resultaten.
### 3.1 Het stramien van statistische toetsen
Elke statistische toets volgt een vast stramien, essentieel voor een correcte analyse en interpretatie:
1. **Toetsingssituatie:** Vaststellen welke gegevens in de vraag staan, wat de concrete onderzoeksvraag is, en bij welk soort onderzoek deze toets gebruikt wordt.
2. **Voorwaarden:** Nagaan welke statistische voorwaarden vervuld moeten zijn om de gekozen toets te mogen toepassen.
3. **Hypothesen:** Formuleren van de nulhypothese ($H_0$) en de alternatieve hypothese ($H_1$) die bij de toetsingssituatie passen.
4. **Toetsingsgrootheid:** Berekenen van de waarde van de toetsingsgrootheid en identificeren van de bijbehorende kansverdeling.
5. **Beslissingsregel:** Bepalen wanneer de nulhypothese verworpen wordt, hetzij via overschrijdingskansen (p-waarde) of kritieke waarden.
6. **Effectgrootte:** Berekenen van de effectgrootte om de praktische significantie van het gevonden effect te kwantificeren.
7. **Rapporteren:** Correct rapporteren van de resultaten van de statistische analyse.
### 3.2 Toetsen voor het verband tussen twee variabelen (Hoofdstuk 9)
Dit hoofdstuk behandelt toetsen om het verband tussen twee variabelen van een gelijk meetniveau na te gaan.
#### 3.2.1 Parametrische toetsen: Pearson Correlatietoets
Deze toets wordt gebruikt om het lineaire verband tussen twee interval/ratio-variabelen te onderzoeken, onder de aanname dat beide variabelen normaal verdeeld zijn in de populatie.
* **Onderzoeksvraag voorbeeld:** Bestaat er een verband tussen de slaapkwaliteit van studenten tijdens de examenperiode en de mate van rust/kalmte die studenten ervaren?
* **Toetsingsgrootheid:** De Pearson correlatiecoëfficiënt ($r$), getransformeerd naar een t-verdeling met vrijheidsgraden $df = N - 2$, waarbij $N$ het aantal paren observaties is.
$$t = r \sqrt{\frac{N-2}{1-r^2}}$$
* **Beslissingsregel:** Verwerpen van $H_0$ indien de berekende t-waarde groter is dan de kritieke waarde (bij tweezijdige toetsing) of kleiner dan de kritieke waarde (bij eenzijdige toetsing), of indien de p-waarde kleiner is dan het gekozen significantieniveau $\alpha$.
* **Effectgrootte:** De Pearson correlatiecoëfficiënt ($r$) zelf dient als maat voor de effectgrootte. Een waarde dicht bij 1 of -1 duidt op een sterk lineair verband, terwijl een waarde dicht bij 0 duidt op een zwak of afwezig lineair verband.
* **Rapportage:** Vermelding van de correlatiecoëfficiënt, de p-waarde, en de steekproefgrootte. Bijvoorbeeld: "Het verband tussen beide variabelen was significant verschillend van nul ($r=.99, p<.05, N=5$)."
#### 3.2.2 Non-parametrische toetsen
##### 3.2.2.1 Rangcorrelatie van Spearman
Deze toets wordt gebruikt om het verband tussen twee ordinaal gemeten variabelen na te gaan, of wanneer de voorwaarden voor parametrische toetsen geschonden zijn (bv. niet normaal verdeelde variabelen op interval/ratio niveau).
* **Onderzoeksvraag voorbeeld:** Wat is het verband tussen gebruik van sociale media en zelfbeeld bij jongeren, waarbij beide variabelen op een Likert-schaal zijn gemeten?
* **Voorwaarden:** Variabelen op minimaal ordinaal niveau.
* **Toetsingsgrootheid:** De Spearman rangcorrelatiecoëfficiënt ($\rho$ of $r_s$). Voor kleine steekproeven ($N \le 30$) kan deze getransformeerd worden naar een t-verdeling met $df = N - 2$.
$$r_s = 1 - \frac{6 \sum d_i^2}{N(N^2-1)}$$
waarbij $d_i$ het verschil is tussen de rangen van de observaties en $N$ het aantal paren observaties is.
De bijbehorende t-toetsgrootheid is:
$$t = r_s \sqrt{\frac{N-2}{1-r_s^2}}$$
* **Beslissingsregel:** Vergelijk de berekende t-waarde met de kritieke t-waarde uit de tabel, of vergelijk de p-waarde met $\alpha$.
* **Effectgrootte:** De Spearman rangcorrelatiecoëfficiënt ($r_s$) zelf wordt gebruikt als maat voor de effectgrootte.
* **Rapportage:** "Het verband tussen beide variabelen was significant verschillend van nul ($r_s = -,87, p<,05, N=6$)."
##### 3.2.2.2 Chikwadraat voor kruistabellen
Deze toets wordt gebruikt om het verband tussen twee nominaal gemeten variabelen na te gaan door de geobserveerde frequenties in een kruistabel te vergelijken met de verwachte frequenties onder de aanname van onafhankelijkheid.
* **Onderzoeksvraag voorbeeld:** Bestaat er een betekenisvol verband tussen politieke voorkeur en de mening over het opleggen van een milieubelasting?
* **Voorwaarden:**
* Nominale variabelen.
* Enkel frequenties (geen percentages).
* Categorieën van variabelen zijn mutueel exclusief.
* Verwachte frequenties ($f_e$) in de kruistabel mogen niet te klein zijn: maximaal 20% van de cellen mag een verwachte frequentie kleiner dan 5 hebben, en geen enkele cel mag een verwachte frequentie kleiner dan 1 hebben.
* **Berekening verwachte frequentie ($f_e$):**
$$f_e = \frac{\text{rijtotaal} \times \text{colomtotaal}}{\text{totaaltotaal}}$$
* **Toetsingsgrootheid:** De chikwadraat ($\chi^2$) toetsingsgrootheid.
$$\chi^2 = \sum \frac{(f_o - f_e)^2}{f_e}$$
waarbij $f_o$ de geobserveerde frequentie is en $f_e$ de verwachte frequentie.
* **Vrijheidsgraden:** $df = (\text{aantal rijen} - 1) \times (\text{aantal kolommen} - 1)$.
* **Beslissingsregel:** Verwerpen van $H_0$ indien de berekende $\chi^2$-waarde groter is dan de kritieke $\chi^2$-waarde of indien de p-waarde kleiner is dan $\alpha$.
* **Effectgrootte:** Diverse maten kunnen gebruikt worden, zoals de continuïteitscoëfficiënt, phi-coëfficiënt, of Cramér's V. Cramér's V wordt vaak als het meest geschikt beschouwd.
* Cramér's V:
$$V = \sqrt{\frac{\chi^2}{N(K-1)}}$$
waarbij $N$ het totaal aantal observaties is en $K$ het kleinste aantal categorieën van de twee variabelen.
* Interpretatie van Cramér's V: $<.10$ (triviaal), $.10-.30$ (klein), $.30-.50$ (medium), $>.50$ (sterk).
* **Rapportage:** "De chikwadraattoets wees uit dat beide variabelen statistisch afhankelijk zijn ($\chi^2(4)=21,86, p<,001$). Het verband bleek matig te zijn (Cramér's V = .36)."
### 3.3 Hoe kies je de juiste toets? (Hoofdstuk 11)
Het kiezen van de juiste statistische toets is cruciaal en hangt af van verschillende factoren:
* **Begrip van de onderzoeksvraag:** Wat wil de onderzoeker precies weten (verschil, verband)?
* **Onderscheid afhankelijke en onafhankelijke variabelen:** Wat beïnvloedt wat?
* **Meetniveau van de variabelen:** Nominaal, ordinaal, interval, of ratio?
* **Aantal populaties/groepen:** Wordt één populatie vergeleken, twee, of meer?
* **Afhankelijke of onafhankelijke steekproeven:** Zijn de metingen binnen dezelfde personen (afhankelijk) of binnen verschillende personen (onafhankelijk)?
* **Parametrisch of non-parametrisch:** Voldoen de data aan de aannames van parametrische toetsen (bv. normaliteit)?
* **Eenzijdig of tweezijdig toetsen:** Is er een specifieke verwachting over de richting van het effect?
#### 3.3.1 Overzicht van toetsen
Het document biedt een overzicht van verschillende toetsen, ingedeeld naar het aantal populaties en of ze parametrisch (P) of non-parametrisch (NP) zijn:
* **1 populatie:**
* P: z-toets / t-toets voor één gemiddelde
* NP: Chi-kwadraattoets voor frequenties (voor één steekproef)
* **2 (onafhankelijke) populaties:**
* P: t-toets voor twee onafhankelijke steekproeven
* NP: Wilcoxon rank-sum test
* **2 (afhankelijke) populaties:**
* P: t-toets voor twee afhankelijke steekproeven
* NP: Wilcoxon signed-rank test
* **Meer dan 2 (onafhankelijke) populaties:**
* P: One-way ANOVA (variantieanalyse)
* **Verband tussen twee variabelen:**
* P: Pearson correlatietoets (interval/ratio)
* NP: Spearman rangcorrelatie (ordinaal), Chi-kwadraattoets voor kruistabellen (nominaal)
> **Tip:** Bij twijfel over normaliteit of als de variabelen op ordinaal niveau zijn, kies dan voor een non-parametrische toets.
### 3.4 Voorbeeldvragen en oefeningen
De voorbereiding op het examen omvat het oefenen met verschillende soorten vragen:
#### 3.4.1 Theorievragen
Deze vragen testen het begrip van de basisprincipes van statistiek, zoals de empirische cyclus, significantie en effectgrootte, en de keuze tussen eenzijdige en tweezijdige toetsen.
* **Empirische cyclus:** Vragen kunnen vereisen dat uitspraken gekoppeld worden aan de verschillende fasen van de empirische cyclus (observatie, inductie, deductie, toetsing, evaluatie).
* **Significantie vs. Effectgrootte:**
* **Significantie:** Geeft aan of een gevonden resultaat waarschijnlijk niet op toeval berust (vaak via de p-waarde). Een significant resultaat betekent niet noodzakelijk een belangrijk of praktisch relevant resultaat.
* **Effectgrootte:** Kwantificeert de omvang van het effect of het verband, ongeacht de steekproefgrootte. Het geeft aan hoe belangrijk het gevonden effect is.
* Ze hangen samen in die zin dat een sterk effect bij een grote steekproef waarschijnlijk significant zal zijn, en een zwak effect bij een kleine steekproef mogelijk niet significant is.
* **Eenzijdig vs. Tweezijdig toetsen:**
* **Tweezijdig:** Wordt gebruikt wanneer er geen specifieke voorspelling is over de richting van het effect of verband. De nulhypothese wordt verworpen als het resultaat significant afwijkt in beide richtingen.
* **Eenzijdig (links- of rechts):** Wordt gebruikt wanneer er een specifieke voorspelling is over de richting van het effect of verband (bv. dat groep A hoger scoort dan groep B). Dit verhoogt de power van de toets, maar kan alleen worden toegepast bij een duidelijke theoretische onderbouwing.
#### 3.4.2 Toepassingsvragen
Deze vragen vereisen de toepassing van statistische toetsen op gegeven data of scenario's.
* **Voorbeeld 1 (Pearson correlatie):** Nagaan of er een verband bestaat tussen de steun die een leerkracht biedt en de betrokkenheid van leerlingen. Beide variabelen zijn intervalniveau en normaal verdeeld. Hierbij wordt gevraagd de juiste toets te kiezen, hypothesen te formuleren, de toetsingsgrootheid te berekenen, en de resultaten te interpreteren met effectgrootte.
* **Voorbeeld 2 (One-way ANOVA):** Onderzoeken of er een verschil is in beoordelingscijfers voor memes tussen studenten van verschillende vakken (PW1, GPW, STAT2). De data is normaal verdeeld, en er worden stappen gevraagd zoals het berekenen van de tussen- en binnen-groepsvariantie, vrijheidsgraden, Mean Sum of Squares, en de toetsingsgrootheid (F-waarde).
* **Voorbeeld 3 (Independent samples t-test):** Nagaan of er een verschil is in huidgeleiding tussen groepen die mindfulness of EMDR hebben gevolgd na blootstelling aan een trauma cue. De p-waarde en t-score worden gegeven, en de student moet H0 al dan niet verwerpen en de mogelijke fouten (Type I/II) bespreken.
* **Voorbeeld 4 (Toetskeuze en rappotering):** Een onderzoeker wil weten of slaap een invloed heeft op studieprestaties. Er worden twee testen afgenomen bij dezelfde studenten onder verschillende slaapcondities. Hier wordt gevraagd de juiste toets te kiezen (in dit geval een afhankelijke t-toets, omdat dezelfde studenten tweemaal zijn gemeten), de voorwaarden te motiveren, en de resultaten correct te rapporteren.
> **Tip:** Bij het beantwoorden van toepassingsvragen, doorloop systematisch de zeven stappen van het toetsingsstramien. Definieer duidelijk de variabelen, hun meetniveau, en de steekproefstructuur.
#### 3.4.3 Kennis- en inzichtsvragen
Deze vragen toetsen de algemene kennis en het inzicht in statistische concepten.
* **Statistische significantie:** Het gaat om de vraag of er een significant verschil is tussen groepen of een significant verband, gebaseerd op de p-waarde.
* **Type-I fout:** De kans om de nulhypothese ten onrechte te verwerpen, terwijl deze in werkelijkheid waar is. Een alpha van .05 betekent een 5% kans op een Type-I fout.
* **Effectgrootte:** Moderne statistiek vereist de vermelding van effectgrootte, zelfs bij significante resultaten, om de praktische relevantie te beoordelen. Een effectgrootte van -.7 kan inderdaad wijzen op een aanzienlijk deel van de variabiliteit in Y verklaard door X.
* **Hypotheseformulering:** In statistisch onderzoek starten we meestal vanuit de nulhypothese ($H_0$) die we proberen te verwerpen. We onderzoeken een verschil of verband, en als de data onwaarschijnlijk is onder $H_0$ (lage p-waarde), verwerpen we $H_0$ ten gunste van de alternatieve hypothese ($H_1$).
Door deze verschillende soorten vragen te oefenen, kunnen studenten hun kennis versterken en zich optimaal voorbereiden op het examen.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Pearson Correlatietoets | Een parametrische toets om de sterkte en richting van het lineaire verband tussen twee interval- of ratio-variabelen te meten. De toetsingsgrootheid volgt een t-verdeling met n-2 vrijheidsgraden. |
| Spearman Rangcorrelatietoets | Een non-parametrische toets die het monotone verband tussen twee ordinale variabelen of variabelen die als ordinaal behandeld kunnen worden, meet. De toetsingsgrootheid wordt berekend op basis van de rangordes van de waarnemingen en volgt vaak een t-verdeling. |
| Chikwadraat toets voor kruistabellen | Een non-parametrische toets die wordt gebruikt om te bepalen of er een significant verband bestaat tussen twee nominale variabelen door de geobserveerde frequenties in een kruistabel te vergelijken met de verwachte frequenties onder de nulhypothese van onafhankelijkheid. |
| Hypothese | Een stelling die wordt geformuleerd om te testen. Bij statistische toetsen maken we onderscheid tussen de nulhypothese (H0), die stelt dat er geen effect of verband is, en de alternatieve hypothese (H1), die stelt dat er wel een effect of verband is. |
| Toetsingsgrootheid | Een waarde die wordt berekend uit de steekproefgegevens en die wordt gebruikt om de nulhypothese te toetsen. De verdeling van de toetsingsgrootheid onder de nulhypothese is bekend. |
| Beslissingsregel | Een regel die bepaalt wanneer de nulhypothese wordt verworpen op basis van de waarde van de toetsingsgrootheid en een vooraf bepaalde significantieniveau (alfa). Dit kan gebeuren via overschrijdingskansen (p-waarden) of kritieke waarden. |
| Effectgrootte | Een maat die de sterkte van het waargenomen effect of verband kwantificeert, onafhankelijk van de steekproefgrootte. Het helpt de praktische significantie van de resultaten te beoordelen. |
| Parametrisch | Een klasse van statistische toetsen die aannames doet over de parameters van de populatie waaruit de steekproef is getrokken, zoals normaliteit van de verdeling. |
| Non-parametrisch | Een klasse van statistische toetsen die minder strikte aannames doet over de populatieverdeling. Deze toetsen worden vaak gebruikt wanneer de aannames voor parametrische toetsen geschonden zijn, of wanneer de variabelen op nominaal of ordinaal niveau zijn gemeten. |
| Meetniveau | De schaal waarop een variabele is gemeten. De belangrijkste meetniveaus zijn nominaal, ordinaal, interval en ratio. Het meetniveau bepaalt welke statistische analyses mogelijk zijn. |
| Variantieanalyse (ANOVA) | Een statistische techniek die wordt gebruikt om de gemiddelden van drie of meer groepen te vergelijken. Het deelt de totale variatie in de gegevens op in componenten die toe te schrijven zijn aan verschillende bronnen van variatie. |
| t-toets | Een parametrische toets die wordt gebruikt om te bepalen of er een significant verschil is tussen de gemiddelden van twee groepen (onafhankelijke t-toets) of tussen twee metingen binnen dezelfde groep (afhankelijke t-toets). |
| p-waarde (overschrijdingskans) | De kans om een toetsingsgrootheid te observeren die zo extreem is als, of extremer is dan, de geobserveerde toetsingsgrootheid, aangenomen dat de nulhypothese waar is. Een kleine p-waarde (< alfa) leidt tot verwerping van de nulhypothese. |
| Kritieke waarde | Een drempelwaarde die wordt gebruikt in de beslissingsregel van een statistische toets. Als de toetsingsgrootheid groter is dan (of kleiner dan, afhankelijk van de richting) de kritieke waarde, wordt de nulhypothese verworpen. |
| Kruistabel | Een tabel die de frequentieverdeling van twee of meer categorische variabelen weergeeft. Elke cel in de tabel toont het aantal waarnemingen dat aan een specifieke combinatie van categorieën voldoet. |
| Onafhankelijke variabelen | Variabelen die worden gemanipuleerd of gemeten om hun effect op een afhankelijke variabele te bestuderen. |
| Afhankelijke variabelen | Variabelen waarvan de waarden worden beïnvloed of verklaard door onafhankelijke variabelen. |
| Steekproeven | Een subset van een populatie die wordt gebruikt om conclusies te trekken over de gehele populatie. |
| Onafhankelijke steekproeven | Steekproeven waarbij de waarnemingen in de ene groep geen invloed hebben op de waarnemingen in de andere groep. De groepen zijn distinct. |
| Afhankelijke steekproeven | Steekproeven waarbij de waarnemingen in de ene groep gerelateerd zijn aan de waarnemingen in de andere groep, bijvoorbeeld door herhaalde metingen bij dezelfde personen. |
| Wilcoxon rank-sum test | Een non-parametrische toets die wordt gebruikt om te bepalen of er een significant verschil is tussen twee onafhankelijke groepen. Het is het non-parametrische alternatief voor de onafhankelijke t-toets. |
| Cramer's V | Een maat voor de effectgrootte bij de chikwadraattoets voor kruistabellen. Het kwantificeert de sterkte van het verband tussen twee nominale variabelen, waarbij waarden variëren van 0 (geen verband) tot 1 (perfect verband). |