Cover
Aloita nyt ilmaiseksi WPO+6+S3+2526+wilcoxon+met+uitgewerkte+voorbeelden.pptx
Summary
# Inleiding tot non-parametrische testen
Dit deel introduceert de Wilcoxon testen als alternatieven voor de t-test wanneer de voorwaarden voor de t-test niet voldaan zijn, met specifieke aandacht voor de Mann Whitney U test en de Wilcoxon rangtekentest.
### 1.1 Wilcoxon testen als alternatieven voor de t-test
Non-parametrische testen, zoals de Wilcoxon testen, bieden een uitkomst wanneer de aannames van parametrische testen, zoals de t-test, niet voldaan zijn. Dit is met name relevant bij data die niet normaal verdeeld zijn of wanneer de data nominaal of ordinaal is en niet voldoet aan de interval/ratio voorwaarden van de t-test.
### 1.2 De Mann Whitney U test (Wilcoxon rangsomtest)
#### 1.2.1 Toepassingsgebied en voorwaarden
De Mann Whitney U test (ook bekend als de Wilcoxon rangsomtest) wordt gebruikt om het verschil te toetsen tussen twee onafhankelijke (ongepaarde) groepen.
* **Voorwaarden:**
* De data moet minstens van ordinaal niveau zijn.
* Er moeten twee onafhankelijke (ongepaarde) steekproeven zijn.
* Voor een betrouwbare toetsing wordt vaak een minimale steekproefgrootte van $n_1 \ge 10$ en $n_2 \ge 10$ gehanteerd.
#### 1.2.2 Hypothesen
De nulhypothese ($H_0$) stelt dat er geen verschil is in de medianen tussen de twee groepen, terwijl de alternatieve hypothese ($H_A$) stelt dat er een verschil is.
* $H_0$: $Mdn_x - Mdn_y = 0$
* $H_A$: $Mdn_x - Mdn_y > 0$ (éénzijdige toets) of $Mdn_x - Mdn_y \ne 0$ (tweezijdige toets)
#### 1.2.3 Berekening van de toetsingsgrootheid
De berekening van de toetsingsgrootheid omvat het rangschikken van alle observaties uit beide groepen samen. Bij gelijke waarden (ex aequo's) wordt het gemiddelde van de rangen toegekend.
> **Tip:** Bij ex aequo's die zich over groepen heen voordoen, moet in principe een correctie op de standaardfout van de z-statistiek worden uitgevoerd. Softwarepakketten voeren deze correctie doorgaans automatisch uit.
#### 1.2.4 Voorbeeld van toepassing
Professor Theuns onderzoekt de motivatie van studenten. Acht studenten schrijven een opstel, waarbij vier studenten hun onderwerp mogen kiezen en vier een onderwerp toegewezen krijgen. De motivatiescores (op een schaal van 0 tot 30) worden vergeleken.
* **Gegevens:** Motivatie scores zijn ordinaal, er zijn 2 ongepaarde steekproeven (zelfgekozen vs. opgelegd onderwerp).
* **Geschikte toets:** Wilcoxon rangsomtest (Mann Whitney U test) omdat de voorwaarden (ordinaal niveau, 2 ongepaarde steekproeven) voldaan zijn en $n_1=4, n_2=4$, hoewel dit lager is dan de aanbevolen $n \ge 10$. In de context van de oefening worden de voorwaarden als ok beschouwd.
* **Hypothesen:** $H_0$: $Mdn_{zelfgekozen} - Mdn_{opgelegd} = 0$, $H_A$: $Mdn_{zelfgekozen} - Mdn_{opgelegd} > 0$.
### 1.3 De Wilcoxon rangtekentest
#### 1.3.1 Toepassingsgebied en voorwaarden
De Wilcoxon rangtekentest wordt gebruikt om het verschil te toetsen tussen twee gerelateerde (gepaarde) metingen uit één steekproef. Dit is bijvoorbeeld het geval bij metingen voor en na een interventie bij dezelfde personen.
* **Voorwaarden:**
* De data moet minstens van ordinaal niveau zijn.
* Er is sprake van één steekproef die tweemaal gemeten is (oftewel, 2 gepaarde steekproeven).
* Een voorwaarde voor de exacte toets is dat de verdeling van de verschilscores symmetrisch is rond nul. Wanneer de verschilscores niet normaal verdeeld zijn, maar wel de symmetrie aanname geldt, kan de Wilcoxon rangtekentest gebruikt worden.
* Voor de benaderende z-toets wordt een minimale steekproefgrootte van $n \ge 10$ gehanteerd. Het aantal paren met een verschilscore groter dan nul, $N^*$, wordt berekend als $N^* = n - \#\text{paren met verschilscore 0}$.
> **Tip:** Een specifieke voorwaarde die soms wordt gesteld voor de *exacte* Wilcoxon rangtekentest is dat er geen enkel interval tussen twee opeenvolgende waarden groter mag zijn dan de som van twee andere opeenvolgende intervallen. Echter, voor de benaderende z-toets met grotere steekproeven is dit minder strikt.
#### 1.3.2 Voorbeeld van toepassing
Professor Isaac onderzoekt angst bij studenten. De hartslag per minuut van zestien studenten wordt gemeten in rust en na het bekijken van een videofragment van een slang. De verschilscores zijn niet normaal verdeeld.
* **Gegevens:** Hartslagen per minuut zijn van ratio niveau, er is één steekproef tweemaal gemeten (voor en na video). De verschilscores zijn niet normaal verdeeld.
* **Geschikte toets:** Omdat de verschilscores niet normaal verdeeld zijn en de data gepaard is, is de Wilcoxon rangtekentest de meest aangewezen non-parametrische test. De gepaarde t-test is niet geschikt.
* **Voorwaarden:** $n=16$, dus $N^* = 16 - 1 = 15$ (ervan uitgaande dat één paar een verschilscore van 0 had). Aangezien $N^*=15 \ge 10$, zijn de voorwaarden voor de benaderende z-toets voldaan.
* **Hypothesen:** $H_0$: De mediane hartslag voor het videofragment = De mediane hartslag na het videofragment, $H_A$: De mediane hartslag na het videofragment > De mediane hartslag voor het videofragment.
### 1.4 Belangrijke overwegingen
Bij het gebruik van non-parametrische testen, zoals de Mann Whitney U test en de Wilcoxon rangtekentest, is het cruciaal om de specifieke voorwaarden van elke test te controleren en te begrijpen hoe verschillende softwarepakketten de resultaten rapporteren, aangezien er variaties in output kunnen voorkomen. De keuze tussen de twee hangt af van of de steekproeven gepaard of ongepaard zijn.
---
# Toepassing van de Wilcoxon rangsomtest (Mann Whitney U test)
Deze sectie illustreert de toepassing van de Wilcoxon rangsomtest, ook wel bekend als de Mann Whitney U test, op een praktisch voorbeeld met motivatiescores van studenten, waarbij de voorwaarden en hypothesen worden uiteengezet.
### 2.1 De Wilcoxon rangsomtest en de Mann Whitney U test
De Wilcoxon rangsomtest (ook Mann Whitney U test genoemd) is een niet-parametrische toets die gebruikt kan worden wanneer de voorwaarden voor de t-test niet voldaan zijn.
#### 2.1.1 Toepassingsgebied
* **Voorwaarden:**
* De data moeten van ordinaal niveau zijn.
* Er moeten twee onafhankelijke (ongepaarde) steekproeven zijn.
* **Alternatief voor de t-test:** Beide testen kunnen worden gebruikt voor data die niet voldoen aan de voorwaarden van de t-test (zoals normaliteit).
* **Software rapportage:** Verschillende softwarepakketten rapporteren deze testen op uiteenlopende manieren.
* **Steekproefgrootte:** De voorwaarden voor deze test zijn doorgaans dat de steekproefgroottes van beide groepen voldoende groot zijn, bijvoorbeeld $n_1 \ge 10$ en $n_2 \ge 10$.
#### 2.1.2 Voorbeeld: Motivatie van studenten
Een professor doet onderzoek naar de motivatie van studenten. Acht studenten worden gevraagd een opstel te schrijven. Vier studenten mogen hun onderwerp zelf kiezen (groep X) en vier studenten krijgen een onderwerp toegewezen (groep Y). Na het inleveren van het opstel worden de motivatiescores gemeten op een schaal van 0 (niet gemotiveerd) tot 30 (uitermate gemotiveerd).
**Vraag:** Zijn de motivatiescores van studenten met een zelfgekozen onderwerp significant hoger dan die van studenten met een opgelegd onderwerp, met een significantieniveau $\alpha = 5\%$?
**Stap 1: Bepalen van de meest aangewezen toets**
* **Type variabele:** Motivatie scores zijn ordinaal.
* **Aantal steekproeven:** Er zijn twee onafhankelijke steekproeven (zelfgekozen onderwerp vs. opgelegd onderwerp).
* **Conclusie:** De Wilcoxon rangsomtest (Mann Whitney U test) is de meest geschikte toets.
* **Voorwaarden:** Aangenomen dat de voorwaarden, zoals $n_1 \ge 10$ en $n_2 \ge 10$, voldaan zijn voor de opgave.
**Stap 2: Opstellen van de hypothesen**
De nulhypothese ($H_0$) stelt dat er geen verschil is tussen de medianen van de twee groepen, terwijl de alternatieve hypothese ($H_A$) stelt dat de mediaan van groep X significant hoger is dan die van groep Y.
* $H_0$: $Mdn_X - Mdn_Y = 0$
* $H_A$: $Mdn_X - Mdn_Y > 0$
**Stap 3: Berekenen van de toetsingsgrootheid**
Dit omvat het rangschikken van alle observaties gezamenlijk en vervolgens het berekenen van de som van de rangen voor elke groep. Er zijn verschillende methoden om de toetsingsgrootheid te berekenen, waarbij softwarepakketten dit vaak automatiseren.
* **Omgang met ex aequo's (gelijke waarden):** Bij gelijke waarden worden de gemiddelde rangen voor deze waarden toegekend. Indien er ex aequo's optreden tussen de groepen, zou dit in principe een correctie op de standaardfout van de z-statistiek vereisen, maar dit wordt bij handmatige uitwerking vaak weggelaten.
> **Tip:** Bij de handmatige berekening is het essentieel om nauwkeurig de rangen toe te kennen en de som van de rangen voor elke groep correct te bepalen.
### 2.2 Vergelijking met andere Wilcoxon testen
De tekst noemt ook de **Wilcoxon tekentest** (ook wel rangtekentest genoemd) als een gerelateerde, maar distincte, niet-parametrische toets.
#### 2.2.1 De Wilcoxon tekentest
* **Voorwaarden:**
* De data moeten van ordinaal niveau zijn.
* Er is één steekproef die tweemaal gemeten wordt (gepaarde steekproeven). Dit is van toepassing bij situaties zoals een "voor en na" meting.
* Een specifieke voorwaarde met betrekking tot intervallen: geen enkel interval tussen twee opeenvolgende waarden mag groter zijn dan de som van twee andere opeenvolgende intervallen. Bijvoorbeeld, een reeks met waarden 1, 2, 3, 5 is oké, maar 1, 2, 3, 6 is dat niet, omdat de som van de intervallen $(2-1) + (3-2) = 2$ niet gelijk is aan $(6-3) = 3$.
* De steekproefgrootte moet voldoende zijn, doorgaans $n \ge 10$.
* **Toepassing:** De tekentest wordt gebruikt wanneer de verschilscores van gepaarde metingen niet normaal verdeeld zijn en men een niet-parametrisch alternatief zoekt voor de gepaarde t-test.
#### 2.2.2 Oefening met de Wilcoxon tekentest (Professor Isaac)
Een voorbeeld betreft het meten van de hartslag van studenten voor en na het bekijken van een videofragment met een slang. De verschilscores zijn niet normaal verdeeld. Met 16 studenten, en één paar met een verschilscore van 0, wordt de effective steekproefgrootte $n^* = 16 - 1 = 15$. Aangezien $n^* \ge 10$, is de Wilcoxon tekentest geschikt. Dit illustreert hoe de tekentest wordt toegepast op gepaarde data wanneer aan de voorwaarden voldaan is.
---
# Wilcoxon rangtekentest bij gepaarde steekproeven
De Wilcoxon rangtekentest bij gepaarde steekproeven is een non-parametrische toets die wordt gebruikt om te onderzoeken of er een significant verschil is tussen twee gerelateerde metingen, vaak uitgevoerd op dezelfde proefpersonen onder verschillende omstandigheden of op verschillende tijdstippen. Deze test is met name geschikt wanneer de verschilscores niet normaal verdeeld zijn, wat een voorwaarde is voor de gepaarde t-toets.
### 3.1 Toepassingsgebied en voorwaarden
De Wilcoxon rangtekentest voor gepaarde steekproeven wordt toegepast in de volgende situaties:
* **Niveau van meting:** De data moeten op ten minste ordinaal niveau gemeten zijn.
* **Steekproefstructuur:** Er is sprake van één steekproef die tweemaal is gemeten (oftewel, twee gepaarde steekproeven). Dit betekent dat de metingen van de ene groep direct gekoppeld zijn aan de metingen van de andere groep (bijvoorbeeld metingen bij dezelfde persoon voor en na een interventie).
* **Distributie van verschilscores:** De verschilscores tussen de gepaarde metingen mogen niet normaal verdeeld zijn.
* **Steekproefgrootte:** De effectieve steekproefgrootte ($n^*$) moet minimaal 10 zijn. De effectieve steekproefgrootte wordt berekend als de totale steekproefgrootte min het aantal paren met een verschilscore van nul.
> **Tip:** Deze test is een uitstekend alternatief voor de gepaarde t-toets wanneer de aanname van normaliteit van de verschilscores geschonden wordt.
Het document noemt ook een specifieke voorwaarde met betrekking tot de intervallen tussen opeenvolgende waarden op de ordinale schaal, maar dit lijkt meer gerelateerd aan de rangsomtest dan aan de rangtekentest zelf, en de nadruk ligt op de gepaarde metingen.
### 3.2 Hypothesen
Voor de Wilcoxon rangtekentest bij gepaarde steekproeven worden de volgende hypothesen opgesteld:
* **Nulhypothese ($H_0$):** Er is geen verschil tussen de medianen van de twee gerelateerde metingen. Dit kan formeel worden uitgedrukt als:
$H_0: \text{Mdn}_{\text{verschil}} = 0$
of, equivalent:
$H_0: \text{Mdn}_X = \text{Mdn}_Y$
waarbij $X$ en $Y$ de twee metingen van de gepaarde steekproef representeren.
* **Alternatieve hypothese ($H_A$):** Er is een verschil tussen de medianen van de twee gerelateerde metingen. Afhankelijk van de onderzoeksvraag kan dit een eenzijdige of tweezijdige hypothese zijn:
* Eenzijdig (groter): $H_A: \text{Mdn}_{\text{verschil}} > 0$ (oftewel, $\text{Mdn}_X > \text{Mdn}_Y$)
* Eenzijdig (kleiner): $H_A: \text{Mdn}_{\text{verschil}} < 0$ (oftewel, $\text{Mdn}_X < \text{Mdn}_Y$)
* Tweezijdig: $H_A: \text{Mdn}_{\text{verschil}} \neq 0$ (oftewel, $\text{Mdn}_X \neq \text{Mdn}_Y$)
### 3.3 Berekening van de toetsingsgrootheid
De berekening van de toetsingsgrootheid in de Wilcoxon rangtekentest bij gepaarde steekproeven omvat de volgende stappen:
1. **Bereken de verschilscores:** Voor elk paar metingen wordt het verschil berekend: $d_i = X_i - Y_i$.
2. **Negeer paren met een verschilscore van nul:** Deze paren dragen niet bij aan de analyse.
3. **Rangschik de absolute waarden van de verschilscores:** Rangschik de absolute waarden van de niet-nul verschilscores van klein naar groot.
4. **Ken rangen toe:**
* Geef de kleinste absolute verschilscore de rang 1, de volgende de rang 2, enzovoort.
* **Behandeling van ex aequo's (gelijke waarden):** Indien er gelijke absolute verschilscores zijn, krijgen deze de gemiddelde rang toegekend die ze zouden hebben ingenomen als ze net van elkaar verschilden. Bijvoorbeeld, als de derde en vierde kleinste absolute verschillen gelijk zijn, krijgen ze beide de rang $(3+4)/2 = 3.5$.
5. **Bepaal de som van de positieve rangen en de som van de negatieve rangen:**
* Ken de oorspronkelijke tekens (positief of negatief) toe aan de rangen die overeenkomen met de verschilscores.
* Bereken de som van de rangen met positieve verschilscores ($W^+$).
* Bereken de som van de rangen met negatieve verschilscores ($W^-$).
6. **Bepaal de toetsingsgrootheid:** De toetsingsgrootheid is meestal de kleinste van de twee sommen van rangen, $W = \min(W^+, W^-)$. Echter, in sommige softwarepakketten wordt de som van de positieve rangen ($W^+$) als toetsingsgrootheid gebruikt, waarbij de alternatieve hypothese dan aangepast wordt op basis van de richting van het verwachte verschil.
> **Tip:** De som van alle rangen ($n^*(n^*+1)/2$) moet gelijk zijn aan de som van de positieve en negatieve rangen ($W^+ + W^-$). Dit is een goede controle op de berekeningen.
**Behandeling van ex aequo's tussen groepen:** Het document vermeldt dat bij ex aequo's tussen groepen (in de context van de rangsomtest, maar principieel ook relevant voor de rangtekentest bij de toekenning van rangen aan verschillen) een correctie op de standaardfout van de z-statistiek nodig is. Dit wordt echter doorgaans door statistische software uitgevoerd en niet handmatig.
### 3.4 Voorbeeld: Hartslag bij angst
Professor Isaac onderzoekt angst. Zestien studenten nemen deel. De hartslag per minuut wordt gemeten in rust en opnieuw na het bekijken van een videofragment van een aanvallende slang. De verschilscores zijn niet normaal verdeeld. De vraag is of de hartslag na het videofragment significant hoger is dan ervoor, met een significantieniveau $\alpha = 5\%$.
* **Data:** Gepaarde metingen (hartslag voor en na video).
* **Aantal studenten:** $n=16$.
* **Voorwaarde verschilscores niet normaal:** Voldoen we aan.
* **Gepaarde t-test:** Niet geschikt vanwege niet-normaal verdeelde verschilscores en een steekproefgrootte ($n=16 < 30$).
* **Geschikte toets:** Wilcoxon rangtekentest bij gepaarde steekproeven.
* **Effectieve steekproefgrootte ($n^*$):** Als één student een verschilscore van 0 had, dan zou $n^* = 16 - 1 = 15$. De voorwaarde $n^* \geq 10$ is voldaan.
**Hypothesen:**
* $H_0: \text{Mdn}_{\text{verschil}} = 0$ (hartslag na = hartslag voor)
* $H_A: \text{Mdn}_{\text{verschil}} > 0$ (hartslag na > hartslag voor)
De verdere uitwerking zou de berekening van de verschilscores, rangschikking, toekenning van rangen en de sommatie van de rangen omvatten om de toetsingsgrootheid te bepalen en deze te vergelijken met een kritische waarde uit de Wilcoxon-tabel of een z-waarde uit de normale verdeling voor grote steekproeven.
---
# Verschil tussen examenprestaties
Dit onderdeel onderzoekt of er een significant verschil bestaat in examenprestaties tussen dezelfde studenten op twee verschillende vakken, waarbij de normaliteitsvoorwaarden voor t-testen niet voldaan zijn.
### 4.1 Situatiebeschrijving en probleemstelling
Oefening 4 behandelt een situatie waarin de examenprestaties van dezelfde studenten op twee verschillende vakken, Statistiek (X) en Algemene Psychologie (Y), met elkaar worden vergeleken. De kernvraag is of er een significant verschil bestaat tussen deze twee prestatieniveaus. Er wordt expliciet gesteld dat de verschillen tussen de scores niet normaal verdeeld zijn, wat betekent dat een parametrische toets zoals de gepaarde t-test niet de meest geschikte methode is. In plaats daarvan wordt er gekeken naar een non-parametrische alternatieve toets.
### 4.2 Keuze van de toets
Gezien de voorwaarden:
* De metingen komen van dezelfde studenten (dus gepaarde/afhankelijke steekproeven).
* De verschilscores voldoen niet aan de normaliteitsvoorwaarde.
Is de **Wilcoxon rangtekentest** de meest aangewezen non-parametrische toets. Deze test is geschikt voor het vergelijken van twee afhankelijke metingen wanneer de verschillen niet normaal verdeeld zijn, mits de data minimaal van ordinaal niveau zijn.
### 4.3 Hypothesen formuleren
Voor de Wilcoxon rangtekentest worden de hypothesen geformuleerd rond de mediaan van de verschilscores.
* **Nulhypothese ($H_0$)**: Er is geen verschil in de mediaan van de scores tussen de twee vakken. Dit kan geformuleerd worden als $Mdn_X - Mdn_Y = 0$ of $Mdn_{verschil} = 0$.
* **Alternatieve hypothese ($H_A$)**: Er is wel een verschil in de mediaan van de scores tussen de twee vakken. Dit kan zowel een tweezijdige hypothese zijn ($Mdn_X \neq Mdn_Y$ of $Mdn_{verschil} \neq 0$) als een eenzijdige hypothese, afhankelijk van de specifieke onderzoeksvraag. In dit specifieke geval wordt gevraagd om na te gaan *of er een significant verschil is*, wat impliceert dat de alternatieve hypothese tweezijdig is.
Voor dit voorbeeld, met een significantieniveau ($\alpha$) van 1% (0.01):
* $H_0$: $Mdn_X - Mdn_Y = 0$
* $H_A$: $Mdn_X - Mdn_Y \neq 0$
### 4.4 Toetsingsgrootheid berekenen
De Wilcoxon rangtekentest werkt door de absolute verschillen tussen de gepaarde scores te rangschikken. Vervolgens worden de rangen van de positieve en negatieve verschillen apart gesommeerd. De toetsingsgrootheid is doorgaans de kleinste van deze twee sommen (W).
**Stappen voor berekening (handmatig):**
1. **Bereken de verschilscores**: Voor elk paar scores ($X_i, Y_i$), bereken het verschil $D_i = X_i - Y_i$.
2. **Negeer nulverschillen**: Studenten met een verschilscore van 0 worden uit de analyse verwijderd. Het aantal resterende paren is $N^*$.
3. **Rangschik absolute verschillen**: Neem de absolute waarden van de niet-nul verschilscores ($|D_i|$). Rangschik deze van klein naar groot.
4. **Wijs rangen toe**: Geef aan elke $|D_i|$ de rang die overeenkomt met zijn positie in de gesorteerde lijst.
* **Ex aequo's (gelijke waarden)**: Bij gelijke absolute verschillen wordt het gemiddelde van de betrokken rangen toegekend aan alle gelijke waarden.
5. **Scheid rangen**: Wijs de oorspronkelijke rangen toe aan de positieve en negatieve verschilscores.
* Som van de rangen van de positieve verschillen ($W^+$).
* Som van de rangen van de negatieve verschillen ($W^-$).
6. **Bepaal de toetsingsgrootheid (W)**: De toetsingsgrootheid $W$ is de kleinste van $W^+$ en $W^-$.
**Tip:** Softwarepakketten voeren deze berekening efficiënt uit. Bij handmatige berekeningen is het cruciaal om zorgvuldig te werk te gaan, vooral bij ex aequo's.
### 4.5 Beslissingsregel en conclusie
De berekende toetsingsgrootheid $W$ wordt vergeleken met een kritische waarde uit de Wilcoxon-tabel, of er wordt een p-waarde berekend.
* **Kritische waarde methode**: Als $W$ kleiner is dan of gelijk is aan de kritische waarde voor de gegeven $N^*$ en $\alpha$, wordt de nulhypothese verworpen.
* **P-waarde methode**: Als de p-waarde kleiner is dan $\alpha$ (in dit geval 0.01), wordt de nulhypothese verworpen.
**Conclusie:**
Als $H_0$ wordt verworpen, concludeert men dat er een statistisch significant verschil is in examenprestaties tussen de twee vakken op het gekozen significantieniveau. De richting van het verschil kan worden afgeleid uit de gemiddelde rangen van de positieve en negatieve verschillen. Indien $H_0$ niet verworpen wordt, is er onvoldoende bewijs om te concluderen dat er een significant verschil bestaat.
### 4.6 Voorwaarden voor de Wilcoxon rangtekentest
* **Afhankelijke steekproeven**: De metingen moeten van dezelfde eenheden komen (bv. dezelfde studenten, dezelfde patiënten).
* **Ordinaal niveau of hoger**: De data moeten minstens ordinaal meetbaar zijn.
* **Verschilscores niet normaal verdeeld**: Dit is de reden waarom de Wilcoxon test verkozen wordt boven de gepaarde t-test.
* **Steekproefgrootte**: Hoewel de test theoretisch op kleine steekproeven kan worden toegepast, wordt een minimale steekproefgrootte van $N^* \ge 10$ vaak als wenselijk beschouwd voor betrouwbare resultaten, vooral bij het gebruik van z-approximaties voor grotere steekproeven. Voor de normale benadering geldt $N^* \ge 20$.
**Tip:** Controleer altijd of de data minimaal ordinaal zijn en of de metingen werkelijk gepaard zijn. De afwezigheid van normaliteit in de verschilscores is een sleutelcriterium.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Univariate data-analyse | Een statistische analyse die zich richt op één variabele tegelijk om de kenmerken ervan te beschrijven en te samenvatten. |
| Rangsomtest | Een non-parametrische statistische test die gebruikt wordt om de verschillen tussen twee onafhankelijke groepen te vergelijken door de rangordes van de data te analyseren. |
| Mann Whitney U test | Een non-parametrische toets die gelijkwaardig is aan de Wilcoxon rangsomtest en gebruikt wordt om te bepalen of twee onafhankelijke groepen significant van elkaar verschillen op een ordinale variabele. |
| Wilcoxon rangtekentest | Een non-parametrische toets voor gepaarde metingen, gebruikt om te beoordelen of er een significant verschil is tussen twee gerelateerde metingen van dezelfde proefpersoon of een gematcht paar. |
| Ordinaal niveau | Een meetniveau waarbij de data geordend kan worden, maar de afstanden tussen de waarden niet noodzakelijk gelijk zijn. |
| Steekproef | Een representatief deel van een populatie dat wordt geselecteerd voor onderzoek, om conclusies te kunnen trekken over de gehele populatie. |
| Gepaarde steekproeven | Twee sets metingen die aan elkaar gerelateerd zijn, meestal afkomstig van dezelfde proefpersonen onder verschillende omstandigheden of op verschillende tijdstippen. |
| Ongepaarde steekproeven | Twee sets metingen die onafhankelijk van elkaar zijn, afkomstig van verschillende groepen proefpersonen. |
| T-test | Een parametrische statistische test die gebruikt wordt om het verschil tussen de gemiddelden van twee groepen te vergelijken, ervan uitgaande dat de data normaal verdeeld zijn. |
| Motivatie | De drijfveer of redenen die leiden tot bepaald gedrag, in dit geval de mate van gemotiveerdheid van studenten. |
| Motivatie score | Een numerieke waarde die de mate van motivatie weergeeft, gemeten op een specifieke schaal. |
| Hypothese | Een voorlopige aanname of stelling die getoetst moet worden met statistische methoden. |
| H0 (Nulhypothese) | De hypothese die stelt dat er geen significant verschil of verband is tussen de populatieparameters. |
| HA (Alternatieve hypothese) | De hypothese die stelt dat er wel een significant verschil of verband is, en die geaccepteerd wordt als de nulhypothese verworpen wordt. |
| Mdn (Mediaan) | De middelste waarde in een geordende dataset; de waarde die de dataset in twee gelijke helften verdeelt. |
| Toetsingsgrootheid | Een waarde berekend uit steekproefgegevens die gebruikt wordt om een statistische toets uit te voeren en een beslissing te nemen over de nulhypothese. |
| Ex aequo | Betekent gelijke rangen in de data, wat voorkomt wanneer meerdere waarnemingen dezelfde waarde hebben. |
| Standaardfout | Een maat voor de spreiding van steekproefstatistieken rond de populatieparameter; een indicator van de precisie van een schatting. |
| Woo(n)st | Een term die wordt gebruikt om de woonomgeving of het huis aan te duiden. |
| Properheid | De mate van netheid en hygiëne van een woonomgeving. |
| Hartslag per minuut | Het aantal keer dat het hart klopt binnen een periode van zestig seconden. |
| Verschilscore | Het resultaat van het aftrekken van de ene meting van een andere, vaak gebruikt bij gepaarde metingen om de verandering te kwantificeren. |
| Ratio meetniveau | Het hoogste meetniveau, waarbij de data geordend kunnen worden, de afstanden gelijk zijn en er een absoluut nulpunt bestaat, waardoor verhoudingen betekenisvol zijn. |