Cover
Jetzt kostenlos starten WPO+4+S3+2526.pptx
Summary
# Introductie tot univariate data-analyse en steekproeftypes
Dit gedeelte introduceert de basisprincipes van univariate data-analyse en maakt onderscheid tussen ongepaarde en gepaarde steekproeven met psychologische voorbeelden.
### 1.1 Basisprincipes van univariate data-analyse
Univariate data-analyse richt zich op het analyseren van één variabele tegelijk. De centrale vraag is vaak of er een significant verschil is tussen groepen op basis van deze ene variabele.
### 1.2 Soorten steekproeven
Bij het analyseren van data is het cruciaal om het type steekproef te herkennen, aangezien dit de keuze van de statistische toets beïnvloedt. Er wordt een onderscheid gemaakt tussen twee hoofdtypes: ongepaarde en gepaarde steekproeven.
#### 1.2.1 Ongepaarde steekproeven
Ongepaarde steekproeven, ook wel niet-gepaarde, niet-gekoppelde of onafhankelijke steekproeven genoemd, komen voort uit een *between subjects design*. Dit betekent dat de metingen worden gedaan bij verschillende, onafhankelijke groepen subjecten.
* **Kenmerk:** De subjecten in de ene groep zijn op geen enkele wijze gerelateerd aan de subjecten in de andere groep.
* **Voorbeeld uit de psychologie:** Sara onderzoekt of mannen gemiddeld meer kinderen willen dan vrouwen. Ze vraagt aan 10 mannen en 10 vrouwen, die willekeurig zijn aangesproken op verschillende openbare plaatsen, hoeveel kinderen ze graag zouden willen. De mannen en vrouwen vormen twee onafhankelijke groepen.
#### 1.2.2 Gepaarde steekproeven
Gepaarde steekproeven, ook wel gekoppelde, gekoppelde of afhankelijke steekproeven genoemd, komen voort uit een *within subjects design* of een design waarbij paren van subjecten worden gevormd. Dit betekent dat de metingen worden gedaan bij dezelfde subjecten (herhaaldelijk) of bij subjecten die op een specifieke manier aan elkaar gekoppeld zijn.
* **Kenmerk:** Er is een direct verband of afhankelijkheid tussen de metingen binnen een paar of tussen herhaalde metingen bij dezelfde persoon.
* **Voorbeeld uit de psychologie:** Bart onderzoekt het effect van hypnose op het kortetermijngeheugen (KTG). Hij laat een groep mensen woorden opzeggen onder hypnose en vergelijkt dit met een controlegroep die dezelfde taak uitvoert zonder hypnose. Hierbij worden twee onafhankelijke groepen vergeleken, wat in dit specifieke voorbeeld van Bart een ongepaarde steekproef betreft (twee aparte groepen). Een beter voorbeeld van een *gepaarde steekproef* binnen de psychologie zou zijn: "Leerlingen sneller na het nemen van EPO?". Hierbij worden twee metingen gedaan bij dezelfde groep leerlingen: één meting vóór de EPO-toediening en één meting ná de EPO-toediening. De metingen vóór en ná EPO zijn gekoppeld aan dezelfde leerling. Een ander voorbeeld is wanneer men het effect van een bepaalde therapie onderzoekt. De scores vóór de therapie en de scores ná de therapie van dezelfde patiënten worden dan vergeleken.
### 1.3 De ongepaarde t-toets
De ongepaarde t-toets is een statistische toets die wordt gebruikt om te bepalen of er een significant verschil is in gemiddelden tussen twee onafhankelijke groepen.
* **Toetsstatistiek:** De toetsstatistiek van de ongepaarde t-toets is een verschilstatistiek, die het verschil tussen de groepsgemiddelden relateert aan de spreiding binnen de groepen.
* **Varianties:** In de praktijk worden twee soorten 2-steekproeven t-toetsen gebruikt, afhankelijk van de spreiding (varianties) in de groepen:
* **Gelijke varianties:** Wanneer de varianties in de twee populaties als gelijk worden beschouwd, wordt een *gepoolde standaardafwijking* gebruikt. Dit is een gewogen gemiddelde van de steekproefvarianties.
* **Ongelijke varianties:** Wanneer de varianties in de twee populaties als ongelijk worden beschouwd, wordt de ongepoolde steekproefstandaardafwijking gebruikt. Dit wordt ook wel de conservatievere optie genoemd, omdat deze robuuster is bij ongelijke varianties.
* **Controle van gelijke varianties:** De controle op gelijke varianties kan doorgaans enkel via statistische software worden uitgevoerd, bijvoorbeeld met een Levene's test. Handmatig is dit complex.
* **Voorwaarden (ongepaarde t-toets):**
* De populaties waaruit de steekproeven zijn getrokken, zijn normaal verdeeld.
* De varianties in de twee populaties zijn gelijk (voor de ongepoolde variant) of ongelijk (voor de ongepoolde variant, de conservatievere keuze).
* De metingen zijn onafhankelijk van elkaar.
* De steekproefgrootte is voldoende groot ($n \geq 30$ per groep), of de verdeling van de verschilscores is normaal verdeeld (dit geldt strikt genomen voor de gepaarde t-toets, maar wordt soms als vuistregel genoemd).
> **Tip:** Bij twijfel over de varianties of als software niet beschikbaar is, kies je bij voorkeur voor de t-toets die de ongepoolde steekproefstandaardafwijking gebruikt. Dit is de meer conservatieve en robuustere aanpak.
#### 1.3.1 Voorbeeld oefening 1: Kinderwens
Sara vroeg zich af of mannen meer kinderen willen dan vrouwen. Ze verzamelde data van 10 mannen en 10 vrouwen. De vraag is of het gemiddeld aantal gewenste kinderen significant verschilt tussen mannen en vrouwen, met een significantieniveau $\alpha = 5\%$. Er wordt aangenomen dat de voorwaarden voor de betreffende toets voldaan zijn. Aangezien de mannen en vrouwen willekeurig zijn geselecteerd en uit verschillende groepen komen, betreft dit een ongepaarde steekproef.
#### 1.3.2 Voorbeeld oefening 2: Kortetermijngeheugen en hypnose
Bart onderzoekt het effect van hypnose op het kortetermijngeheugen (KTG). Een groep mensen wordt onder hypnose getest en vergeleken met een controlegroep die niet onder hypnose is. De vraag is of mensen onder hypnose significant meer woorden kunnen onthouden dan mensen zonder hypnose, met $\alpha = 5\%$. Er wordt aangenomen dat de data uit normaal verdeelde populaties komen. De twee groepen (hypnose en controle) zijn onafhankelijk, dus dit is een ongepaarde steekproef.
#### 1.3.3 Voorbeeld oefening 3: Aandacht en slaaptekort
Een studie onderzoekt of slaaptekort de aandacht van volwassenen vermindert. Twee willekeurige steekproeven van 30 volwassenen nemen een aandachtstest af. De ene groep (testgroep) krijgt 4 uur slaap, de andere groep (controlegroep) krijgt 8 uur slaap. De resultaten worden vergeleken. De twee groepen zijn onafhankelijk, wat wijst op een ongepaarde steekproef.
### 1.4 Gepaarde t-toets versus ongepaarde t-toets
De keuze tussen een gepaarde en een ongepaarde t-toets hangt af van het onderzoeksdesign en de aard van de verzamelde data.
* **Gepaarde t-toets:**
* Wordt gebruikt wanneer de metingen gekoppeld zijn, bijvoorbeeld herhaalde metingen bij dezelfde personen (pre-test/post-test design) of metingen bij gematchte paren.
* **Voorwaarden:** De verschilscores tussen de gepaarde metingen zijn normaal verdeeld, of de steekproefgrootte is voldoende groot ($n \geq 30$). De variantie van de populatie van verschilscores is onbekend.
* **Ongepaarde t-toets:**
* Wordt gebruikt wanneer de metingen onafhankelijk zijn tussen twee groepen.
* **Voorwaarden:** De populaties waaruit de steekproeven zijn getrokken zijn normaal verdeeld. De varianties in de populaties kunnen gelijk of ongelijk zijn, met bijbehorende varianten van de toets.
> **Tip:** Een gepaarde t-toets is krachtiger (heeft meer power) dan een ongepaarde t-toets wanneer de data daadwerkelijk gepaard zijn, omdat het de variantie die door individuele verschillen tussen subjecten wordt veroorzaakt, elimineert. Gebruik het gepaarde design alleen wanneer het gepast is voor de onderzoeksvraag en het design.
---
# De ongepaarde t-toets: formulering en toepassing
Dit topic introduceert de ongepaarde t-toets, een statistische methode om de gemiddelden van twee onafhankelijke groepen te vergelijken, inclusief de formulering van de toetsstatistiek en de toepassing ervan in diverse praktijkscenario's, met speciale aandacht voor variantiehomogeniteit.
### 2.1 Algemene concepten en toetsstatistiek
De ongepaarde t-toets wordt gebruikt wanneer men de gemiddelden van twee populaties wil vergelijken, die gesampled zijn uit twee onafhankelijke groepen. Dit is typisch voor een "between-subjects" design, waarbij verschillende individuen aan verschillende condities worden blootgesteld of tot verschillende categorieën behoren. Een voorbeeld hiervan is de vraag of mannen sneller lopen dan vrouwen, waarbij mannen en vrouwen onafhankelijke groepen zijn.
De toetsstatistiek van de ongepaarde t-toets is een verschilstatistiek die het verschil tussen de steekproefgemiddelden relateert aan de spreiding binnen de groepen.
#### 2.1.1 De ongepaarde t-toets statistiek
Wanneer er twee normaal verdeelde populaties met verschillende varianties worden vergeleken, maakt men gebruik van de ongepaarde t-toets.
De kern van de toetsstatistiek is het verschil tussen de steekproefgemiddelden:
$$ T = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} $$
Waarbij:
* $\bar{X}_1$ en $\bar{X}_2$ de gemiddelden van de twee steekproeven zijn.
* $s_1^2$ en $s_2^2$ de varianties van de twee steekproeven zijn.
* $n_1$ en $n_2$ de groottes van de twee steekproeven zijn.
#### 2.1.2 Schatters voor standaardafwijking en variantiehomogeniteit
Bij de ongepaarde t-toets is de schatting van de standaardafwijking cruciaal. Er zijn twee belangrijke benaderingen, afhankelijk van de aanname over de varianties in de populaties:
1. **Gepoolde variantie (aanname van gelijke varianties):** Als men aanneemt dat de varianties in beide populaties gelijk zijn (${\sigma_1^2 = \sigma_2^2}$), kan een gepoolde variantieschatting worden gebruikt. Deze schatting is een gewogen gemiddelde van de steekproefvarianties. Bij het gebruik van de gepoolde variantie verliest men twee vrijheidsgraden. De t-toetsstatistiek met gepoolde variantie wordt gegeven door:
$$ T = \frac{\bar{X}_1 - \bar{X}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} $$
Waarbij de gepoolde variantie $s_p^2$ als volgt wordt berekend:
$$ s_p^2 = \frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2} $$
Het aantal vrijheidsgraden voor deze toets is $df = n_1 + n_2 - 2$.
2. **Ongepoolde variantie (geen aanname van gelijke varianties):** Als er geen aanname wordt gedaan over gelijke varianties, gebruikt men de ongepoolde variantieschatting, wat overeenkomt met de algemene formule voor $T$ zoals hierboven weergegeven. Dit is de meest conservatieve aanpak wanneer er twijfel is over variantiehomogeniteit. Het aantal vrijheidsgraden wordt hierbij benaderd met de Welch-Satterthwaite vergelijking, wat resulteert in een niet-geheel getal aan vrijheidsgraden.
> **Tip:** In de praktijk is het controleren van gelijke varianties vaak lastig en wordt het aangeraden om, zeker bij twijfel, de t-toets te gebruiken die de ongepoolde standaardafwijking hanteert. Dit is de meer conservatieve en robuustere methode. Softwarepakketten kunnen variantiehomogeniteit testen, bijvoorbeeld met een Levene's test.
### 2.2 Toepassingen en voorbeelden
De ongepaarde t-toets is een veelgebruikte methode in diverse onderzoeksgebieden.
#### 2.2.1 Oefening 1: Kinderwens bij mannen en vrouwen
**Context:** Sara onderzoekt of mannen meer kinderen willen dan vrouwen. Ze verzamelt data van 10 mannen en 10 vrouwen.
**Vraag:** Willen mannen gemiddeld significant meer kinderen dan vrouwen, bij een significantieniveau ${\alpha = 5\%}$?
**Assumpties:** De voorwaarden voor de toets zijn voldaan.
**Aanpak:** Dit scenario vereist een ongepaarde t-toets, omdat de groepen (mannen en vrouwen) onafhankelijk zijn en er geen paren gevormd worden. Men zou de toets uitvoeren met de verkregen steekproefgemiddelden en -varianties, en de p-waarde vergelijken met ${\alpha = 5\%}$.
#### 2.2.2 Oefening 2: Hypnose en kortetermijngeheugen
**Context:** Bart onderzoekt het effect van hypnose op het kortetermijngeheugen (KTG). Hij laat een groep mensen onder hypnose 12 woorden onthouden, en een controlegroep dezelfde taak zonder hypnose.
**Vraag:** Onthouden mensen onder hypnose gemiddeld significant meer woorden dan mensen zonder hypnose, bij ${\alpha = 5\%}$?
**Assumpties:** De data komen uit normaal verdeelde populaties.
**Aanpak:** Dit is een klassiek voorbeeld voor een ongepaarde t-toets. De twee groepen (hypnose vs. controle) zijn onafhankelijk. De toetsstatistiek wordt berekend op basis van de gemiddelde aantallen correct opgesomde woorden en hun spreiding in beide groepen. De conclusie wordt getrokken op basis van de overschrijdingskans (p-waarde).
#### 2.2.3 Oefening 3: Slaaptekort en aandacht
**Context:** Een studie onderzoekt of slaaptekort de aandacht van volwassenen vermindert. Twee groepen van 30 volwassenen (elk) nemen een aandachtstest (CPT). De ene groep krijgt slaapdeprivatie (4 uur slaap), de andere krijgt voldoende slaap (8 uur). In de controlegroep haalden slechts 26 personen de 8 uur slaap voor een geldige meting.
**Vraag:** Vermindert slaaptekort de aandacht van volwassenen significant?
**Aanpak:** Hier wordt een ongepaarde t-toets gebruikt om de gemiddelde scores op de CPT te vergelijken tussen de slaapgedepriveerde groep en de controlegroep. De groepen zijn onafhankelijk. De steekproefgroottes zijn $n_1 = 30$ (testgroep) en $n_2 = 26$ (controlegroep), waarbij de effectieve grootte van de controlegroep wordt gebruikt. Men zou de toetsstatistiek berekenen en de p-waarde interpreteren in relatie tot het gekozen significantieniveau ${\alpha}$.
### 2.3 Vergelijking met de gepaarde t-toets
De ongepaarde t-toets is te onderscheiden van de gepaarde t-toets. De gepaarde t-toets wordt gebruikt voor "within-subjects" designs, waarbij metingen herhaald worden bij dezelfde individuen of bij sterk gekoppelde paren.
**Voorwaarden voor de gepaarde t-toets:**
* De populatie van verschilscores is normaal verdeeld, of de steekproefgrootte is voldoende groot ($n \ge 30$).
* De standaarddeviatie van de populatie ($\sigma$) is onbekend (net als bij de ongepaarde t-toets).
**Voorwaarden voor de ongepaarde t-toets:**
* De twee populaties zijn normaal verdeeld.
* De varianties in de twee populaties zijn onbekend.
* De steekproeven zijn onafhankelijk.
Het betrouwbaarheidsinterval kan voor beide toetsen worden berekend, maar de onderliggende berekeningen en interpretatie verschillen vanwege de structuur van de data (gepaard vs. ongepaard).
---
# Voorwaarden en vergelijking van t-toetsen
Dit deel bespreekt de voorwaarden voor het uitvoeren van de gepaarde en ongepaarde t-toets en vergelijkt deze twee toetsen met betrekking tot hun toepassingen en criteria.
## 3.1 Verschillen tussen steekproeven: gepaard versus ongepaard
Bij het analyseren van gegevens met t-toetsen is het cruciaal om onderscheid te maken tussen het type steekproef dat is gebruikt. Dit onderscheid bepaalt welke specifieke t-toets het meest geschikt is voor de analyse.
### 3.1.1 Ongepaarde steekproeven (between subjects design)
Ongepaarde, of onafhankelijke, steekproeven worden verzameld wanneer de observaties binnen de ene groep geen systematische relatie hebben met de observaties binnen de andere groep. Dit design staat ook bekend als een "between subjects" design, wat betekent dat verschillende proefpersonen worden toegewezen aan verschillende condities of groepen.
* **Kenmerken:**
* Niet-gepaarde steekproeven.
* Niet-gekoppelde steekproeven.
* Onafhankelijke steekproeven.
* **Voorbeeldcontext:**
* De vraag of mannen sneller lopen dan vrouwen. Hier worden de prestaties van een groep mannen vergeleken met de prestaties van een groep vrouwen, waarbij elke deelnemer slechts aan één groep behoort.
### 3.1.2 Gepaarde steekproeven (within subjects design)
Gepaarde, of afhankelijke, steekproeven worden gebruikt wanneer de observaties systematisch aan elkaar gekoppeld zijn. Dit gebeurt typisch binnen een "within subjects" design, waarbij dezelfde proefpersonen meerdere metingen ondergaan, of wanneer proefpersonen gematcht worden op relevante kenmerken.
* **Kenmerken:**
* Gepaarde steekproeven.
* Gekoppelde steekproeven.
* Afhankelijke steekproeven.
* **Voorbeeldcontext:**
* De vraag of leerlingen sneller zijn na het nemen van EPO. Hierbij worden twee metingen verricht bij dezelfde groep leerlingen: één meting vóór het nemen van EPO en één meting na het nemen van EPO.
## 3.2 De ongepaarde t-toets
De ongepaarde t-toets, ook wel de "two sample t-test" genoemd, wordt gebruikt om het gemiddelde verschil tussen twee onafhankelijke groepen te onderzoeken. De toetsstatistiek is hierbij een verschilstatistiek.
### 3.2.1 Toepassingen en toetsstatistiek
In de praktijk worden twee varianten van de 2-steekproeven t-toets gebruikt, afhankelijk van de variantie binnen de groepen:
* **Gepoolde standaardafwijking:** Deze aanpak gaat uit van gelijke varianties in beide populaties.
* **Ongepoolde standaardafwijking:** Deze aanpak is conservatiever en wordt gebruikt wanneer de varianties in de populaties mogelijk verschillen.
> **Tip:** De controle van gelijke varianties wordt vaak gedaan met een Levene's test. In de praktijk, omdat handmatige controle complex kan zijn, kiest men vaak voor de conservatievere benadering van de t-toets die de ongepoolde steekproefstandaardafwijking gebruikt.
### 3.2.2 Voorwaarden voor de ongepaarde t-toets
Om de ongepaarde t-toets correct toe te passen, moeten aan de volgende voorwaarden worden voldaan:
* **Onafhankelijkheid van de steekproeven:** De metingen in de ene groep mogen geen invloed hebben op de metingen in de andere groep.
* **Normaal verdeelde populaties:** De verdeling van de populaties waaruit de steekproeven zijn getrokken, moet (bij benadering) normaal zijn. Als de steekproefgrootte groot is (meestal $n \ge 30$), is de t-toets redelijk robuust tegen schendingen van deze aanname vanwege de centrale limietstelling.
* **Gelijke varianties (optioneel, afhankelijk van de variant van de toets):** Hoewel er varianten van de ongepaarde t-toets zijn die met ongelijke varianties om kunnen gaan (zoals Welch's t-test), wordt er soms een assumptie van gelijke varianties gemaakt.
## 3.3 De gepaarde t-toets
De gepaarde t-toets wordt gebruikt om het gemiddelde verschil tussen twee gerelateerde metingen te analyseren. Dit kan bijvoorbeeld gaan om metingen vóór en na een interventie bij dezelfde personen, of metingen van gematchte paren.
### 3.3.1 Toepassingen en toetsstatistiek
Bij de gepaarde t-toets wordt het gemiddelde van de *verschillen* tussen de gepaarde observaties geanalyseerd.
### 3.3.2 Voorwaarden voor de gepaarde t-toets
De belangrijkste voorwaarden voor het uitvoeren van de gepaarde t-toets zijn:
* **Gepaarde observaties:** De data moeten bestaan uit paren van metingen die systematisch aan elkaar gekoppeld zijn.
* **Normaal verdeelde verschilscores:** De verschillen tussen de gepaarde observaties moeten normaal verdeeld zijn. Net als bij de ongepaarde t-toets, zorgt een voldoende grote steekproef (bijvoorbeeld $n \ge 30$ paren) voor robuustheid tegen schendingen van deze aanname.
* **Onbekende populatievariantie:** De populatievariantie van de verschilscores is onbekend.
## 3.4 Vergelijking van gepaarde en ongepaarde t-toetsen
De keuze tussen de gepaarde en ongepaarde t-toets hangt direct af van het onderzoeksdesign en de aard van de verzamelde data.
| Kenmerk | Gepaarde t-toets | Ongepaarde t-toets |
| :-------------------- | :-------------------------------------------------- | :---------------------------------------------------------- |
| **Steekproef type** | Gepaarde/afhankelijke steekproeven | Ongepaarde/onafhankelijke steekproeven |
| **Design** | Within subjects (herhaalde metingen bij dezelfde subjecten) of matched pairs | Between subjects (verschillende subjecten in elke groep) |
| **Focus van analyse** | Gemiddelde van de verschilscores | Verschil tussen de groepsgemiddelden |
| **Voorwaarden** | Verschilscores zijn normaal verdeeld; $n \ge 30$ of normaal verdeeld | Populaties zijn normaal verdeeld; $n \ge 30$ of normaal verdeeld; varianties gelijk (afhankelijk van de variant) |
### 3.4.1 Betrouwbaarheidsinterval
Zowel de gepaarde als de ongepaarde t-toets kunnen worden gebruikt om betrouwbaarheidsintervallen te construeren voor het gemiddelde verschil tussen twee groepen of twee metingen.
* Voor de **gepaarde t-toets** wordt het betrouwbaarheidsinterval berekend voor het gemiddelde verschilscore ($\mu_d$).
* Voor de **ongepaarde t-toets** wordt het betrouwbaarheidsinterval berekend voor het verschil tussen de populatiegemiddelden ($\mu_1 - \mu_2$).
### 3.4.2 Voorbeelden
**Voorbeeld 1: Ongepaarde t-toets**
Sara onderzoekt of mannen gemiddeld meer kinderen willen dan vrouwen. Ze verzamelt data van 10 mannen en 10 vrouwen, die willekeurig zijn geselecteerd. Dit is een klassiek voorbeeld van een ongepaarde steekproef, omdat de groep mannen onafhankelijk is van de groep vrouwen. De ongepaarde t-toets zou hier geschikt zijn om te bepalen of er een significant verschil is in het gemiddeld gewenst aantal kinderen tussen mannen en vrouwen.
**Voorbeeld 2: Gepaarde t-toets versus Ongepaarde t-toets**
Bart onderzoekt het effect van hypnose op kortetermijngeheugen. Hij heeft twee groepen: een hypnose groep en een controlegroep. Dit is een voorbeeld van een **ongepaarde t-toets** omdat de proefpersonen in de hypnose groep verschillen van de proefpersonen in de controlegroep.
Als Bart echter dezelfde groep proefpersonen twee keer had getest: eerst zonder hypnose (basismeting) en vervolgens met hypnose, dan zou dit een **gepaarde t-toets** vereisen omdat de metingen afkomstig zijn van dezelfde individuen.
**Voorbeeld 3: Gepaarde t-toets**
Een studie onderzoekt of slaaptekort de aandacht beïnvloedt. Twee groepen van 30 volwassenen worden vergeleken. Eén groep is slaapgedepriveerd (4 uur slaap), de andere groep heeft 8 uur slaap gehad (controlegroep). Dit is een voorbeeld van een **ongepaarde t-toets**, omdat de proefpersonen in de slaapgedepriveerde groep verschillen van de proefpersonen in de controlegroep. De metingen (CPT-scores) zijn onafhankelijk tussen de groepen.
> **Tip:** Het belangrijkste criterium bij de keuze is of de data uit onafhankelijke groepen komen (ongepaard) of dat er een systematische relatie is tussen de metingen binnen groepen of tussen paren van subjecten (gepaard).
---
# Praktische oefeningen en case studies
Dit gedeelte bevat diverse oefeningen en case studies die de toepassing van de besproken statistische methoden illustreren, zoals de ongepaarde t-toets in verschillende onderzoeksscenario's.
## 4.1 De ongepaarde t-toets: concept en toepassing
De ongepaarde t-toets, ook wel de two-sample t-test genoemd, is een statistische methode die wordt gebruikt om het verschil tussen de gemiddelden van twee onafhankelijke groepen te toetsen. Dit type toets is van toepassing wanneer de gegevens afkomstig zijn van "between subjects" designs, waarbij elke deelnemer slechts aan één conditie of groep deelneemt.
### 4.1.1 Soorten steekproeven
Het onderscheid tussen gepaarde en ongepaarde steekproeven is cruciaal voor de keuze van de juiste statistische toets:
* **Ongepaarde (onafhankelijke) steekproeven:** Deze worden gebruikt in "between subjects" designs. Er is geen logische koppeling tussen de metingen in de ene groep en de metingen in de andere groep. Voorbeelden zijn:
* Verschillen in snelheid tussen mannen en vrouwen.
* Vergelijking van testresultaten tussen een interventiegroep en een controlegroep.
* **Gepaarde (afhankelijke) steekproeven:** Deze worden gebruikt in "within subjects" designs. De metingen zijn aan elkaar gekoppeld, vaak door herhaalde metingen bij dezelfde personen (bv. voor en na een interventie) of door het matchen van deelnemers op bepaalde kenmerken. Voorbeelden zijn:
* Vergelijking van prestaties van leerlingen voor en na het gebruik van EPO.
* Het meten van reactietijden van dezelfde personen onder verschillende condities.
### 4.1.2 De toetsstatistiek van de ongepaarde t-toets
De ongepaarde t-toets berekent een verschilstatistiek die het verschil tussen de groepsgemiddelden relateert aan de spreiding binnen de groepen.
#### 4.1.2.1 Variaties op de ongepaarde t-toets
In de praktijk zijn er twee varianten van de 2-steekproeven t-toets, afhankelijk van de spreiding (varianties) in de groepen:
1. **Gepoolde t-toets:** Deze variant wordt gebruikt wanneer de varianties in de twee populaties als gelijk worden beschouwd. De standaardafwijkingen worden dan gepoold (gewogen gemiddelde) wat leidt tot een verlies van twee vrijheidsgraden.
2. **Ongepoolde t-toets (ook wel Welch's t-toets):** Deze variant wordt gebruikt wanneer de varianties in de twee populaties als ongelijk worden beschouwd. Dit is de conservatievere optie en wordt aangeraden wanneer de controle van gelijke varianties (bv. via een Levene's test) niet met zekerheid kan worden vastgesteld, of wanneer software de ongepoolde steekproefstandaardafwijking gebruikt.
#### 4.1.2.2 Voorwaarden voor de ongepaarde t-toets
De ongepaarde t-toets kent de volgende voorwaarden:
* **Onafhankelijke steekproeven:** De groepen moeten onafhankelijk zijn van elkaar.
* **Normaal verdeelde populaties:** De populaties waaruit de steekproeven getrokken zijn, dienen normaal verdeeld te zijn. Dit is vooral belangrijk bij kleine steekproeven. Bij grote steekproeven ($n \geq 30$) is de t-toets robuust tegen schendingen van deze aanname (Centrale Limietstelling).
* **Gelijke varianties (homoscedasticiteit):** Voor de gepoolde t-toets moet worden aangenomen dat de populatievarianties gelijk zijn. Als deze aanname niet voldaan is, wordt de ongepoolde t-toets gebruikt. De controle hiervan gebeurt idealiter via een statistische test zoals de Levene's test.
#### 4.1.2.3 Betrouwbaarheidsinterval
Naast de p-waarde kan een betrouwbaarheidsinterval voor het verschil tussen de groepsgemiddelden worden berekend. Dit interval geeft een reeks van plausibele waarden voor het werkelijke verschil tussen de populatiegemiddelden. Als dit interval de nul niet bevat, is het verschil significant op het gekozen significantieniveau.
### 4.1.3 Oefeningen en Case Studies
Hieronder worden enkele praktijkvoorbeelden besproken die de toepassing van de ongepaarde t-toets illustreren.
#### 4.1.3.1 Oefening 1: Kinderwens bij mannen en vrouwen
**Context:** Sara onderzoekt of mannen gemiddeld meer kinderen willen dan vrouwen. Ze heeft gegevens verzameld van 10 mannen en 10 vrouwen die willekeurig zijn aangesproken.
**Vraag:** Is het gemiddelde aantal gewenste kinderen significant hoger bij mannen dan bij vrouwen, met een significantieniveau $\alpha = 5\%$? Er wordt aangenomen dat de voorwaarden voor de ongepaarde t-toets voldaan zijn.
#### 4.1.3.2 Oefening 2: Hypnose en kortetermijngeheugen
**Context:** Bart onderzoekt het effect van hypnose op het kortetermijngeheugen (KTG). Een groep mensen onder hypnose krijgt 12 woorden voorgelezen, terwijl een controlegroep dezelfde taak zonder hypnose uitvoert. Het aantal correct opgesomde woorden wordt genoteerd. De vraag is of hypnose leidt tot significant meer onthouden woorden. Significantieniveau $\alpha=5\%$. Er wordt aangenomen dat de data uit normaal verdeelde populaties komen.
**Methode:** De conclusie moet getrokken worden via de overschrijdingskans (p-waarde).
#### 4.1.3.3 Oefening 3: Slaaptekort en aandacht
**Context:** Een studie onderzoekt of slaaptekort de aandacht van volwassenen vermindert. Twee willekeurige steekproeven van 30 volwassenen (18-35 jaar) worden vergeleken. De ene groep krijgt 4 uur slaap (testgroep), de andere groep 8 uur slaap (controlegroep). De Continuous Performance Test (CPT) meet de aandachtscapaciteit; hogere scores duiden op betere aandacht. Van de controlegroep haalden 26 personen de 8 uur slaap voor een geldige meting.
**Aannames:** De data komen uit normaal verdeelde populaties.
**Tip:** Bij het uitvoeren van de t-toets is het belangrijk om eerst de data te inspecteren op uitschieters en de normaliteitsaanname te controleren, met name bij kleinere steekproeven. Indien deze aannames geschonden worden, kan een non-parametrisch alternatief zoals de Mann-Whitney U-toets overwogen worden. Controleer ook de aanname van gelijke varianties. Indien deze sterk afwijkt, gebruik dan de ongepoolde t-toets.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Univariate data-analyse | Een statistische methode die wordt gebruikt om één variabele tegelijk te onderzoeken en te beschrijven, vaak met behulp van samenvattende statistieken en grafieken. |
| Ongepaarde steekproef (Unpaired samples) | Een type steekproef waarbij de observaties in de ene groep onafhankelijk zijn van de observaties in de andere groep; de groepen worden daarom vergeleken zonder directe koppeling. |
| Gepaarde steekproef (Paired samples) | Een type steekproef waarbij de observaties in de ene groep direct gekoppeld zijn aan de observaties in de andere groep, bijvoorbeeld door herhaalde metingen bij dezelfde personen. |
| Between subjects design | Een onderzoeksopzet waarbij verschillende groepen deelnemers worden blootgesteld aan verschillende condities of behandelingen, waarbij elke deelnemer slechts aan één conditie wordt toegewezen. |
| Within subjects design | Een onderzoeksopzet waarbij dezelfde deelnemers meerdere metingen ondergaan onder verschillende condities, wat leidt tot gepaarde observaties. |
| T-toets | Een inferentiële statistische toets die wordt gebruikt om het gemiddelde van twee groepen te vergelijken, voornamelijk wanneer de populatievariantie onbekend is en de steekproef klein. |
| Ongepaarde t-toets (Two sample t-test) | Een t-toets die wordt gebruikt om de gemiddelden van twee onafhankelijke, ongepaarde groepen te vergelijken, ervan uitgaande dat de data normaal verdeeld zijn. |
| Gepaarde t-toets | Een t-toets die wordt gebruikt om de gemiddelden van twee gerelateerde (gepaarde) groepen te vergelijken, vaak gebruikt bij herhaalde metingen of bij matched pairs. |
| Toetsstatistiek | Een waarde berekend uit steekproefgegevens die wordt gebruikt om de nulhypothese te beoordelen; deze waarde wordt vergeleken met een kritische waarde of gebruikt om een p-waarde te berekenen. |
| Spreiding in groepen | De mate waarin de gegevenspunten binnen een groep variëren of uit elkaar liggen, vaak gemeten door standaardafwijking of variantie. |
| Schatter voor standaardafwijking | Een statistische maat die wordt gebruikt om de standaardafwijking van een populatie te schatten op basis van een steekproef; de gepoolde of ongepoolde variant wordt gebruikt afhankelijk van de aannames over varianties. |
| Gepaarde standaardafwijking (Pooled standard deviation) | Een gewogen gemiddelde van de varianties van twee groepen, gebruikt in de ongepaarde t-toets wanneer wordt aangenomen dat de populatievarianties gelijk zijn; dit leidt tot een verlies van vrijheidsgraden. |
| Levene’s test | Een statistische test die wordt gebruikt om de homogeniteit van varianties te controleren tussen verschillende groepen, wat een belangrijke aanname is voor sommige statistische toetsen zoals de ongepaarde t-toets. |
| Twee normaalverdeelde populaties | Een aanname voor de t-toets die stelt dat de gegevens binnen de te vergelijken populaties een normale verdeling volgen. |
| Verschillende varianties | Een situatie waarin de spreiding (variantie) van de gegevens in de te vergelijken populaties significant verschilt. |
| Betrouwbaarheidsinterval | Een bereik van waarden dat waarschijnlijk de populatieparameter (zoals het gemiddelde) bevat, berekend uit de steekproefgegevens; het geeft de precisie van de schatting aan. |
| Overschrijdingskans (p-waarde) | De kans om een teststatistiek te observeren die minstens zo extreem is als de waargenomen waarde, ervan uitgaande dat de nulhypothese waar is. Een kleine p-waarde (meestal < 0.05) leidt tot verwerping van de nulhypothese. |
| Kortetermijngeheugen (KTG) | Een cognitief systeem dat verantwoordelijk is voor het tijdelijk vasthouden en manipuleren van informatie gedurende een korte periode. |
| Magische nummer 7 plus/min 2 | Een uitspraak van George Miller die suggereert dat het kortetermijngeheugen doorgaans 7 items kan bevatten, met een variatie van plus of min 2. |
| Hypnose | Een staat van verhoogde suggestibiliteit en focus, vaak gekenmerkt door verminderd perifere bewustzijn en verhoogde respons op suggesties. |
| Controlegroep | Een groep deelnemers in een experiment die geen actieve behandeling of interventie ontvangt, gebruikt als basislijn voor vergelijking met de experimentele groep. |
| Aandacht | Een cognitief proces dat betrokken is bij het selecteren van specifieke informatie uit de omgeving en het negeren van afleidende prikkels. |
| Slaaptekort | Een ontoereikende hoeveelheid slaap, die negatieve gevolgen kan hebben voor fysieke en cognitieve functies. |
| Continuous Performance Test (CPT) | Een gestandaardiseerde neuropsychologische test die wordt gebruikt om aandacht en impulsiviteit te meten door reactietijden en nauwkeurigheid te beoordelen bij het detecteren van specifieke stimuli. |
| Aandachtscapaciteit | Het vermogen van een individu om zich te concentreren op een taak en relevante informatie te verwerken gedurende een bepaalde periode. |