Cover
Start now for free WPO+3+S3+2526.pptx
Summary
# Introductie tot data-analyse
Dit gedeelte introduceert de concepten van univariate data-analyse en het belang van het formuleren van hypothesen.
### 1.1 Soorten steekproeven
Data-analyse kan worden onderverdeeld op basis van de structuur van de steekproeven, met name of deze ongepaard (onafhankelijk) of gepaard (afhankelijk) zijn.
#### 1.1.1 Ongepaarde (onafhankelijke) steekproeven
* **Kenmerken:** Deze steekproeven worden verzameld in een "between subjects" design, wat betekent dat de observaties binnen de ene groep geen relatie hebben met de observaties binnen de andere groep. De steekproeven zijn niet-gekoppeld en onafhankelijk.
* **Voorbeeld:** Het vergelijken van de snelheid van mannen met de snelheid van vrouwen.
#### 1.1.2 Gepaarde (afhankelijke) steekproeven
* **Kenmerken:** Deze steekproeven worden verzameld in een "within subjects" design, wat impliceert dat elke observatie gekoppeld is aan een andere observatie. De steekproeven zijn gekoppeld en afhankelijk. Dit design wordt vaak gebruikt bij herhaalde metingen.
* **Voorbeeld:** Het meten van de leerprestaties van leerlingen vóór en na het nemen van EPO om te zien of er een verschil is.
### 1.2 Paired sample T-test
De paired sample t-test is een statistische procedure die wordt gebruikt om het verschil in responsen tussen twee behandelingen te analyseren wanneer de data gepaard is.
* **Procedure:** Voor elk paar wordt het verschil berekend: $d_i = x_{i1} - x_{i2}$. Op deze verschilscores worden vervolgens procedures toegepast die vergelijkbaar zijn met een 1-steekproef t-test.
* **Hypothese:** Men kan op voorhand een specifiek verschil verwachten (bijvoorbeeld een verschil van 5 punten). In dat geval wordt deze verwachte waarde gebruikt in de analyse in plaats van 0.
### 1.3 One sample t-test versus paired t-test
Hoewel beide tests gebruik maken van t-procedures, verschillen ze in hun toepassing en de aard van de data die ze analyseren.
* **One sample t-test:** Wordt gebruikt om het gemiddelde van een enkele steekproef te vergelijken met een specifieke, bekende waarde (hypothetisch gemiddelde, $\mu$).
* **Voorwaarden:** De standaardafwijking ($\sigma$) is onbekend, en de data is normaal verdeeld of de steekproefgrootte ($n$) is minimaal 30.
* **Paired t-test:** Wordt gebruikt om het gemiddelde verschil tussen twee gerelateerde metingen te vergelijken met nul (of een andere hypothetische verschilwaarde).
* **Voorwaarden:** De standaardafwijking ($\sigma$) van de verschilscores is onbekend, en de verschilscores zijn normaal verdeeld of de steekproefgrootte ($n$) van de paren is minimaal 30.
#### 1.3.1 Betrouwbaarheidsinterval
Zowel voor de one sample t-test als voor de paired t-test kan een betrouwbaarheidsinterval worden berekend om het interval aan te geven waarbinnen het populatiegemiddelde of het populatieverschil waarschijnlijk ligt.
### 1.4 Formuleren van hypothesen
Het formuleren van duidelijke hypothesen is een cruciale eerste stap in data-analyse. Dit geldt met name voor het opzetten van een paired t-test, waar het verschil tussen twee gerelateerde metingen centraal staat.
> **Tip:** Zorg ervoor dat je nulhypothese ($H_0$) en alternatieve hypothese ($H_a$) specifiek en toetsbaar zijn, en dat ze het onderzochte fenomeen accuraat weerspiegelen.
### 1.5 Aannames controleren
Bij het uitvoeren van statistische tests, zoals de paired t-test, is het belangrijk om de onderliggende aannames te controleren.
* **Normaliteit:** Een van de belangrijkste aannames is dat de verschilscores normaal verdeeld zijn. Als deze aanname niet is voldaan, kunnen de resultaten van de t-test minder betrouwbaar zijn.
> **Tip:** Wanneer de aannames van de t-test niet voldaan zijn, kunnen niet-parametrische alternatieven zoals de Wilcoxon signed-rank test overwogen worden.
### 1.6 Conclusies trekken
Conclusies in data-analyse worden doorgaans getrokken op basis van twee methoden:
1. **Overschrijdingskans (p-waarde):** Vergelijkt de berekende p-waarde met het vooraf bepaalde significantieniveau ($\alpha$). Als $p < \alpha$, wordt de nulhypothese verworpen.
2. **Kritische waarde:** Vergelijkt de berekende teststatistiek met de kritische waarde(n) uit de t-verdeling. Als de teststatistiek buiten het acceptatiegebied valt, wordt de nulhypothese verworpen.
> **Tip:** Het begrijpen van zowel de p-waarde als de kritische waarde methode geeft een completer beeld van de statistische significantie van de resultaten.
### 1.7 Belangrijke overwegingen
* **Z-toets:** Hoewel niet direct behandeld in dit gedeelte, is het belangrijk te weten dat de z-toets een alternatief is voor de t-toets wanneer de populatie standaardafwijking bekend is of wanneer de steekproefgrootte zeer groot is ($n \ge 30$).
* **Toepassing van hypothesen:** Het formuleren van hypothesen kan leiden tot specifieke verwachtingen die direct in de berekening van verschilscores worden meegenomen (bv. een verwachte toename van 5 punten). Dit is een belangrijk aspect bij het opzetten van gepaarde analyses.
---
# Soorten steekproeven en het paired t-test
Dit onderwerp behandelt de verschillende soorten steekproeven, met een specifieke focus op ongepaarde en gepaarde steekproeven, en introduceert de paired t-test voor de analyse van gepaarde data.
### 2.1 Soorten steekproeven
Steekproeven kunnen worden onderscheiden op basis van de relatie tussen de waarnemingen binnen de steekproef. De twee hoofdtypen zijn ongepaarde (onafhankelijke) en gepaarde (afhankelijke) steekproeven.
#### 2.1.1 Ongepaarde (niet-gekoppelde) steekproeven
Ongepaarde steekproeven, ook wel onafhankelijke steekproeven genoemd, komen voort uit een *between subjects design*. Dit betekent dat de observaties in de ene groep onafhankelijk zijn van de observaties in de andere groep. Er is geen verband tussen de individuele metingen in de ene groep en die in de andere.
**Voorbeeld:** Het vergelijken van de snelheid van mannen en vrouwen. De groep mannen is onafhankelijk van de groep vrouwen.
#### 2.1.2 Gepaarde (gekoppelde) steekproeven
Gepaarde steekproeven, ook wel afhankelijke steekproeven genoemd, komen voort uit een *within subjects design* of een design waarbij paren van individuen worden gevormd op basis van bepaalde kenmerken. Dit betekent dat de observaties binnen een paar aan elkaar gerelateerd zijn. Typisch wordt bij gepaarde data tweemaal gemeten bij dezelfde proefpersoon of bij proefpersonen die gematcht zijn.
**Voorbeeld:** Het meten of leerlingen sneller worden na het nemen van EPO. Hierbij worden twee metingen gedaan bij dezelfde leerlingen: één meting vóór en één meting na de interventie.
### 2.2 De paired t-test
De paired t-test is een statistische toets die wordt gebruikt om het verschil in responsen tussen twee gerelateerde metingen te analyseren, zoals bij gepaarde steekproeven. Het principe is om het verschil te berekenen tussen de twee metingen voor elk paar. Deze verschilscores worden vervolgens geanalyseerd met een procedure die vergelijkbaar is met een *one sample t-test*.
#### 2.2.1 Toepassing van de paired t-test
Bij een paired t-test wordt voor elk paar *i* het verschil berekend:
$$d_i = x_{i1} - x_{i2}$$
waarbij $x_{i1}$ de score van het eerste paar is en $x_{i2}$ de score van het tweede paar. Deze verschilscores ($d_i$) worden vervolgens gebruikt om de gemiddelde verschilscore te berekenen en te toetsen of dit gemiddelde significant afwijkt van nul (of een andere verwachte waarde).
> **Tip:** Het is belangrijk op te merken dat men soms verwacht dat het verschil tussen de twee metingen een specifieke waarde zal hebben (bijvoorbeeld een toename van 5 punten). In dat geval kan deze verwachte waarde worden ingevuld in plaats van nul bij de berekening van de verschilscore, wat overeenkomt met een *one sample t-test* op de verschilscores.
#### 2.2.2 Voorwaarden voor de paired t-test
De voorwaarden voor het uitvoeren van een paired t-test zijn vergelijkbaar met die van een *one sample t-test*:
* **Onbekende populatievariantie ($\sigma^2$):** De standaarddeviatie van de populatie is onbekend.
* **Voldoende steekproefgrootte of normaliteit van de verschilscores:**
* De steekproefgrootte ($n$) is groter dan of gelijk aan 30, OF
* De verschilscores zijn normaal verdeeld.
#### 2.2.3 Hypothesen formuleren voor de paired t-test
Bij het formuleren van hypothesen voor een paired t-test ligt de focus op het gemiddelde verschil (${\mu}_d$) tussen de gepaarde metingen.
* **Nulhypothese ($H_0$):** Er is geen significant verschil tussen de gepaarde metingen.
$$H_0: {\mu}_d = 0$$
* **Alternatieve hypothese ($H_1$):** Er is wel een significant verschil tussen de gepaarde metingen. Dit kan een tweezijdige hypothese zijn (het verschil is niet nul):
$$H_1: {\mu}_d \neq 0$$
Of een eenzijdige hypothese, afhankelijk van de verwachting:
$$H_1: {\mu}_d > 0 \quad \text{of} \quad H_1: {\mu}_d < 0$$
#### 2.2.4 Betrouwbaarheidsinterval voor het verschil
Net als bij de *one sample t-test*, kan voor de paired t-test een betrouwbaarheidsinterval worden berekend voor het gemiddelde verschil. Dit interval geeft een reeks waarden aan waarbinnen het ware populatiegemiddelde verschil waarschijnlijk ligt.
> **Tip:** Bij het interpreteren van het betrouwbaarheidsinterval: als het interval de nul niet bevat, wordt de nulhypothese verworpen bij het corresponderende significantieniveau.
### 2.3 Vergelijking: One sample t-test vs. Paired t-test
Hoewel de paired t-test gebaseerd is op de principes van de *one sample t-test*, is het essentieel om het onderscheid te begrijpen:
* De **one sample t-test** wordt gebruikt om het gemiddelde van één steekproef te vergelijken met een bekende of verwachte populatiewaarde.
* De **paired t-test** wordt gebruikt om het gemiddelde verschil tussen twee gerelateerde metingen (paren) te analyseren, waarbij het gemiddelde verschil van de populatie wordt getoetst.
De kern van de paired t-test ligt in het transformeren van het probleem van twee gerelateerde variabelen naar één variabele (de verschilscore) die vervolgens wordt geanalyseerd met een *one sample t-test*. De assumptie van normaliteit slaat hierbij specifiek op de verdeling van deze verschilscores.
---
# Voorwaarden en toepassingen van de t-test
Dit onderwerp bespreekt de voorwaarden en toepassingen van de one-sample t-test en de paired t-test, inclusief betrouwbaarheidsintervallen.
### 3.1 De t-test: een overzicht
De t-test is een statistische methode die gebruikt wordt om hypothesen te toetsen over populatiegemiddelden wanneer de populatiestandaarddeviatie onbekend is. Dit in tegenstelling tot de z-toets, die de populatiestandaarddeviatie kent.
#### 3.1.1 Soorten steekproeven
Bij het analyseren van data is het cruciaal om onderscheid te maken tussen verschillende soorten steekproeven:
* **Ongepaarde (unpaired/independent) steekproeven:** Deze komen voort uit een between-subjects design, waarbij onafhankelijke groepen worden vergeleken. Een voorbeeld is het vergelijken van de snelheid van mannen ten opzichte van vrouwen.
* **Gepaarde (paired/dependent) steekproeven:** Deze komen voort uit een within-subjects design, waarbij herhaalde metingen bij dezelfde subjecten worden gedaan of waarbij subjecten gematcht zijn. Een voorbeeld is het meten van de snelheid van leerlingen vóór en na het nemen van EPO.
#### 3.1.2 De paired t-test: een diepere kijk
De paired t-test wordt toegepast om het verschil in responsen tussen twee behandelingen na te gaan in een design met gepaarde data. Hierbij wordt het verschilscore $d$ voor elk paar $i$ berekend als $d_i = x_{i1} - x_{i2}$. Op deze verschilscores worden vervolgens procedures van de one-sample t-test toegepast.
> **Tip:** Wees alert op de definitie van de verschilscore. Soms kan er een verwachte systematische afwijking zijn (bv. 5 punten verschil), die dan als nulhypothese wordt meegenomen in de verschilscoreberekening.
### 3.2 Voorwaarden van de t-testen
Om de resultaten van een t-test betrouwbaar te interpreteren, moeten aan bepaalde voorwaarden voldaan zijn:
#### 3.2.1 One sample t-test
* De populatiestandaarddeviatie ($\sigma$) is onbekend.
* De steekproef is willekeurig getrokken.
* De data is (bij benadering) normaal verdeeld, óf de steekproefgrootte ($n$) is voldoende groot (vuistregel: $n \ge 30$).
#### 3.2.2 Paired t-test
* De populatiestandaarddeviatie van de verschilscores ($\sigma_d$) is onbekend.
* De steekproef is willekeurig getrokken.
* De verschilscores ($d$) zijn (bij benadering) normaal verdeeld, óf de steekproefgrootte ($n$, het aantal paren) is voldoende groot (vuistregel: $n \ge 30$).
> **Tip:** Bij oefeningen kan soms expliciet gevraagd worden om aan te nemen dat aan de assumptie van normale verdeling van verschilscores is voldaan, wat de toetsing vergemakkelijkt.
### 3.3 Betrouwbaarheidsinterval
Naast hypothesetoetsing, bieden t-testen ook de mogelijkheid tot het construeren van betrouwbaarheidsintervallen.
* **Betrouwbaarheidsinterval voor de one-sample t-test:** Dit interval geeft een reeks van waarden waarbinnen het populatiegemiddelde ($\mu$) met een bepaalde mate van zekerheid (betrouwbaarheidsniveau) ligt.
* **Betrouwbaarheidsinterval voor de paired t-test:** Dit interval geeft een reeks van waarden waarbinnen het populatiegemiddelde van de verschilscores ($\mu_d$) met een bepaalde mate van zekerheid ligt.
### 3.4 Toepassingen en oefeningen
De t-test vindt brede toepassingen in diverse onderzoeksgebieden. Hieronder volgen voorbeelden van hoe deze toetsen in de praktijk kunnen worden toegepast, met de focus op het formuleren van hypothesen en het controleren van assumpties.
#### 3.4.1 Voorbeeld van een paired t-test toepassing (Chemotherapie en cognitie)
Stel, men onderzoekt het effect van chemotherapie op cognitieve functies.
* **Hypothese:** Er is een significant verschil in cognitieve prestaties vóór en ná chemotherapie.
* **Data:** Cognitieve scores van dezelfde patiënten worden gemeten op twee momenten: vóór de behandeling en na de behandeling.
* **Test:** Een paired t-test wordt gebruikt om te bepalen of het gemiddelde verschil in scores significant is.
#### 3.4.2 Voorbeeld van een paired t-test toepassing (Stressreductietraining)
Bij de evaluatie van een stressreductietraining kunnen de volgende stappen worden gevolgd:
1. **Formuleren van hypothesen:**
* Nulhypothese ($H_0$): Er is geen verschil in stressniveau vóór en na de training ($\mu_d = 0$).
* Alternatieve hypothese ($H_1$): Er is een verschil in stressniveau vóór en na de training ($\mu_d \ne 0$), of specifiek een reductie van stress ($\mu_d < 0$).
2. **Controleren van assumpties:** Aannemen dat de verschilscores normaal verdeeld zijn.
3. **Statistische toetsing:**
* **Met de overschrijdingskans (p-waarde):** Als de berekende p-waarde kleiner is dan het gekozen significantieniveau ($\alpha$), wordt de nulhypothese verworpen.
* **Met de kritische waarde:** Als de berekende toetsingsgrootheid buiten het acceptatiegebied valt (bepaald door de kritische waarde), wordt de nulhypothese verworpen.
> **Example:** Een onderzoeker wil weten of een nieuwe trainingsmethode voor studenten leidt tot betere examenresultaten. De examenresultaten van een groep studenten worden gemeten na de traditionele methode en na de nieuwe methode. De verschilscores worden geanalyseerd met een paired t-test. Als de p-waarde bijvoorbeeld 0.03 is en het significantieniveau $\alpha = 0.05$, wordt de nulhypothese verworpen, wat suggereert dat de nieuwe methode significant andere resultaten oplevert.
---
# Praktische oefeningen en conclusietrekking
Deze sectie richt zich op het toepassen van statistische kennis op concrete scenario's, met name bij gepaarde steekproeven, en het trekken van conclusies met behulp van overschrijdingskansen en kritische waarden. Er wordt ingegaan op de berekening en interpretatie van deze waarden in de context van verschillende oefeningen.
### 4.1 Verschillen tussen ongepaarde en gepaarde steekproeven
Een cruciaal onderscheid in statistische analyses is het type steekproef dat wordt gebruikt:
* **Ongepaarde (onafhankelijke) steekproeven:** Deze worden gebruikt in een 'between subjects design', waarbij metingen onafhankelijk van elkaar zijn. Een voorbeeld is het vergelijken van de snelheid van mannen en vrouwen.
* **Gepaarde (afhankelijke) steekproeven:** Deze worden gebruikt in een 'within subjects design', waarbij metingen binnen dezelfde proefpersonen worden gedaan, bijvoorbeeld twee herhaalde metingen na een interventie. Hierbij wordt gekeken naar het verschil in responsen op twee behandelingen.
### 4.2 De Paired Sample T-test
De paired sample t-test wordt ingezet om het verschil in responsen op twee behandelingen te onderzoeken binnen een design met gepaarde data. Hierbij wordt het verschil, aangeduid als $d = (x_{i1} - x_{i2})$, voor elk paar $i$ berekend. Vervolgens worden hierop de procedures van de one-sample t-test toegepast.
#### 4.2.1 Voorwaarden voor de Paired Sample T-test
De voorwaarden voor het uitvoeren van een paired sample t-test zijn vergelijkbaar met die van een one sample t-test:
* De standaarddeviatie van de populatie ($\sigma$) is onbekend.
* De steekproefomvang ($n$) is minimaal 30, OF de verschilscores zijn normaal verdeeld.
#### 4.2.2 Betrouwbaarheidsinterval bij de Paired Sample T-test
Net als bij de one sample t-test kan een betrouwbaarheidsinterval worden berekend om de range van mogelijke populatieverschillen te schatten.
### 4.3 Conclusietrekking met overschrijdingskansen en kritische waarden
Bij het trekken van conclusies uit statistische analyses, zoals de paired sample t-test, zijn twee methoden centraal:
1. **Overschrijdingskans (p-waarde):** Dit is de kans om een steekproefresultaat te verkrijgen dat minstens zo extreem is als het waargenomen resultaat, ervan uitgaande dat de nulhypothese waar is. Een lage p-waarde (meestal kleiner dan een vooraf bepaald significantieniveau, $\alpha$, bijvoorbeeld 0.05) leidt tot verwerping van de nulhypothese.
2. **Kritische waarde:** Dit is de grens van de teststatistiek waarboven of waaronder de nulhypothese wordt verworpen. De kritische waarde hangt af van het gekozen significantieniveau ($\alpha$) en de vrijheidsgraden van de test.
#### 4.3.1 Toepassing in oefeningen
Bij het controleren van de assumpties van de paired sample t-test, zoals de normaliteit van de verschilscores, wordt aangenomen dat deze aan de voorwaarden voldoen. Vervolgens wordt de conclusie getrokken op basis van zowel de overschrijdingskans als de kritische waarde.
> **Tip:** Het is belangrijk om te begrijpen dat de overschrijdingskans en de kritische waarde twee verschillende, maar gerelateerde manieren zijn om tot dezelfde statistische conclusie te komen. Ze bieden een consistent kader voor hypothesetoetsing.
### 4.4 Specifieke Oefeningen
De documentatie verwijst naar diverse praktische oefeningen om deze concepten toe te passen:
* **Oefening 3: Chemotherapie en cognitie:** Deze oefening impliceert waarschijnlijk het analyseren van gepaarde data om de impact van chemotherapie op cognitieve functies te onderzoeken.
* **Oefening 4: Stressreductietraining:** Hierbij wordt de paired sample t-test gebruikt om de effectiviteit van een stressreductietraining te evalueren. De assumpties van de test (normaliteit van verschilscores) worden gecontroleerd, en conclusies worden getrokken met behulp van de overschrijdingskans en kritische waarde.
* **Oefening 6: Wie heeft gelijk?:** Deze oefening is waarschijnlijk ontworpen om studenten te laten redeneren over welke statistische aanpak (gepaard of ongepaard) het meest geschikt is voor een gegeven onderzoekssituatie en hoe de resultaten te interpreteren.
> **Voorbeeld:** Stel dat we de effectiviteit van een nieuwe leermethode onderzoeken door de testresultaten van studenten te meten vóór en na de introductie van de methode. Dit is een gepaard design. We berekenen de verschilscores voor elke student. Vervolgens passen we een paired sample t-test toe. Als de berekende p-waarde kleiner is dan 0.05, verwerpen we de nulhypothese (dat er geen verschil is) en concluderen we dat de leermethode een significant effect heeft. Alternatief kunnen we de berekende t-statistiek vergelijken met de kritische t-waarde uit de t-verdeling. Als de berekende t-statistiek groter is dan de kritische t-waarde, bereiken we dezelfde conclusie.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Univariate data-analyse | Een statistische methode die gericht is op het analyseren van één variabele tegelijk om patronen, tendensen en kenmerken ervan te ontdekken. |
| Paired sample T-test | Een statistische test die wordt gebruikt om het gemiddelde verschil tussen twee gerelateerde groepen metingen te evalueren, zoals metingen van dezelfde proefpersonen onder twee verschillende omstandigheden. |
| Formularium | Een verzameling van formules en regels die relevant zijn voor een bepaald studiegebied of vak, vaak gebruikt als naslagwerk. |
| Between subjects design | Een experimenteel ontwerp waarbij verschillende groepen proefpersonen worden blootgesteld aan verschillende behandelingen of condities. |
| Within subjects design | Een experimenteel ontwerp waarbij dezelfde proefpersonen worden blootgesteld aan alle behandelingen of condities, waardoor herhaalde metingen worden verkregen. |
| Gepaarde steekproeven | Een type steekproef waarbij observaties uit de ene groep op een systematische manier gekoppeld zijn aan observaties uit de andere groep, bijvoorbeeld door metingen van dezelfde individuen op twee verschillende tijdstippen. |
| Ongepaarde steekproeven | Een type steekproef waarbij de observaties in de ene groep onafhankelijk zijn van de observaties in de andere groep; de groepen zijn niet systematisch aan elkaar gerelateerd. |
| Verschilscores | De resultaten verkregen door het aftrekken van de ene meting van de andere binnen een gepaard paar, om het effect van een behandeling of conditie te kwantificeren. |
| One sample t-test | Een statistische test die wordt gebruikt om het gemiddelde van een enkele steekproef te vergelijken met een bekende of veronderstelde populatiegemiddelde wanneer de populatievariantie onbekend is. |
| Betrouwbaarheidsinterval | Een reeks waarden die naar verwachting een bepaald populatieparameter bevat, berekend uit steekproefgegevens, met een gespecificeerd betrouwbaarheidsniveau. |
| Overschrijdingskans (p-waarde) | De waarschijnlijkheid van het verkrijgen van testresultaten die minstens zo extreem zijn als de huidige testresultaten, aangenomen dat de nulhypothese waar is. |
| Kritische waarde | De grens- of grenswaarde die wordt gebruikt om te beslissen of de nulhypothese wordt verworpen, gebaseerd op de teststatistiek en het gekozen significantieniveau. |