Cover
Aloita nyt ilmaiseksi WPO+1+S3+Power+2526.pptx
Summary
# Inleiding tot statistiek en cursusstructuur
Deze sectie biedt een overzicht van de structuur van de cursus statistiek, inclusief de verschillende onderdelen zoals hoorcolleges, werkcolleges, software-introductie en de examens, evenals richtlijnen voor communicatie en het stellen van vragen.
### 1.1 Cursusonderdelen en structuur
De cursus is opgebouwd uit verschillende onderdelen die bijdragen aan de volledige beheersing van de statistische materie:
* **Hoorcolleges (HOC):** Deze worden gegeven door Professor Theuns en bieden de theoretische basis van de statistiek.
* **Werkcolleges (WPO):** Onder begeleiding van assistenten worden oefeningen uitgewerkt om de theoretische concepten toe te passen.
* **Software-introductie:** Een deel van de cursus is gewijd aan het leren gebruiken van specifieke software voor statistische analyses.
* **Oefeningenlessen:** Specifieke sessies gericht op het oplossen van oefeningen.
* **Extra oefeningen en zelfstudie:** Aanvullend materiaal om de kennis te verdiepen.
* **Examen THEO + OEF:** Een examen dat zowel de theoretische kennis als de vaardigheid in het oplossen van oefeningen test.
* **Examen SOFTWARE:** Een praktisch examen gericht op de beheersing van de statistische software.
#### 1.1.1 Good practices
Gedurende de cursus wordt nadruk gelegd op goede praktijken, waaronder effectief gebruik van leermiddelen en het correct benaderen van de cursusinhoud.
> **Tip:** De lesopnames van de werkcolleges (WPO) zijn beschikbaar, maar mogen de aanwezigheid en actieve deelname aan de live lessen niet vervangen.
#### 1.1.2 Gebruik van rekenmachines
Studenten mogen een rekenmachine naar keuze gebruiken, mits deze geen verbinding met een computer kan maken. Een eenvoudige wetenschappelijke rekenmachine van maximaal 30 euro wordt aangeraden. Smartphones en tablets zijn niet toegestaan als rekenmachine tijdens examens of oefeningen waarbij een rekenmachine vereist is.
### 1.2 Communicatie en vragen
Duidelijke communicatiekanalen zijn essentieel voor een soepel verloop van de cursus.
#### 1.2.1 Vragen stellen
Er wordt onderscheid gemaakt tussen verschillende soorten vragen:
* **Inhoudelijke vragen:** Vragen over de cursusinhoud, zoals de oefeningen. Deze kunnen gesteld worden via het discussieplatform op CANVAS.
* **Praktische vragen:** Vragen over logistieke aspecten, zoals het lessenrooster. Deze kunnen eveneens via het discussieplatform op CANVAS worden gesteld.
* **Persoonlijke vragen:** Vragen die betrekking hebben op individuele omstandigheden, zoals ziekte of studietrajecten. Deze dienen per e-mail aan het statistiekteam te worden gestuurd.
#### 1.2.2 Communicatiekanalen
* **Discussieplatform op CANVAS:** Voor algemene inhoudelijke en praktische vragen.
* **E-mail aan het statistiekteam:** Voor persoonlijke vragen. Het is cruciaal om altijd het hele team in 'cc' te zetten.
* **Tijdens hoorcolleges en werkcolleges:** Studenten kunnen direct vragen stellen aan Professor Theuns of de begeleidende assistent.
#### 1.2.3 Opvolging van vragen
Vragen worden gedurende de hele lessenreeks opgevolgd. Na afloop van de lessenreeks is er een finale Q&A sessie tijdens de blokperiode om laatste vragen te beantwoorden.
### 1.3 Contactpersonen statistiekteam
* **Alyson Staels:** Alyson.Staels@vub.be
* Kantooruren: op afspraak via mail
* Kantoor: C3.12
* **Alain Isaac:** Alain.Isaac@vub.be
* Kantooruren: op afspraak via mail
* Kantoor: C3.19
* **Jeroen Frans:** Jeroen.Frans@vub.be
* Kantooruren: op afspraak via mail
* Kantoor: C3.19
### 1.4 Significantietoetsen: De z-toets en Power
Dit deel van de cursus introduceert het concept van significantietoetsen, met specifieke aandacht voor de z-toets en de rol van power.
#### 1.4.1 Stappenplan voor significantietoetsen
Elke significantietoets volgt een gestructureerd vier-stappenplan:
1. **Formuleer de nulhypothese ($H_0$) en de alternatieve hypothese ($H_A$).**
2. **Bereken de toetsingsgrootheid.**
3. **Bereken de p-waarde (overschrijdingskans) voor de data.**
4. **Formuleer de conclusie (in APA-stijl).**
#### 1.4.2 De z-toets
De z-toets is een specifieke vorm van significantietoetsen die gebruikt wordt onder bepaalde voorwaarden (bv. gekende populatievariantie of grote steekproef).
##### 1.4.2.1 Formuleren van hypothesen voor de z-toets
* **Nulhypothese ($H_0$):** Dit is de stelling die we proberen te weerleggen. Standaardvorm is $H_0: \mu = \mu_0$, waarbij $\mu_0$ een specifieke populatieparameter is.
* **Alternatieve hypothese ($H_A$):** Dit is de stelling die we accepteren als de nulhypothese verworpen wordt. Er zijn drie mogelijke vormen:
* Eenzijdig links: $H_A: \mu < \mu_0$
* Eenzijdig rechts: $H_A: \mu > \mu_0$
* Tweezijdig: $H_A: \mu \neq \mu_0$
##### 1.4.2.2 Berekenen van de toetsingsgrootheid (z-toets)
De toetsingsgrootheid voor de z-toets wordt berekend op basis van de steekproefgegevens en de gespecificeerde nulhypothese. De precieze formule is afhankelijk van het type data en de specifieke context, maar de algemene vorm relateert het verschil tussen de steekproefstatistiek en de hypothetische populatieparameter aan de standaardfout.
##### 1.4.2.3 Berekenen van de p-waarde (overschrijdingskans)
De p-waarde is de kans om de geobserveerde steekproefresultaten (of extremere resultaten) te verkrijgen, *aangenomen dat de nulhypothese waar is*.
##### 1.4.2.4 Formuleren van de conclusie (APA-stijl)
De conclusie wordt getrokken door de berekende p-waarde te vergelijken met het vooraf bepaalde significantieniveau ($\alpha$).
* **Als $p \le \alpha$:** De nulhypothese wordt verworpen. Er is voldoende bewijs om te stellen dat de alternatieve hypothese ($H_A$) waar is. Dit wordt gerapporteerd met de geobserveerde toetsingsgrootheid en p-waarde (bv. $z = z_{observed}$, $p = p_{observed}$).
* **Als $p > \alpha$:** De nulhypothese wordt aanvaard (of preciezer: er is onvoldoende bewijs om deze te verwerpen). Er is onvoldoende bewijs om te stellen dat de alternatieve hypothese ($H_A$) waar is. Dit wordt eveneens gerapporteerd met de geobserveerde waarden (bv. $z = z_{observed}$, $p = p_{observed}$).
> **Tip:** Het significantieniveau ($\alpha$) is typisch ingesteld op 0.05 (vijf procent).
#### 1.4.3 Kritische z-waarden
Kritische z-waarden worden gebruikt om de beslissingsregel direct te kunnen toepassen zonder de p-waarde expliciet te berekenen. Deze waarden zijn terug te vinden in standaard z-tabellen (Tabel D of af te leiden uit Tabel A).
#### 1.4.4 Type I en Type II fouten
Bij het nemen van beslissingen in significantietoetsen kunnen er twee soorten fouten optreden:
* **Type I fout ( $\alpha$ ):** Het verwerpen van de nulhypothese terwijl deze in werkelijkheid waar is. De kans hierop is gelijk aan het significantieniveau $\alpha$.
* **Type II fout ( $\beta$ ):** Het aanvaarden van de nulhypothese terwijl deze in werkelijkheid onwaar is. De kans hierop wordt aangeduid met $\beta$.
##### 1.4.4.1 Metafoor van de kelder
De metafoor van de kelder illustreert de concepten van Type I en Type II fouten en power:
* Stel je voor dat je zoekt naar een bal in de kelder.
* **Situatie:** De bal is niet in de kelder ($H_0$ is waar).
* **Type I fout:** Je zoekt, vindt de bal niet, en concludeert dat hij er niet is (correct). Maar als je toch concluderer dat de bal er is (terwijl hij er niet is), heb je een Type I fout gemaakt.
* **Situatie:** De bal is wel in de kelder ($H_0$ is onwaar).
* **Type II fout:** Je zoekt, vindt de bal niet, en concludeert dat hij er niet is (fout). Je hebt de bal gemist terwijl hij er wel was.
#### 1.4.5 Power van een test
Power is de kans om correct de nulhypothese te verwerpen wanneer deze onwaar is. Het is dus $1 - \beta$.
* **Metafoor van de kelder en Power:** Als de bal wel in de kelder is, wat is de kans dat je kind de bal zou gevonden hebben? Deze kans wordt beïnvloed door:
* **Hoe lang heeft kind gezocht?** Dit correspondeert met de **steekproefgrootte**. Een grotere steekproef vergroot de kans op detectie.
* **Hoe groot is de bal?** Dit correspondeert met de **effectgrootte**. Grotere effecten zijn makkelijker te detecteren.
* **Hoeveel rommel ligt er in de kelder?** Dit correspondeert met de **standaarddeviatie** (variabiliteit) van de data. Meer variabiliteit bemoeilijkt detectie.
#### 1.4.6 Factoren die de power beïnvloeden
Om een zinvolle poweranalyse te kunnen doen, moeten we vastleggen hoe groot het effect is dat we wensen te detecteren. Dit kan op basis van twee criteria:
1. **Domeinkennis:** Wat is op basis van expertise als een substantieel of zinvol verschil te beschouwen? Bijvoorbeeld, als IQ-scores altijd op gehele getallen worden afgerond, is een verschil van minder dan 1 punt mogelijk niet zinvol om te detecteren.
2. **Gestandaardiseerde effectgroottes:** Algemene poweranalyses maken vaak gebruik van gestandaardiseerde effectgroottes (bv. z-scores). Gangbare interpretaties zijn:
* $0.2$: klein effect
* $0.5$: gemiddeld effect
* $0.8$: groot effect
#### 1.4.7 Relatie tussen effectgrootte en power
* Hoe groter het gewenste (of verwachte) effect, hoe meer onderscheidend vermogen (power) de test zal hebben. Kleine effecten zijn moeilijker te detecteren en vereisen meer power (of een grotere steekproef) om ze met voldoende zekerheid te kunnen vaststellen.
#### 1.4.8 Voorbeelden van powerberekeningen (Oefening 4A, 4B, 4C, 5, 6, 7)
De oefeningen in dit gedeelte demonstreren hoe de power van een test wordt berekend of hoe de benodigde steekproefgrootte wordt bepaald om een gewenste power te bereiken bij een bepaald significantieniveau en effectgrootte.
**Voorbeeld (gebaseerd op Oefening 7):**
Een arbeidspsycholoog onderzoekt of stressniveaus in de publieke sector lager zijn dan in de rest van het land. De populatiegemiddelde stress-score is 150 met een standaardafwijking van 20. De psycholoog wil een effectgrootte van 10 punten kunnen detecteren als substantieel verschil. De vraag is hoe groot de steekproef moet zijn om de kans op een Type I fout te beperken tot 5% ($\alpha = 0.05$) en een onderscheidingsvermogen van 80% ($1 - \beta = 0.80$) te behouden. Hierbij worden de formele berekeningen met z-scores en de bijbehorende kritische waarden toegepast om de benodigde steekproefgrootte te bepalen.
* **$H_0: \mu \ge 150$** (stressniveau is niet lager)
* **$H_A: \mu < 150$** (stressniveau is lager)
* Gewenste effectgrootte: 10 punten.
* $\alpha = 0.05$.
* Gewenste power = $0.80$, dus $\beta = 0.20$.
Door de formules voor de z-toets en de relatie tussen $\alpha$, $\beta$, steekproefgrootte en effectgrootte te gebruiken, kan de vereiste steekproefgrootte berekend worden.
##### 1.4.8.1 Schematische weergave van toetsingsvariabelen
Bij het analyseren van hypothesen en de bijbehorende kritische waarden, wordt vaak een schematische weergave gebruikt:
* $H_0$: Nulhypothese
* $H_A$: Alternatieve hypothese
* $\mu_0$: De populatieparameter onder de nulhypothese
* $\mu_A$: De populatieparameter onder de alternatieve hypothese (het te detecteren effect)
* Kritieke waarde: De grens die bepaalt of de nulhypothese wordt verworpen.
---
# Significantietoetsen en de z-toets
Dit deel behandelt de vier kernstappen van significantietoetsen, met een specifieke focus op de z-toets, inclusief het formuleren van hypothesen, het berekenen van toetsingsgrootheden en p-waarden, en het trekken van conclusies in APA-stijl.
### 2.1 Het proces van significantietoetsen
Significantietoetsen volgen een gestandaardiseerd vierstappenplan om te bepalen of waargenomen data voldoende bewijs leveren om een hypothese te verwerpen.
#### 2.1.1 De vier stappen van significantietoetsen
1. **Formuleer de nul- ($H_0$) en alternatieve ($H_A$) hypothesen:** Dit omvat het definiëren van de te toetsen stelling en de mogelijke afwijking daarvan.
2. **Bereken de toetsingsgrootheid:** Dit is een waarde berekend uit de steekproefdata die de mate van afwijking van de nulhypothese samenvat.
3. **Bereken de p-waarde (overschrijdingskans) voor de data:** Dit is de kans om een toetsingsgrootheid te observeren die minstens zo extreem is als de waargenomen waarde, aangenomen dat de nulhypothese waar is.
4. **Formuleer een conclusie (APA-stijl):** Op basis van de p-waarde en het significantieniveau ($\alpha$), wordt besloten of de nulhypothese verworpen kan worden.
### 2.2 De z-toets
De z-toets is een specifieke vorm van significantietoetsing die gebruikt wordt wanneer de populatiestandaarddeviatie bekend is of wanneer de steekproefgrootte groot genoeg is om de steekproeven-verdeling van het gemiddelde te benaderen met een normale verdeling.
#### 2.2.1 Formuleren van hypothesen voor de z-toets
* **Nulhypothese ($H_0$):** Stelt dat er geen effect is of dat het populatiegemiddelde gelijk is aan een specifieke waarde. Deze wordt meestal genoteerd als:
$H_0: \mu = \mu_0$
Hierin is $\mu$ het populatiegemiddelde en $\mu_0$ de hypothetische waarde onder de nulhypothese.
* **Alternatieve hypothese ($H_A$):** Stelt dat er wel een effect is. Er zijn drie mogelijke vormen:
* **Eenzijdige toets (linkszijdig):** Het populatiegemiddelde is kleiner dan de hypothetische waarde.
$H_A: \mu < \mu_0$
* **Eenzijdige toets (rechtszijdig):** Het populatiegemiddelde is groter dan de hypothetische waarde.
$H_A: \mu > \mu_0$
* **Tweezijdige toets:** Het populatiegemiddelde is niet gelijk aan de hypothetische waarde.
$H_A: \mu \neq \mu_0$
#### 2.2.2 Berekenen van de toetsingsgrootheid (z-waarde)
De z-toetsingsgrootheid wordt berekend met de volgende formule, waarbij de steekproefdata wordt vergeleken met de hypothetische populatiewaarde, rekening houdend met de spreiding in de populatie:
$$z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{n}}$$
Hierin is:
* $\bar{x}$: het steekproefgemiddelde.
* $\mu_0$: het hypothetische populatiegemiddelde onder $H_0$.
* $\sigma$: de populatiestandaarddeviatie.
* $n$: de steekproefgrootte.
#### 2.2.3 Berekenen van de p-waarde
De p-waarde is de kans om een steekproefgemiddelde te verkrijgen dat, gegeven dat $H_0$ waar is, net zo extreem of extremer is dan het waargenomen steekproefgemiddelde. Deze waarde wordt bepaald aan de hand van de z-verdeling en het type toets (eenzijdig of tweezijdig).
#### 2.2.4 Formuleren van de conclusie (APA-stijl)
De conclusie wordt getrokken door de berekende p-waarde te vergelijken met een vooraf bepaald significantieniveau ($\alpha$), meestal ingesteld op 0.05.
* **Als $p \leq \alpha$:** De nulhypothese ($H_0$) wordt verworpen. Dit betekent dat er voldoende statistisch bewijs is om te stellen dat de alternatieve hypothese ($H_A$) ondersteund wordt. De conclusie wordt genoteerd in APA-stijl, inclusief de berekende z-waarde en p-waarde.
> **Voorbeeld APA-conclusie (verwerpen $H_0$):** "Er werd voldoende bewijs gevonden om te stellen dat het gemiddelde stressniveau lager is dan 150, $z$ = -2.50, $p$ < .001."
* **Als $p > \alpha$:** De nulhypothese ($H_0$) wordt aanvaard (of, preciezer, niet verworpen). Dit betekent dat er onvoldoende statistisch bewijs is om de nulhypothese te verwerpen en dus de alternatieve hypothese te ondersteunen.
> **Voorbeeld APA-conclusie (niet verwerpen $H_0$):** "Er werd onvoldoende bewijs gevonden om te stellen dat het gemiddelde stressniveau afwijkt van 150, $z$ = 1.20, $p$ = .23."
#### 2.2.5 Kritische z-waarden
Kritische z-waarden zijn de grenswaarden op de z-verdeling die de verwerpingsregio's definiëren. Ze worden bepaald door het significantieniveau ($\alpha$) en het type toets (eenzijdig of tweezijdig). Deze waarden kunnen worden afgeleid uit de standaard normale verdelingstabel (Tabel A) of specifieke tabellen voor kritische z-waarden (Tabel D).
### 2.3 Type I en Type II fouten
Bij het toetsen van hypothesen kunnen twee soorten fouten worden gemaakt:
* **Type I fout:** Het verwerpen van de nulhypothese ($H_0$) terwijl deze in werkelijkheid waar is. De kans op een Type I fout wordt gelijkgesteld aan het significantieniveau ($\alpha$).
* **Type II fout:** Het niet verwerpen van de nulhypothese ($H_0$) terwijl deze in werkelijkheid onwaar is. De kans op een Type II fout wordt aangeduid met $\beta$.
#### 2.3.1 Power van een toets
De power van een statistische toets is de kans om een werkelijk bestaand effect te detecteren, oftewel de kans om de nulhypothese correct te verwerpen wanneer deze onwaar is. De power wordt berekend als $1 - \beta$.
> **Tip:** Een hogere power betekent een kleinere kans op een Type II fout. Om de power te verhogen, kan men de steekproefgrootte vergroten, de effectgrootte vergroten, of het significantieniveau ($\alpha$) verhogen (hoewel dit de kans op een Type I fout vergroot).
#### 2.3.2 Factoren die de power beïnvloeden
* **Steekproefgrootte ($n$):** Een grotere steekproef vergroot de power, omdat dit leidt tot een kleinere standaardfout van het gemiddelde en dus een betere precisie.
* **Effectgrootte:** De magnitude van het effect dat men probeert te detecteren. Grotere effecten zijn gemakkelijker te detecteren, wat leidt tot hogere power. Effectgroottes kunnen domeinspecifiek zijn (bv. een verschil van 10 punten op een schaal) of gestandaardiseerd (bv. z-scores zoals 0.2 voor klein, 0.5 voor gemiddeld, 0.8 voor groot).
* **Standaarddeviatie ($\sigma$):** Een kleinere standaarddeviatie vergroot de power, omdat dit betekent dat de data minder verspreid is.
* **Significantieniveau ($\alpha$):** Een hoger significantieniveau (bv. $\alpha = 0.10$ in plaats van $\alpha = 0.05$) vergroot de power, maar verhoogt ook de kans op een Type I fout.
#### 2.3.3 Vastleggen van de gewenste effectgrootte
Voor een zinvolle poweranalyse moet de onderzoeker specificeren hoe groot het effect moet zijn om als substantieel te worden beschouwd. Dit kan gebaseerd zijn op:
* **Domeinkennis:** Wat is praktisch significant of zinvol binnen het onderzoeksveld?
* **Gestandaardiseerde effectgroottes:** Gebruik van algemeen aanvaarde richtlijnen voor kleine, gemiddelde en grote effecten.
### 2.4 Voorbeelden van berekeningen en toepassingen
De gegeven documentatie bevat diverse oefeningen die illustreren hoe de stappen van significantietoetsen, specifiek met de z-toets, worden toegepast. Deze oefeningen behandelen onder andere het formuleren van hypothesen, het berekenen van toetsingsgrootheden en p-waarden, en het uitvoeren van poweranalyses om de benodigde steekproefgrootte te bepalen voor een gewenst onderscheidingsvermogen en een beperkte kans op een Type I fout.
> **Voorbeeld oefening (schematisch):** Een onderzoeker wil nagaan of stressniveaus in de publieke sector lager zijn dan gemiddeld (populatiegemiddelde = 150, standaarddeviatie = 20). De gewenste detecteerbare effectgrootte is 10 punten. Met $\alpha = 0.05$ en een gewenste power van 80% (dus $\beta = 0.20$), wordt de benodigde steekproefgrootte berekend. Dit illustreert de praktische toepassing van poweranalyse om een studie adequaat te ontwerpen.
---
# Type I en Type II fouten en poweranalyse
Deze sectie introduceert de concepten van Type I en Type II fouten en legt uit hoe poweranalyse kan worden toegepast om de kans op deze fouten te beperken, waarbij factoren zoals effectgrootte en steekproefgrootte worden belicht.
### 3.1 Significantietoetsen en fouten
Significantietoetsen zijn een fundamenteel onderdeel van statistische inferentie, waarbij we proberen te beslissen tussen een nulhypothese ($H_0$) en een alternatieve hypothese ($H_A$). Bij dit proces kunnen echter fouten optreden.
#### 3.1.1 Type I fout
Een Type I fout, ook wel bekend als een vals positief, treedt op wanneer de nulhypothese ($H_0$) ten onrechte wordt verworpen, terwijl deze in werkelijkheid waar is. De kans op een Type I fout wordt aangeduid met de Griekse letter $\alpha$. Dit is het significantieniveau dat de onderzoeker van tevoren vaststelt, meestal op $0.05$ (of 5%).
> **Tip:** $\alpha$ is de kans op een Type I fout, de kans om een effect te vinden wanneer er in werkelijkheid geen effect is.
#### 3.1.2 Type II fout
Een Type II fout, ook wel een vals negatief, treedt op wanneer de nulhypothese ($H_0$) ten onrechte niet wordt verworpen, terwijl de alternatieve hypothese ($H_A$) in werkelijkheid waar is. De kans op een Type II fout wordt aangeduid met de Griekse letter $\beta$.
> **Tip:** $\beta$ is de kans op een Type II fout, de kans om geen effect te vinden wanneer er in werkelijkheid wel een effect is.
### 3.2 Poweranalyse
Poweranalyse is een methode die wordt gebruikt om het onderscheidingsvermogen van een statistische test te bepalen. Het onderscheidingsvermogen, of de "power" van een test, is de kans om een werkelijk bestaand effect correct te detecteren. Mathematisch wordt de power berekend als $1 - \beta$. Een hogere power betekent een lagere kans op een Type II fout.
> **Tip:** Power ($1 - \beta$) is de kans om een werkelijk bestaand effect te vinden.
#### 3.2.1 Factoren die de power beïnvloeden
De power van een statistische test wordt beïnvloed door verschillende factoren:
* **Effectgrootte:** De grootte van het effect dat de onderzoeker wenst te detecteren. Grotere effecten zijn gemakkelijker te detecteren, wat leidt tot hogere power. De effectgrootte kan worden bepaald op basis van domeinkennis (wat als een substantieel verschil wordt beschouwd) of gestandaardiseerde effectgroottes (zoals $z$-scores, waarbij typisch $0.2$ als klein, $0.5$ als gemiddeld en $0.8$ als groot effect wordt beschouwd).
* **Steekproefgrootte:** Een grotere steekproefgrootte verhoogt doorgaans de power van een test. Met meer data is er meer informatie beschikbaar om de nulhypothese te toetsen en kleine, maar reële effecten te detecteren.
* **Significantieniveau ($\alpha$):** Een hoger significantieniveau (bijvoorbeeld $\alpha = 0.10$ in plaats van $\alpha = 0.05$) verhoogt de power, maar dit gaat ten koste van een grotere kans op een Type I fout.
* **Standaarddeviatie:** Een kleinere standaarddeviatie (variantie) in de populatie leidt tot hogere power, omdat de data dan minder verspreid zijn en de effecten duidelijker zichtbaar zijn.
#### 3.2.2 Het vastleggen van de gewenste effectgrootte
Om een zinvolle poweranalyse te kunnen uitvoeren, is het cruciaal om de grootte van het effect dat men wenst te detecteren, vast te leggen. Dit kan op twee manieren:
1. **Domeinkennis:** Wat is praktisch of theoretisch significant? Bijvoorbeeld, als een IQ-score altijd op gehele getallen wordt afgerond, is een verschil van minder dan één punt mogelijk niet relevant.
2. **Gestandaardiseerde effectgroottes:** Algemene poweranalyses maken vaak gebruik van gestandaardiseerde effectgroottes, uitgedrukt in $z$-scores. Gangbare interpretaties zijn:
* Kleine effectgrootte: $0.2$
* Gemiddelde effectgrootte: $0.5$
* Grote effectgrootte: $0.8$
#### 3.2.3 Toepassing van poweranalyse
Poweranalyse wordt gebruikt om de benodigde steekproefgrootte te berekenen voor een gewenst niveau van power en significantie, gegeven een bepaalde effectgrootte. Dit helpt onderzoekers om te zorgen dat hun studie voldoende "krachtig" is om een potentieel bestaand effect te detecteren, zonder onnodig grote steekproeven te gebruiken.
> **Voorbeeld:** Een arbeidspsycholoog onderzoekt of stressniveaus in de publieke sector lager zijn dan elders. De gemiddelde stressscore in de populatie is $150$ met een standaardafwijking van $20$. De onderzoeker wil een effectgrootte van $10$ punten detecteren met een power van $80\%$ en een $\alpha$ van $5\%$. De poweranalyse zal vervolgens de benodigde steekproefgrootte berekenen om dit te realiseren.
### 3.3 Illustratieve voorbeelden van fouten en power
De concepten van Type I en Type II fouten kunnen worden geïllustreerd met een metafoor. Stel je voor dat je zoekt naar een bal in een kelder.
* **Situatie:** De bal is mogelijk wel of niet in de kelder. Je probeert dit te onderzoeken.
* **Type I fout:** Je concludeert dat de bal *wel* in de kelder is, terwijl hij er in werkelijkheid *niet* is. Dit is een vals alarm.
* **Type II fout:** Je concludeert dat de bal *niet* in de kelder is, terwijl hij er in werkelijkheid *wel* is. Je hebt de bal gemist.
* **Power:** De kans dat je de bal vindt, *gegeven dat de bal er daadwerkelijk is*. Dit hangt af van hoe goed je zoekt (steekproefgrootte/zoekinspanning), hoe groot de bal is (effectgrootte) en hoe opgeruimd de kelder is (standaarddeviatie).
#### 3.3.1 Relatie tussen $\alpha$, $\beta$ en Power
Er bestaat een inherente afweging tussen Type I en Type II fouten. Het verlagen van de kans op een Type I fout (kleinere $\alpha$) leidt vaak tot een verhoging van de kans op een Type II fout (grotere $\beta$, lagere power), tenzij de steekproefgrootte wordt vergroot. Omgekeerd verhoogt een grotere $\alpha$ de power, maar ook de kans op een vals positief.
> **Tip:** Een kleine $\alpha$ beschermt tegen het ten onrechte verwerpen van $H_0$ (Type I fout), maar maakt het moeilijker om een werkelijk bestaand effect te detecteren (lage power, hoge kans op Type II fout). Een grotere $\alpha$ verhoogt de power, maar vergroot de kans op een Type I fout. De keuze van $\alpha$ hangt af van de consequenties van beide soorten fouten in een specifieke context.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Univariate data-analyse | Een statistische techniek die zich richt op het analyseren van één enkele variabele tegelijkertijd om patronen, trends en relaties te begrijpen binnen die variabele. Dit omvat het berekenen van beschrijvende statistieken zoals gemiddelde, mediaan en standaardafwijking. |
| Significantietoetsen | Een statistische methode die wordt gebruikt om te bepalen of de resultaten van een studie significant genoeg zijn om te concluderen dat ze niet door toeval zijn ontstaan. Dit proces omvat het formuleren van hypothesen, het berekenen van een toetsingsgrootheid en het interpreteren van de p-waarde. |
| Nulhypothese (H\textsubscript{0}) | De hypothese die stelt dat er geen significant verschil of geen effect is tussen de onderzochte groepen of variabelen. Het is de standaard aanname die wordt getest. |
| Alternatieve hypothese (H\textsubscript{A}) | De hypothese die stelt dat er wel een significant verschil of effect is. Dit is de hypothese die men hoopt te ondersteunen met de data. |
| Toetsingsgrootheid | Een statistische waarde die wordt berekend uit steekproefgegevens en wordt gebruikt om te bepalen of de nulhypothese verworpen moet worden. Voor de z-toets is dit de z-score. |
| p-waarde (overschrijdingskans) | De waarschijnlijkheid om een resultaat te observeren dat minstens zo extreem is als het waargenomen resultaat, ervan uitgaande dat de nulhypothese waar is. Een lage p-waarde suggereert dat het waargenomen resultaat onwaarschijnlijk is onder de nulhypothese. |
| APA-stijl | Een set richtlijnen voor academisch schrijven die zorgen voor consistentie in de presentatie van onderzoeksresultaten, inclusief de manier waarop statistische conclusies worden geformuleerd. |
| Kritische z-waarde | Een drempelwaarde die wordt gebruikt bij een z-toets. Als de berekende toetsingsgrootheid groter is dan de kritische waarde (in absolute zin), wordt de nulhypothese verworpen. |
| Type I fout | Het verwerpen van de nulhypothese wanneer deze in werkelijkheid waar is. Dit staat ook bekend als een "vals positief". De kans hierop wordt aangeduid met $\alpha$. |
| Type II fout | Het niet verwerpen van de nulhypothese wanneer deze in werkelijkheid onwaar is. Dit staat ook bekend als een "vals negatief". De kans hierop wordt aangeduid met $\beta$. |
| Power (onderscheidingsvermogen) | De kans dat een statistische test de nulhypothese correct verwerpt wanneer deze onwaar is. Het is gelijk aan 1 - $\beta$, en vertegenwoordigt de kans om een werkelijk bestaand effect te detecteren. |
| Effectgrootte | Een maat voor de omvang van een effect of het verschil tussen groepen, onafhankelijk van de steekproefgrootte. Het kwantificeert de praktische significantie van een resultaat. |
| Gestandaardiseerde effectgrootte | Een maat voor effectgrootte die wordt uitgedrukt in termen van standaarddeviaties, waardoor vergelijkingen tussen verschillende studies en metingen mogelijk worden. Voorbeelden zijn Cohen's d. |
| Steekproefgrootte | Het aantal observaties of deelnemers in een studie. Een grotere steekproefgrootte verhoogt over het algemeen de power van een onderzoek. |