Cover
Inizia ora gratuitamente Oplossingen WC 2.pptx
Summary
# Betrouwbaarheidsintervallen
Een betrouwbaarheidsinterval biedt een bereik van waarden waarbinnen de werkelijke populatieparameter waarschijnlijk ligt, met een gespecificeerd niveau van zekerheid.
### 1.1 Wat is een betrouwbaarheidsinterval?
Een betrouwbaarheidsinterval is een schatting van een populatieparameter gebaseerd op een steekproefstatistiek. Het wordt weergegeven als een interval van waarden, met een bijbehorend betrouwbaarheidsniveau (meestal 95%). Dit niveau drukt de mate van zekerheid uit dat het interval de werkelijke populatieparameter bevat.
### 1.2 Het concept van betrouwbaarheidsintervallen
Het idee achter een betrouwbaarheidsinterval is om de onzekerheid die gepaard gaat met het schatten van een populatieparameter uit een steekproef te kwantificeren. In plaats van één puntenschatting te geven, bieden we een bereik.
### 1.3 Hoe wordt een betrouwbaarheidsinterval afgebakend?
De afbakening van een betrouwbaarheidsinterval, bijvoorbeeld een 95% betrouwbaarheidsinterval, is gebaseerd op de Z-transformatie van de steekproevenverdeling van het gemiddelde.
* **Z-scores:** Voor een 95% betrouwbaarheidsniveau weten we dat ongeveer 95% van de Z-scores binnen de normale verdeling ligt tussen -1.96 en +1.96.
* **Relatie met de steekproevenverdeling:** Deze Z-scores kunnen worden omgezet naar een bereik voor het populatiegemiddelde. Dit betekent dat we met 95% zekerheid kunnen stellen dat het populatiegemiddelde binnen dit specifieke interval ligt.
De formule voor een betrouwbaarheidsinterval voor het populatiegemiddelde ($\mu$) wordt gegeven door:
$$ \text{Betrouwbaarheidsinterval} = \bar{x} \pm Z_{\alpha/2} \times \frac{\sigma}{\sqrt{n}} $$
Waarbij:
* $\bar{x}$ het steekproefgemiddelde is.
* $Z_{\alpha/2}$ de Z-score is die overeenkomt met het gewenste betrouwbaarheidsniveau (bijvoorbeeld 1.96 voor 95% betrouwbaarheid, wat correspondeert met $\alpha = 0.05$ en $\alpha/2 = 0.025$).
* $\sigma$ de populatiestandaarddeviatie is.
* $n$ de steekproefgrootte is.
Als de populatiestandaarddeviatie ($\sigma$) niet bekend is, wordt deze geschat met de steekproefstandaarddeviatie ($s$). In dat geval, vooral bij kleinere steekproeven ($n < 30$), wordt de t-verdeling gebruikt in plaats van de Z-verdeling, wat leidt tot een t-interval. De formule wordt dan:
$$ \text{Betrouwbaarheidsinterval} = \bar{x} \pm t_{\alpha/2, df} \times \frac{s}{\sqrt{n}} $$
Waarbij:
* $t_{\alpha/2, df}$ de t-score is met $df = n-1$ vrijheidsgraden die overeenkomt met het gewenste betrouwbaarheidsniveau.
* $s$ de steekproefstandaarddeviatie is.
### 1.4 Oefeningen en oplossingen
**Oefening 1:**
Van een steekproef jongeren tussen de 14 en de 16 jaar ($N = 215$) is het gemiddeld aantal minuten sport op een dag gelijk aan 72 met een standaarddeviatie van 15. Wat is het 95% betrouwbaarheidsinterval voor het gemiddelde aantal minuten sport op een dag?
* **Gegeven:**
* $n = 215$
* $\bar{x} = 72$
* $s = 15$
* Betrouwbaarheidsniveau = 95%, dus $Z_{\alpha/2} = 1.96$ (aangezien $n$ groot is, kunnen we de Z-verdeling benaderen).
* **Berekening:**
$$ \text{Standaardfout} = \frac{s}{\sqrt{n}} = \frac{15}{\sqrt{215}} \approx \frac{15}{14.66} \approx 1.023 $$
$$ \text{Foutmarge} = Z_{\alpha/2} \times \text{Standaardfout} = 1.96 \times 1.023 \approx 2.005 $$
$$ \text{Betrouwbaarheidsinterval} = \bar{x} \pm \text{Foutmarge} = 72 \pm 2.005 $$
$$ \text{Interval} = [69.995, 74.005] $$
* **Oplossing:** Het 95% betrouwbaarheidsinterval voor het gemiddeld aantal minuten sport op een dag is van ongeveer 70.0 tot 74.0 minuten.
**Oefening 2:**
Bij een steekproef van studenten in het eerste jaar toegepaste psychologie ($N = 103$) is de gemiddelde score voor positieve stemming gelijk aan 65 met een standaarddeviatie van 5. Wat is het 95% betrouwbaarheidsinterval voor de gemiddelde score op positieve stemming bij studenten van het 1ste jaar toegepaste psychologie.
* **Gegeven:**
* $n = 103$
* $\bar{x} = 65$
* $s = 5$
* Betrouwbaarheidsniveau = 95%, dus $Z_{\alpha/2} = 1.96$.
* **Berekening:**
$$ \text{Standaardfout} = \frac{s}{\sqrt{n}} = \frac{5}{\sqrt{103}} \approx \frac{5}{10.15} \approx 0.493 $$
$$ \text{Foutmarge} = Z_{\alpha/2} \times \text{Standaardfout} = 1.96 \times 0.493 \approx 0.966 $$
$$ \text{Betrouwbaarheidsinterval} = \bar{x} \pm \text{Foutmarge} = 65 \pm 0.966 $$
$$ \text{Interval} = [64.034, 65.966] $$
* **Oplossing:** Het 95% betrouwbaarheidsinterval voor de gemiddelde score op positieve stemming is van ongeveer 64.0 tot 66.0.
**Oefening 3:**
Bij een steekproef van rokers ($N = 101$) die willen stoppen is het gemiddeld aantal sigaretten dat er gerookt wordt gelijk aan 15 met een standaarddeviatie van 2. Wat is het 95% betrouwbaarheidsinterval voor het gemiddeld aantal sigaretten per dag dat een roker rookt.
* **Gegeven:**
* $n = 101$
* $\bar{x} = 15$
* $s = 2$
* Betrouwbaarheidsniveau = 95%, dus $Z_{\alpha/2} = 1.96$.
* **Berekening:**
$$ \text{Standaardfout} = \frac{s}{\sqrt{n}} = \frac{2}{\sqrt{101}} \approx \frac{2}{10.05} \approx 0.199 $$
$$ \text{Foutmarge} = Z_{\alpha/2} \times \text{Standaardfout} = 1.96 \times 0.199 \approx 0.390 $$
$$ \text{Betrouwbaarheidsinterval} = \bar{x} \pm \text{Foutmarge} = 15 \pm 0.390 $$
$$ \text{Interval} = [14.610, 15.390] $$
* **Oplossing:** Het 95% betrouwbaarheidsinterval voor het gemiddeld aantal sigaretten per dag dat een roker rookt is van ongeveer 14.6 tot 15.4 sigaretten.
> **Tip:** Bij grote steekproeven ($n \ge 30$), is het betrouwbaarheidsinterval berekend met de Z-score een goede benadering, zelfs als de populatiestandaarddeviatie ($\sigma$) onbekend is en door de steekproefstandaarddeviatie ($s$) wordt vervangen. Voor kleinere steekproeven is de t-verdeling noodzakelijk.
> **Tip:** De breedte van het betrouwbaarheidsinterval wordt beïnvloed door het betrouwbaarheidsniveau en de steekproefgrootte. Een hoger betrouwbaarheidsniveau (bv. 99% i.p.v. 95%) resulteert in een breder interval, terwijl een grotere steekproefgrootte ($n$) leidt tot een smaller, preciezer interval.
---
# Hypotheses toetsing
Dit document behandelt het opstellen van hypothesen, zowel eenzijdig als tweezijdig, en introduceert de algemene stappen en het stramien voor hypothesetoetsing.
### 2.1 Hypotheses opstellen
Hypotheses toetsen begint met het formuleren van een nulhypothese ($H_0$) en een alternatieve hypothese ($H_1$). De nulhypothese is een bewering over de populatie die we willen toetsen. De alternatieve hypothese is het tegenovergestelde van de nulhypothese en vertegenwoordigt wat we hopen te vinden of wat de vraagstelling impliceert.
* **Eenzijdige hypothese:** Wordt gebruikt wanneer er een specifieke richting van het effect wordt verwacht (bv. hoger dan, lager dan).
* Rechtseenzijdig: $H_0: \mu \le \mu_0$ en $H_1: \mu > \mu_0$.
* Linkseenzijdig: $H_0: \mu \ge \mu_0$ en $H_1: \mu < \mu_0$.
* **Tweezijdige hypothese:** Wordt gebruikt wanneer er geen specifieke richting van het effect wordt verwacht, alleen een verschil (bv. anders dan).
* $H_0: \mu = \mu_0$ en $H_1: \mu \ne \mu_0$.
#### 2.1.1 Oefeningen hypotheses opstellen
* **Oefening 1:** De gemiddelde hartslag in rust binnen de populatie studenten is gelijk aan 68 slagen per minuut. Je wilt weten of deze hartslag lager is bij studenten die elke dag sporten.
* $H_0: \mu \ge 68$ (De gemiddelde hartslag is gelijk aan of hoger dan 68).
* $H_1: \mu < 68$ (De gemiddelde hartslag is lager dan 68).
* **Oefening 2:** Je wilt onderzoeken of het gevoel van eigenwaarde in een groep kinderen met een gezichtsbeperking verschillend is aan het gevoel van eigenwaarde bij kinderen in het algemeen. Je weet dat in de populatie eigenwaarde normaal verdeeld is met een gemiddelde van 69.
* $H_0: \mu = 69$ (De gemiddelde eigenwaarde is gelijk aan 69).
* $H_1: \mu \ne 69$ (De gemiddelde eigenwaarde is verschillend van 69).
* **Oefening 3:** Je wilt nagaan of kinderen die stotteren een andere mate van angst ervaren in sociale situaties dan het algemeen gemiddelde angstniveau van kinderen. Het gemiddelde angstniveau van kinderen in sociale situaties is gelijk aan 37.
* $H_0: \mu = 37$ (Het gemiddelde angstniveau is gelijk aan 37).
* $H_1: \mu \ne 37$ (Het gemiddelde angstniveau is verschillend van 37).
### 2.2 Hypothesetoetsing (1 populatie)
Hypothesetoetsing is een procedure om te bepalen of er voldoende bewijs is om de nulhypothese te verwerpen ten gunste van de alternatieve hypothese.
#### 2.2.1 Stramien toetsen
Het algemene stramien voor het toetsen van hypothesen omvat de volgende stappen:
1. **Toetsingssituatie:** Bepaal de concrete toetsingssituatie, welke gegevens er beschikbaar zijn en bij welk soort onderzoeksvragen de toets gebruikt wordt.
2. **Voorwaarden:** Controleer of aan de statistische voorwaarden voor de gekozen toets is voldaan.
3. **Hypothesen:** Formuleer de nul- en alternatieve hypothese ($H_0$ en $H_1$).
4. **Toetsingsgrootheid:** Bereken de waarde van de toetsingsgrootheid en bepaal de bijbehorende kansverdeling.
* Formule voor de toetsingsgrootheid.
* Kansverdeling van de toetsingsgrootheid.
5. **Beslissingsregel:** Bepaal of $H_0$ verworpen wordt op basis van overschrijdingskansen (p-waarde) of kritieke waarden.
6. **Effectgrootte:** Evalueer hoe belangrijk het gevonden effect is.
7. **Rapporteren:** Vermeld de resultaten op een correcte manier.
#### 2.2.2 Z-toets (voor het gemiddelde)
De Z-toets wordt gebruikt wanneer de populatiestandaarddeviatie ($\sigma$) bekend is, of wanneer de steekproefgrootte ($N$) zeer groot is ($N \ge 100$) en de steekproefstandaarddeviatie ($s$) gebruikt wordt als schatter voor $\sigma$.
##### 2.2.2.1 Stramien Z-toets
1. **Toetsingssituatie:** Wordt gebruikt om te toetsen of het gemiddelde van een populatie een bepaalde waarde heeft, met bekende $\sigma$ of grote $N$.
2. **Voorwaarden:** De afhankelijke variabele is gemeten op minstens intervalniveau.
3. **Hypothesen:**
* Tweezijdig: $H_0: \mu = \mu_0$, $H_1: \mu \ne \mu_0$.
* Rechtseenzijdig: $H_0: \mu \le \mu_0$, $H_1: \mu > \mu_0$.
* Linkseenzijdig: $H_0: \mu \ge \mu_0$, $H_1: \mu < \mu_0$.
4. **Toetsingsgrootheid:**
* Formule:
$$Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{N}}$$
Indien $\sigma$ niet gekend is en $N \ge 100$, kan $s$ gebruikt worden ter vervanging van $\sigma$.
* Kansverdeling: Standaardnormaalverdeling ($Z \sim N(0,1)$).
5. **Beslissingsregel:**
* Via overschrijdingskansen (p-waarde): Verwerp $H_0$ als $p < \alpha$.
* Via kritieke waarden (bij $\alpha = 0.05$):
* Linkseenzijdig: Verwerp $H_0$ indien $Z_{obs} \le -1.64$.
* Rechtseenzijdig: Verwerp $H_0$ indien $Z_{obs} \ge 1.64$.
* Tweezijdig: Verwerp $H_0$ indien $Z_{obs} \le -1.96$ of $Z_{obs} \ge 1.96$.
De kritieke waarden veranderen bij een andere $\alpha$.
#### 2.2.3 T-toets voor het gemiddelde
De t-toets wordt gebruikt wanneer de populatiestandaarddeviatie ($\sigma$) **niet** bekend is en de steekproefgrootte ($N$) kleiner is dan 30, of wanneer men ervoor kiest om deze toets te gebruiken ongeacht de steekproefgrootte.
##### 2.2.3.1 Stramien T-toets
1. **Toetsingssituatie:** Vraag of het gemiddelde van de populatie waaruit de steekproef afkomstig is, een bepaalde waarde heeft of niet.
2. **Voorwaarden:**
* De afhankelijke variabele is normaal verdeeld in de populatie. Als dit niet het geval is, moet de steekproefgrootte ($N$) groter of gelijk zijn aan 30.
* De afhankelijke variabele is gemeten op minstens interval-niveau (bv. gewicht, IQ-scores, lengte, score op een taak).
3. **Hypothesen:** Zelfde als bij de Z-toets.
* Linkseenzijdig: $H_0: \mu \ge \mu_0$, $H_1: \mu < \mu_0$.
* Rechtseenzijdig: $H_0: \mu \le \mu_0$, $H_1: \mu > \mu_0$.
* Tweezijdig: $H_0: \mu = \mu_0$, $H_1: \mu \ne \mu_0$.
4. **Toetsingsgrootheid:**
* Formule:
$$t = \frac{\bar{x} - \mu_0}{s / \sqrt{N}}$$
Hierin is $s$ de steekproefstandaarddeviatie.
* Kansverdeling: Student t-verdeling.
* Vrijheidsgraden (degrees of freedom, df): $df = N-1$.
5. **Beslissingsregel:**
* Het gebruik van overschrijdingskansen is complexer omdat er voor elke waarde van df een andere t-verdeling is. Daarom wordt de t-toets vaak uitgevoerd met kritieke waarden.
* Via kritieke waarden: Zoek de t-waarde op die hoort bij het significantieniveau $\alpha$ en de berekende $df$.
* Rechtseenzijdig toetsen bij $\alpha = 0.05$ en $df = 14$: Kritieke waarde is 1.761. Verwerp $H_0$ indien de berekende $t$-waarde $\ge 1.761$.
* **Voorbeeld Beslissingsregel:** Als de berekende $t$-waarde $1.81$ is en $df=14$, dan is $1.81 \ge 1.761$, dus wordt $H_0$ verworpen.
##### 2.2.3.2 Rapporteren van de t-toets
Bij het rapporteren van een one-sample t-test worden de volgende elementen vermeld: de uitgevoerde test, de gemiddelde score en standaarddeviatie van de steekproef, de referentiewaarde uit de populatie, de t-waarde met de vrijheidsgraden tussen haakjes, de p-waarde, en de effectgrootte.
* Voorbeeld: "Om na te gaan over de piekergroep meer piekeren dan de algemene bevolking werd een one-sample t-test uitgevoerd. Gemiddeld scoorden de mensen in de piekergroep hoger ($M = 27, SD = 15$) dan de referentiewaarde 20 uit de populatie, $t(14) = 1.81$, $p < .05$, $r = .44$."
#### 2.2.4 Chi-kwadraat ($\chi^2$) toets voor frequenties
De $\chi^2$-toets voor frequenties wordt gebruikt om na te gaan of de geobserveerde frequenties in de steekproef overeenstemmen met de verwachte frequenties op basis van normen of eerder onderzoek. Deze toets is geschikt voor ordinale of nominale variabelen.
##### 2.2.4.1 Stramien $\chi^2$-toets
1. **Toetsingssituatie:** Ga na of de geobserveerde frequenties in de steekproef overeenstemmen met de verwachte frequenties.
* Voorbeeld: Stemmen de frequenties van leesniveaus in een bepaalde school overeen met de frequenties in de algemene bevolking?
2. **Voorwaarden:**
* De categorieën waarvoor de frequenties worden bestudeerd, sluiten elkaar uit.
* $20\%$ of minder van de categorieën heeft een verwachte frequentie kleiner dan 5.
* Geen enkele categorie heeft een verwachte frequentie van minder dan 1.
* Ordinale variabelen worden als nominale variabelen beschouwd.
3. **Hypothesen:** Enkel tweezijdig mogelijk.
* $H_0: \pi_1 = \pi_2 = \dots = \pi_k$ (De populatieproporties zijn gelijk).
* $H_1$: niet $H_0$ (Niet alle populatieproporties zijn gelijk).
* Dit kan ook geformuleerd worden als: $H_0: \pi_1 = \pi_A; \pi_2 = \pi_B; \dots; \pi_k = \pi_K$ en $H_1$: niet $H_0$.
4. **Toetsingsgrootheid:**
* Formule:
$$\chi^2 = \sum \frac{(f_o - f_e)^2}{f_e}$$
Hierin is $f_o$ de geobserveerde frequentie en $f_e$ de verwachte frequentie, en $k$ het aantal categorieën.
* Kansverdeling: $\chi^2$-verdeling met $df = k - 1$.
5. **Beslissingsregels:**
* Overschrijdingskansen zijn moeilijk te tabelleren door de afhankelijkheid van $df$. Daarom wordt voornamelijk gebruik gemaakt van kritieke waarden.
* Zoek de kritieke $\chi^2$-waarde op die hoort bij het significantieniveau $\alpha$ en de berekende $df$.
* **Voorbeeld Beslissingsregel:** Bij $\alpha = 0.05$ en $df=1$ is de kritieke waarde 3.841. Verwerp $H_0$ indien de berekende $\chi^2$-waarde groter is dan de kritieke waarde.
6. **Effectgrootte:** Vaak wordt de effectgrootte $\phi$ gebruikt, die interpreteerbaar is zoals $r$.
7. **Rapporteren:** Vermeld de verwachte en geobserveerde proporties, de $\chi^2$-waarde, de $df$ en de p-waarde.
#### 2.2.5 Onzekerheden bij hypothesetoetsing: Type I en Type II fouten
Bij hypothesetoetsing kunnen twee soorten fouten worden gemaakt:
* **Type I fout:** Het verwerpen van de nulhypothese terwijl deze in werkelijkheid waar is. De kans hierop is gelijk aan het significantieniveau $\alpha$.
* **Oefening 1:** Een klinisch psycholoog verwerpt de nulhypothese (patiënt heeft geen depressie) en accepteert de alternatieve hypothese (patiënt is depressief), terwijl de patiënt in werkelijkheid niet depressief is. Dit is een **Type I fout**.
* **Type II fout:** Het niet verwerpen van de nulhypothese terwijl deze in werkelijkheid onjuist is. De kans hierop wordt aangeduid met $\beta$.
* **Oefening 2:** Een studie concludeert dat een nieuw medicijn geen effect heeft, terwijl het medicijn in werkelijkheid wel effectief is. Dit is een **Type II fout**.
#### 2.2.6 Oefenen met SPSS
SPSS kan gebruikt worden voor het uitvoeren van statistische toetsen zoals de t-toets en de $\chi^2$-toets.
* **Opmerking bij t-toets in SPSS:** SPSS voert standaard een t-toets uit, ook in situaties waar een Z-toets toegestaan zou zijn (omdat de populatiestandaarddeviatie $\sigma$ zelden bekend is). Dit kan leiden tot een lagere power (1-$\beta$), wat betekent dat $H_0$ minder snel verworpen wordt, omdat de staarten van de t-verdeling dikker zijn dan die van de Z-verdeling.
* **Eenzijdig of tweezijdig in SPSS:** SPSS geeft standaard de tweezijdige overschrijdingskans (significantie) weer.
* Voor een éénzijdige overschrijdingskans: deel de getoonde sig. (2-tailed) door 2 en vergelijk dit met $\alpha$.
* Voor een tweezijdige overschrijdingskans: vergelijk de getoonde sig. (2-tailed) direct met $\alpha$.
---
# Verschillende toetsen en hun toepassing
Deze sectie biedt een gedetailleerde uitleg van de Z-toets, T-toets en Chi-kwadraat (X²) toets, inclusief de voorwaarden, formules, beslissingsregels en toepassingen.
### 3.1 Hypothesetoetsing: algemeen stramien
Hypothesetoetsing volgt een gestructureerd proces om conclusies te trekken over populaties op basis van steekproefgegevens.
#### 3.1.1 Het stramien van toetsen
1. **Toetsingssituatie:** Bepaal de concrete situatie, de onderzoeksvraag en het soort onderzoek waarvoor de toets wordt gebruikt. Identificeer de gegevens uit de vraagstelling.
2. **Voorwaarden:** Controleer de statistische voorwaarden die nodig zijn om de gekozen toets correct toe te passen.
3. **Hypothesen:** Formuleer de nulhypothese ($H_0$) en de alternatieve hypothese ($H_1$), afhankelijk van de vraagstelling (eenzijdig of tweezijdig).
4. **Toetsingsgrootheid:** Identificeer de te berekenen grootheid en de bijbehorende kansverdeling. Bereken de waarde van de toetsingsgrootheid met de juiste formule.
5. **Beslissingsregel:** Bepaal wanneer de nulhypothese wordt verworpen, hetzij via overschrijdingskansen (p-waarde) of via kritieke waarden.
6. **Effectgrootte:** Beoordeel de praktische significantie van het gevonden effect.
7. **Rapporteren:** Vermeld de resultaten op een correcte en gestandaardiseerde manier.
#### 3.1.2 De Z-toets
De Z-toets wordt gebruikt om te toetsen of het gemiddelde van een populatie gelijk is aan een specifieke waarde, wanneer de populatiestandaarddeviatie ($\sigma$) bekend is, of wanneer de steekproefgrootte groot is ($N \ge 100$) en de steekproefstandaarddeviatie ($s$) als schatting voor $\sigma$ wordt gebruikt.
**Voorwaarden:**
* De populatie waaruit de steekproef getrokken wordt, is normaal verdeeld OF de steekproefgrootte is groot ($N \ge 100$).
* De afhankelijke variabele is gemeten op minstens intervalniveau.
* De populatiestandaarddeviatie ($\sigma$) is bekend, of $N \ge 100$.
**Hypothesen:**
* Tweezijdig: $H_0: \mu = \mu_0$ vs. $H_1: \mu \ne \mu_0$
* Rechtseenzijdig: $H_0: \mu \le \mu_0$ vs. $H_1: \mu > \mu_0$
* Linkseenzijdig: $H_0: \mu \ge \mu_0$ vs. $H_1: \mu < \mu_0$
**Toetsingsgrootheid:**
De formule voor de Z-toetsingsgrootheid is:
$$ Z = \frac{\bar{x} - \mu_0}{\sigma / \sqrt{N}} $$
Waarin:
* $\bar{x}$ het steekproefgemiddelde is.
* $\mu_0$ de hypothetische populatiegemiddelde is.
* $\sigma$ de populatiestandaarddeviatie is.
* $N$ de steekproefgrootte is.
Als $\sigma$ niet bekend is maar $N \ge 100$, kan $s$ (de steekproefstandaarddeviatie) gebruikt worden:
$$ Z \approx \frac{\bar{x} - \mu_0}{s / \sqrt{N}} $$
**Kansverdeling:**
De toetsingsgrootheid $Z$ volgt een standaardnormaalverdeling (Z-verdeling).
**Beslissingsregel (bij $\alpha = .05$):**
* **Tweezijdig:** Verwerp $H_0$ als $|Z| \ge 1.96$.
* **Rechtseenzijdig:** Verwerp $H_0$ als $Z \ge 1.64$.
* **Linkseenzijdig:** Verwerp $H_0$ als $Z \le -1.64$.
> **Tip:** Bij een andere $\alpha$ (significantieniveau) veranderen de kritieke waarden. Bijvoorbeeld, bij $\alpha = .01$ zijn de kritieke waarden voor een tweezijdige toets $\pm 2.576$.
**Effectgrootte:**
De effectgrootte wordt vaak gerapporteerd om de praktische significantie aan te geven.
**Rapporteren:**
Vermeld de toetsingssituatie, $Z$-waarde, vrijheidsgraden (indien relevant, maar voor Z-toets is dit oneindig, dus vaak niet expliciet vermeld), p-waarde en effectgrootte.
#### 3.1.3 De T-toets
De T-toets wordt gebruikt om te toetsen of het gemiddelde van een populatie gelijk is aan een specifieke waarde, wanneer de populatiestandaarddeviatie ($\sigma$) onbekend is en de steekproefgrootte kleiner is dan 100.
**Voorwaarden:**
* De afhankelijke variabele is normaal verdeeld in de populatie. Als dit niet het geval is, is een steekproefgrootte van $N \ge 30$ vereist (centrale limietstelling).
* De afhankelijke variabele is gemeten op minstens intervalniveau.
* De populatiestandaarddeviatie ($\sigma$) is onbekend.
**Hypothesen:**
De hypothesen zijn identiek aan die van de Z-toets.
**Toetsingsgrootheid:**
De formule voor de T-toetsingsgrootheid is:
$$ t = \frac{\bar{x} - \mu_0}{s / \sqrt{N}} $$
Waarin:
* $\bar{x}$ het steekproefgemiddelde is.
* $\mu_0$ de hypothetische populatiegemiddelde is.
* $s$ de steekproefstandaarddeviatie is.
* $N$ de steekproefgrootte is.
**Kansverdeling:**
De toetsingsgrootheid $t$ volgt een Student t-verdeling, die afhankelijk is van het aantal vrijheidsgraden ($df$).
**Vrijheidsgraden (df):**
Voor de one-sample t-toets geldt: $df = N - 1$.
> **Tip:** Het aantal vrijheidsgraden geeft aan hoeveel onafhankelijke waarden er vrij kunnen variëren bij het schatten van een parameter.
**Beslissingsregel:**
Vanwege de vele t-verdelingen (één voor elke $df$), wordt de beslissing meestal genomen aan de hand van kritieke waarden uit een t-tabel.
* Zoek de kritieke t-waarde op basis van het significantieniveau ($\alpha$) en het aantal vrijheidsgraden ($df$).
* Vergelijk de berekende t-waarde met de kritieke t-waarde. De exacte regel hangt af van de richting van de toets (eenzijdig/tweezijdig).
**Voorbeeld Beslissingsregel (bij $\alpha = .05$ en $df = 14$):**
* Rechtseenzijdig: Verwerp $H_0$ als $t \ge 1.761$.
* Linkseenzijdig: Verwerp $H_0$ als $t \le -1.761$.
* Tweezijdig: Verwerp $H_0$ als $|t| \ge 2.145$.
> **Tip:** SPSS voert vaak een t-toets uit, zelfs als een Z-toets mogelijk zou zijn, omdat de populatiestandaarddeviatie zelden bekend is. Dit leidt tot iets minder onderscheidingsvermogen (kans op terecht verwerpen van $H_0$) omdat de staarten van de t-verdeling dikker zijn dan die van de Z-verdeling.
**Rapporteren:**
Vermeld de toetsingssituatie, t-waarde, vrijheidsgraden ($df$), p-waarde en effectgrootte. Bijvoorbeeld: "$t(df) = waarde$, $p < .05$, $r = waarde$".
#### 3.1.4 De Chi-kwadraat (X²) toets voor frequenties
De Chi-kwadraat toets wordt gebruikt om te bepalen of er een significant verschil is tussen de geobserveerde frequenties in een steekproef en de verwachte frequenties gebaseerd op een theorie, norm of eerdere bevindingen. Deze toets is geschikt voor nominale of ordinale variabelen.
**Toetsingssituatie:**
Gaat na of de geobserveerde frequenties in de steekproef overeenstemmen met de verwachte frequenties. Bijvoorbeeld, stemmen de frequenties van leesniveaus in een klas overeen met de landelijke frequenties?
**Voorwaarden:**
* De categorieën van de variabele moeten elkaar uitsluiten.
* De verwachte frequentie in minder dan 20% van de categorieën mag kleiner zijn dan 5.
* Geen enkele categorie mag een verwachte frequentie kleiner dan 1 hebben.
* Ordinale variabelen worden vaak als nominale variabelen behandeld bij deze toets.
**Hypothesen:**
De Chi-kwadraat toets voor frequenties is altijd tweezijdig.
* $H_0$: De geobserveerde frequenties komen overeen met de verwachte frequenties (bv. $\pi_1 = \pi_2 = \dots = \pi_k$).
* $H_1$: De geobserveerde frequenties komen niet overeen met de verwachte frequenties (niet $H_0$).
**Toetsingsgrootheid:**
De formule voor de Chi-kwadraat toetsingsgrootheid is:
$$ \chi^2 = \sum \frac{(f_o - f_e)^2}{f_e} $$
Waarin:
* $f_o$ de geobserveerde frequenties zijn.
* $f_e$ de verwachte frequenties zijn.
* De som wordt genomen over alle categorieën.
**Kansverdeling:**
De toetsingsgrootheid $\chi^2$ volgt een Chi-kwadraat verdeling, die afhankelijk is van het aantal vrijheidsgraden ($df$).
**Vrijheidsgraden (df):**
Voor de Chi-kwadraat toets voor frequenties geldt: $df = k - 1$, waarbij $k$ het aantal categorieën is.
**Beslissingsregel:**
Net als bij de t-toets, wordt de beslissing meestal genomen aan de hand van kritieke waarden uit een Chi-kwadraat tabel, omdat er voor elke $df$ een aparte verdeling is.
* Zoek de kritieke $\chi^2$-waarde op basis van $\alpha$ en $df$.
* Verwerp $H_0$ als de berekende $\chi^2$-waarde groter is dan de kritieke waarde.
**Voorbeeld Beslissingsregel (bij $\alpha = .05$ en $df = 1$):**
* De kritieke $\chi^2$-waarde is 3.841. Verwerp $H_0$ als $\chi^2 > 3.841$.
**Effectgrootte:**
De effectgrootte, zoals phi ($\phi$), wordt gebruikt om de sterkte van het verband te interpreteren. Phi is interpreteerbaar op dezelfde manier als de correlatiecoëfficiënt $r$.
**Rapporteren:**
Vermeld de toetsingssituatie, de geobserveerde en verwachte frequenties, de $\chi^2$-waarde, het aantal vrijheidsgraden ($df$), de p-waarde en de effectgrootte. Bijvoorbeeld: "$\chi^2(df) = waarde$, $p < .05$, $\phi = waarde$".
### 3.2 Onzekerheden bij hypothesetoetsing
Bij hypothesetoetsing kunnen twee soorten fouten worden gemaakt:
* **Type 1 fout:** Het verwerpen van de nulhypothese ($H_0$) terwijl deze in werkelijkheid waar is. De kans op een Type 1 fout is gelijk aan het significantieniveau $\alpha$.
* **Type 2 fout:** Het niet verwerpen van de nulhypothese ($H_0$) terwijl deze in werkelijkheid onwaar is. De kans op een Type 2 fout wordt aangeduid met $\beta$.
### 3.3 Oefenen met SPSS
SPSS kan worden gebruikt om deze toetsen uit te voeren. Houd rekening met de volgende punten:
* SPSS voert standaard een t-toets uit wanneer de populatiestandaarddeviatie onbekend is. Dit is correct wanneer $\sigma$ niet gekend is.
* De overschrijdingskansen (p-waarden) uit SPSS bij een t-toets zijn doorgaans groter dan bij een Z-toets, wat betekent dat $H_0$ minder snel verworpen zal worden. Dit verhoogt de kans op een Type 2 fout.
* SPSS geeft meestal tweezijdige p-waarden weer (`sig. (2-tailed)`). Voor een eenzijdige toets moet deze waarde worden gedeeld door 2.
* Voor de Chi-kwadraat toets in SPSS kan men de frequentietabellen analyseren om de geobserveerde en verwachte frequenties te verkrijgen en vervolgens de Chi-kwadraat analyse uit te voeren.
---
# Type 1 en Type 2 fouten en SPSS
Dit document behandelt de concepten van Type I en Type II fouten bij hypothesetoetsing en demonstreert de toepassing van statistische toetsen zoals de t-toets en chi-kwadraat (X²) toets in SPSS, met gedetailleerde uitleg van het toetsingsproces.
## 4. Type 1 en type 2 fouten en SPSS
### 4.1 Hypothesetoetsing: het stramien
Het toetsen van hypothesen volgt een gestructureerd proces om conclusies te trekken op basis van steekproefgegevens. Dit stramien bestaat uit de volgende stappen:
1. **Toetsingssituatie:** Bepaal de concrete onderzoeksvraag en welke gegevens beschikbaar zijn. Identificeer het type onderzoeksvraag dat bij de betreffende toets past.
2. **Voorwaarden:** Controleer of aan de statistische voorwaarden voor het gebruik van de gekozen toets is voldaan.
3. **Hypothesen:** Formuleer de nulhypothese ($H_0$) en de alternatieve hypothese ($H_1$) die passen bij de toetsingssituatie en de vraagstelling.
4. **Toetsingsgrootheid:**
* Bereken de waarde van de toetsingsgrootheid met behulp van de specifieke formule voor de toets.
* Identificeer de kansverdeling waartoe deze toetsingsgrootheid behoort (bijvoorbeeld standaardnormaalverdeling, t-verdeling, X²-verdeling).
5. **Beslissingsregel:** Bepaal of de nulhypothese wordt verworpen op basis van overschrijdingskansen (p-waarden) of kritieke waarden, afhankelijk van het gekozen significantieniveau ($\alpha$).
6. **Effectgrootte:** Kwantificeer de grootte van het gevonden effect om de praktische significantie van de resultaten te beoordelen.
7. **Rapporteren:** Vermeld de resultaten van de hypothesetoets op een correcte en volledige manier.
#### 4.1.1 Toetsingsgrootheid en kansverdelingen
Bij de berekening van de toetsingsgrootheid is het cruciaal om de juiste kansverdeling te identificeren:
* **Z-toets:** De toetsingsgrootheid volgt een standaardnormaalverdeling (N(0,1)). Dit is typisch wanneer de populatiestandaarddeviatie ($\sigma$) bekend is. Indien $\sigma$ onbekend is maar de steekproefgrootte groot ($N \ge 100$), kan de steekproefstandaarddeviatie ($s$) gebruikt worden ter vervanging van $\sigma$, wat dan ook leidt tot een benadering met de standaardnormaalverdeling.
* **t-toets:** De toetsingsgrootheid volgt een Student t-verdeling. Dit wordt gebruikt wanneer de populatiestandaarddeviatie ($\sigma$) onbekend is en de steekproefgrootte kleiner is dan 30 (of wanneer de populatieafhankelijke variabele niet normaal verdeeld is en $N < 30$). De t-verdeling is afhankelijk van het aantal vrijheidsgraden ($df$), dat voor de one-sample t-toets wordt berekend als $df = N-1$.
* **X²-toets:** De toetsingsgrootheid volgt een chi-kwadraatverdeling (X²). Deze verdeling is eveneens afhankelijk van het aantal vrijheidsgraden ($df$), dat bij de X²-toets voor frequenties wordt berekend als $df = k-1$, waarbij $k$ het aantal categorieën is.
#### 4.1.2 Beslissingsregels
De beslissing om $H_0$ te verwerpen kan genomen worden op twee manieren:
* **Overschrijdingskansen (p-waarde):** Als de berekende p-waarde kleiner is dan het vooraf bepaalde significantieniveau ($\alpha$), wordt $H_0$ verworpen.
* **Kritieke waarden:** Als de berekende toetsingsgrootheid groter is dan de kritieke waarde (voor rechtseenzijdige toetsen) of kleiner is dan de kritieke waarde (voor linkseenzijdige toetsen), of als de toetsingsgrootheid buiten het acceptatiegebied valt (voor tweezijdige toetsen), wordt $H_0$ verworpen.
De kritieke waarden zijn afhankelijk van het significantieniveau ($\alpha$) en, in het geval van de t-toets en X²-toets, van de vrijheidsgraden ($df$).
> **Tip:** Het is cruciaal om bij de beslissingsregel rekening te houden met of de toets eenzijdig (links of rechts) of tweezijdig is. De kritieke waarden verschillen hiervoor. Bij $\alpha = .05$ zijn standaardkritieke waarden voor een tweezijdige Z-toets bijvoorbeeld $\pm 1.96$, en voor een eenzijdige Z-toets $\pm 1.64$.
### 4.2 Specifieke statistische toetsen
#### 4.2.1 De Z-toets
De Z-toets wordt gebruikt om te toetsen of het gemiddelde van een populatie significant verschilt van een bekende waarde, wanneer de populatiestandaarddeviatie bekend is.
**Formule toetsingsgrootheid:**
$$ Z = \frac{\bar{x} - \mu_0}{\sigma/\sqrt{N}} $$
Hierbij is $\bar{x}$ het steekproefgemiddelde, $\mu_0$ de hypothesisede populatiegemiddelde, $\sigma$ de populatiestandaarddeviatie en $N$ de steekproefgrootte. Als $\sigma$ onbekend is, kan $s$ (steekproefstandaarddeviatie) gebruikt worden indien $N \ge 100$.
**Kansverdeling:** Standaardnormaalverdeling.
#### 4.2.2 De t-toets voor het gemiddelde
De t-toets voor het gemiddelde wordt gebruikt wanneer we willen weten of het gemiddelde van een populatie significant verschilt van een bepaalde waarde, maar de populatiestandaarddeviatie ($\sigma$) onbekend is.
**Toetsingssituatie:** Vraagt of het gemiddelde van de populatie waaruit de steekproef afkomstig is een specifieke waarde heeft.
* Linkseenzijdig: $H_0: \mu \ge \mu_0$
* Rechtseenzijdig: $H_0: \mu \le \mu_0$
* Tweezijdig: $H_0: \mu = \mu_0$
**Voorwaarden:**
* Afhankelijke variabele is normaal verdeeld in de populatie, of de steekproefgrootte $N \ge 30$ indien de afhankelijke variabele niet normaal verdeeld is.
* Afhankelijke variabele is gemeten op minstens intervalniveau.
**Formule toetsingsgrootheid:**
$$ t = \frac{\bar{x} - \mu_0}{s/\sqrt{N}} $$
Hierbij is $s$ de steekproefstandaarddeviatie.
**Kansverdeling:** Student t-verdeling met $df = N-1$ vrijheidsgraden.
**Beslissingsregel:** Vanwege de oneindige reeks t-verdelingen (één per aantal vrijheidsgraden) worden toetsen vaker uitgevoerd met kritieke waarden dan met overschrijdingskansen.
**Rapporteren:** Een correcte rapportage omvat het type toets, de gemiddelden en standaarddeviaties van de steekproef en de populatie, de t-waarde, het aantal vrijheidsgraden, de p-waarde, en de effectgrootte.
* Voorbeeld: "Om na te gaan over de piekergroep meer piekeren dan de algemene bevolking werd een one-sample t-test uitgevoerd. Gemiddeld scoorden de mensen in de piekergroep hoger ($M = 27$, $SD = 15$) dan de referentiewaarde 20 uit de populatie, $t(14) = 1.81$, $p < .05$, $r = .44$."
#### 4.2.3 De X²-test voor frequenties
De chi-kwadraat (X²) test voor frequenties wordt gebruikt om na te gaan of de geobserveerde frequenties in een steekproef overeenstemmen met de verwachte frequenties, gebaseerd op normen, theorieën of eerder onderzoek.
**Toetsingssituatie:** Gaat na of de frequentieverdelingen van categorische variabelen overeenkomen.
**Voorwaarden:**
* De categorieën van de variabele moeten elkaar uitsluiten.
* 20% of minder van de categorieën mag een verwachte frequentie ($f_e$) kleiner dan 5 hebben.
* Geen enkele categorie mag een verwachte frequentie van minder dan 1 hebben.
* Oudere studies beschouwen ordinale variabelen soms als nominale voor deze toets.
**Hypothesen:** Altijd tweezijdig.
* $H_0$: De geobserveerde frequenties komen overeen met de verwachte frequenties (bijv. $\pi_1 = \pi_2 = \dots = \pi_k$).
* $H_1$: De geobserveerde frequenties komen niet overeen met de verwachte frequenties (niet $H_0$).
**Formule toetsingsgrootheid:**
$$ \chi^2 = \sum \frac{(f_o - f_e)^2}{f_e} $$
Hierbij is $f_o$ de geobserveerde frequentie en $f_e$ de verwachte frequentie. $k$ is het aantal categorieën.
**Kansverdeling:** X²-verdeling met $df = k-1$ vrijheidsgraden.
**Beslissingsregel:** Vaak met kritieke waarden vanwege de vele X²-verdelingen. De kritieke waarde wordt opgezocht in een tabel op basis van $\alpha$ en $df$.
**Effectgrootte:** Vaak berekend met $\phi$ (phi), die interpreteerbaar is zoals $r$.
**Rapporteren:** Verwachte en geobserveerde proporties/frequenties, de X²-waarde, $df$, de p-waarde en de effectgrootte.
### 4.3 Type 1 en Type 2 fouten
Bij hypothesetoetsing kunnen twee soorten fouten optreden:
* **Type 1 fout ($\alpha$):**
* **Definitie:** Het verwerpen van de nulhypothese ($H_0$) terwijl deze in werkelijkheid waar is.
* **Gevolg:** Concluderen dat er een effect of verschil is, terwijl dit er niet is.
* **Kans:** De kans op een Type 1 fout is gelijk aan het significantieniveau ($\alpha$) dat vooraf is vastgesteld (bv. 0.05 of 5%).
> **Voorbeeld:** Een diagnostische test voor depressie heeft $H_0$: "geen depressie". Als de test rejecteert ($H_1$: "wel depressie"), maar de patiënt is in werkelijkheid niet depressief, is dit een Type 1 fout.
* **Type 2 fout ($\beta$):**
* **Definitie:** Het niet verwerpen van de nulhypothese ($H_0$) terwijl deze in werkelijkheid onjuist is.
* **Gevolg:** Concluderen dat er geen effect of verschil is, terwijl dit er in werkelijkheid wel is.
* **Kans:** De kans op een Type 2 fout wordt aangeduid met $\beta$. Het onderscheidingsvermogen (power) van een toets is $1 - \beta$, wat de kans is om $H_0$ terecht te verwerpen wanneer deze onjuist is.
> **Voorbeeld:** Een medicijnstudie heeft $H_0$: "medicijn heeft geen effect". Als de studie concludeert dat het medicijn geen effect heeft, maar het is in werkelijkheid wel effectief, is dit een Type 2 fout.
### 4.4 Oefenen met SPSS
SPSS is een statistisch softwarepakket dat wordt gebruikt voor data-analyse en het uitvoeren van statistische toetsen.
#### 4.4.1 T-toets in SPSS
* SPSS voert standaard een t-toets uit, zelfs in situaties waar een Z-toets theoretisch mogelijk zou zijn (omdat $\sigma$ bekend is). Dit komt omdat SPSS er doorgaans vanuit gaat dat $\sigma$ onbekend is.
* De overschrijdingskansen bij een t-toets zijn doorgaans groter dan bij een Z-toets, wat betekent dat de kans om $H_0$ te verwerpen kleiner is bij een t-toets. Hierdoor neemt het onderscheidingsvermogen ($1-\beta$) af.
* **Eenzijdig of tweezijdig toetsen in SPSS:** SPSS presenteert standaard de tweezijdige overschrijdingskans ('sig. (2-tailed)').
* Als een **tweezijdige** overschrijdingskans nodig is, wordt deze direct vergeleken met $\alpha$.
* Als een **eenzijdige** overschrijdingskans nodig is, wordt de tweezijdige p-waarde gedeeld door 2 en vervolgens vergeleken met $\alpha$.
#### 4.4.2 X²-toets in SPSS
SPSS kan ook worden gebruikt om de X²-toets voor frequenties uit te voeren. De software berekent de X²-statistiek, het aantal vrijheidsgraden en de bijbehorende p-waarde, waardoor de beslissingsregel eenvoudig kan worden toegepast.
> **Belangrijke opmerking voor SPSS:** Hoewel SPSS krachtige tools biedt, is het essentieel om de onderliggende statistische concepten en voorwaarden van de toetsen te begrijpen om de output correct te kunnen interpreteren. De resultaten uit SPSS moeten altijd worden geïnterpreteerd in het licht van de toetsingssituatie, hypothesen en voorwaarden.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Betrouwbaarheidsinterval | Een statistisch interval dat een reeks waarden bevat waarbinnen de werkelijke populatieparameter waarschijnlijk ligt met een bepaalde mate van zekerheid. |
| Nulhypothese (H0) | Een stelling die wordt aangenomen als waar totdat er voldoende statistisch bewijs is om deze te verwerpen. Het stelt meestal dat er geen effect, geen verschil of geen relatie is. |
| Alternatieve hypothese (H1) | Een stelling die wordt aangenomen als er voldoende bewijs is om de nulhypothese te verwerpen. Het stelt meestal dat er wel een effect, een verschil of een relatie is. |
| Z-toets | Een statistische toets die wordt gebruikt om te bepalen of het gemiddelde van een steekproef significant verschilt van het gemiddelde van de populatie, wanneer de populatiestandaardafwijking bekend is. |
| T-toets | Een statistische toets die wordt gebruikt om te bepalen of het gemiddelde van een steekproef significant verschilt van het gemiddelde van de populatie, wanneer de populatiestandaardafwijking onbekend is. |
| Chi-kwadraat toets (X²-toets) | Een statistische toets die wordt gebruikt om te onderzoeken of er een significant verband bestaat tussen twee categorische variabelen, of om te controleren of de geobserveerde frequenties overeenkomen met de verwachte frequenties. |
| Vrijheidsgraden (df) | Het aantal waarden in een berekening dat vrij kan variëren. Bij de t-toets is dit vaak N-1, waarbij N de steekproefgrootte is. |
| Significantieniveau (α) | De kans op het maken van een Type 1 fout, oftewel de kans om de nulhypothese te verwerpen terwijl deze in werkelijkheid waar is. Meestal ingesteld op 0.05. |
| P-waarde (overschrijdingskans) | De kans om een teststatistiek te verkrijgen die minstens zo extreem is als de geobserveerde teststatistiek, ervan uitgaande dat de nulhypothese waar is. Als de p-waarde kleiner is dan α, wordt H0 verworpen. |
| Kritieke waarde | De grens- of drempelwaarde die wordt gebruikt om de nulhypothese te verwerpen of te behouden. Als de berekende toetsingsgrootheid groter of kleiner is dan de kritieke waarde (afhankelijk van de richting van de toets), wordt H0 verworpen. |
| Effectgrootte | Een maat voor de omvang van het effect dat wordt gemeten. Het geeft aan hoe sterk het verband is tussen variabelen of hoe groot het verschil is tussen groepen, onafhankelijk van de steekproefgrootte. |
| Type 1 fout | Het verwerpen van de nulhypothese terwijl deze in werkelijkheid waar is. Dit staat ook bekend als een vals positief resultaat. |
| Type 2 fout | Het niet verwerpen van de nulhypothese terwijl deze in werkelijkheid onwaar is. Dit staat ook bekend als een vals negatief resultaat. |