Cover
Aloita nyt ilmaiseksi HC4a_LP_2025_student(1).pdf
Summary
# Het opstellen van hypothesen
Dit deel van de studiehandleiding richt zich op het formuleren van de nulhypothese en de alternatieve hypothese, die voortkomen uit een onderzoeksvraag en essentieel zijn voor het opzetten van statistisch onderzoek [2](#page=2).
### 1.1 De relatie tussen onderzoeksvraag en hypothesen
Een onderzoeksvraag introduceert een vermoeden, verwachting of een specifieke vraag die onderzocht moet worden. Deze onderzoeksvraag wordt vertaald naar twee concurrerende hypothesen: de alternatieve hypothese ($H_A$) en de nulhypothese ($H_0$) [6](#page=6) [7](#page=7).
#### 1.1.1 De alternatieve hypothese ($H_A$)
De alternatieve hypothese vertegenwoordigt de stelling die de onderzoeker hoopt te bewijzen, oftewel het vermoeden, de verwachting of de vraag die men wil aantonen [7](#page=7).
> **Voorbeelden van alternatieve hypothesen:**
> * Gemiddelde tijd tot progressie bij nieuwe behandeling langer dan 24 maanden? ($H_A: \mu > 24$) [6](#page=6).
> * Is de gemiddelde geboortelengte bij meisjes kleiner dan 51 cm? ($H_A: \mu < 51$) [6](#page=6).
> * Is het gemiddelde gewicht bij hartpatiënten verschillend van 77kg? ($H_A: \mu \neq 77$) [6](#page=6).
#### 1.1.2 De nulhypothese ($H_0$)
De nulhypothese is het tegenovergestelde van de alternatieve hypothese en stelt doorgaans dat er geen effect, geen verschil of geen verband is. Het is de hypothese die we proberen te weerleggen [7](#page=7).
> **Voorbeelden van nulhypothesen (in relatie tot de alternatieve hypothesen hierboven):**
> * $H_0: \mu \leq 24$ [7](#page=7).
> * $H_0: \mu \geq 51$ [7](#page=7).
> * $H_0: \mu = 77$ [7](#page=7).
### 1.2 Essentiële principes bij het opstellen van hypothesen
Het correct opstellen van hypothesen is cruciaal voor een valide statistische analyse. Er zijn twee belangrijke principes die hierbij in acht genomen moeten worden [8](#page=8).
#### 1.2.1 Opstellen vóór steekproeftrekking
Het is van fundamenteel belang dat zowel de nulhypothese als de alternatieve hypothese worden geformuleerd op basis van de onderzoeksvraag, *voordat* er gegevens uit een steekproef worden verzameld. Dit voorkomt dat de hypothesen worden beïnvloed door de resultaten van de steekproef, wat kan leiden tot subjectiviteit en onbetrouwbare conclusies [8](#page=8).
> **Tip:** Zie het opstellen van hypothesen als het vastleggen van de spelregels voordat het spel begint. De uitkomst van het spel (de steekproef) mag de spelregels niet beïnvloeden [8](#page=8).
#### 1.2.2 Testen met focus op de nulhypothese
Bij het toetsen van hypothesen ligt de focus op het beoordelen van de geldigheid van de nulhypothese. Het doel is om te bepalen of er voldoende statistisch bewijs is om de nulhypothese te verwerpen. Indien de nulhypothese verworpen kan worden, wordt de alternatieve hypothese als waarschijnlijk correct beschouwd [8](#page=8).
> **Voorbeeld:** Als we $H_0: \mu = 77$ willen toetsen tegen $H_A: \mu \neq 77$, zullen we kijken of de data uit de steekproef sterk genoeg afwijkt van 77 om de nulhypothese te verwerpen. Als dat zo is, ondersteunt dit de alternatieve hypothese dat het gemiddelde gewicht verschillend is van 77kg [5](#page=5) [7](#page=7).
---
# Het testen van hypothesen voor een populatiegemiddelde
Dit onderdeel behandelt het proces van het toetsen van hypothesen met betrekking tot een populatiegemiddelde, inclusief de criteria voor het verwerpen van de nulhypothese, het concept van type I en type II fouten, en de stappen die gevolgd moeten worden tijdens het testen [9](#page=9).
### 2.1 Het verwerpen van de nulhypothese
De beslissing om de nulhypothese ($H_0$) te verwerpen, hangt af van de aard van de alternatieve hypothese ($H_A$) en de relatie tussen het steekproefgemiddelde ($\bar{x}$) en een kritieke waarde ($c$ of $c_1, c_2$) [10](#page=10) [11](#page=11) [12](#page=12).
* **Voorbeeld 1: Rechtseenzijdige toets** ($H_0: \mu \le 24$ versus $H_A: \mu > 24$) [10](#page=10) [18](#page=18).
De nulhypothese wordt verworpen wanneer het steekproefgemiddelde $\bar{x}$ groter is dan een bepaalde waarde $c$. Dit betekent dat de geobserveerde waarde in het rechterdeel van de verdeling ligt, wat bewijs levert tegen $H_0$ ten gunste van $H_A$ [10](#page=10) [19](#page=19).
* **Voorbeeld 2: Linkseenzijdige toets** ($H_0: \mu \ge 51$ versus $H_A: \mu < 51$) [11](#page=11) [23](#page=23).
De nulhypothese wordt verworpen wanneer het steekproefgemiddelde $\bar{x}$ kleiner is dan een bepaalde waarde $c$. Dit suggereert dat de geobserveerde waarde zich in het linkermidden van de verdeling bevindt, wat bewijs is tegen $H_0$ [11](#page=11) [23](#page=23).
* **Voorbeeld 3: Tweezijdige toets** ($H_0: \mu = 77$ versus $H_A: \mu \ne 77$) [12](#page=12) [27](#page=27).
De nulhypothese wordt verworpen wanneer het steekproefgemiddelde $\bar{x}$ kleiner is dan een bepaalde waarde $c_1$ of groter is dan een bepaalde waarde $c_2$. Dit houdt in dat zowel extreem lage als extreem hoge steekproefgemiddelden redenen zijn om $H_0$ te verwerpen [12](#page=12) [27](#page=27).
#### 2.1.1 De teststatistiek
Voor het bepalen van de kritieke waarden $c$, $c_1$ en $c_2$ maken we gebruik van een teststatistiek. Indien de steekproefomvang ($n$) voldoende groot is, of indien $n$ klein is maar de populatie normaal verdeeld, dan wordt de volgende uitdrukking gebruikt als teststatistiek (ook wel toetsingsgrootheid genoemd) [17](#page=17):
$$
T = \frac{\bar{x} - \mu_0}{s / \sqrt{n}}
$$
waarbij:
* $\bar{x}$ het steekproefgemiddelde is.
* $\mu_0$ de hypothesische populatiegemiddelde onder de nulhypothese.
* $s$ de standaarddeviatie van de steekproef.
* $n$ de steekproefomvang is.
Deze teststatistiek volgt een $t$-verdeling met $n-1$ vrijheidsgraden, genoteerd als $T \sim t(n-1)$ [17](#page=17).
> **Tip:** De kritieke waarden ($c, c_1, c_2$) worden bepaald op basis van de verdeling van de teststatistiek onder de aanname dat de nulhypothese waar is, en dit moet gebeuren op een bepaald significantieniveau $\alpha$ [18](#page=18).
### 2.2 Type I en type II fouten
Bij het nemen van een statistische beslissing over een hypothese zijn er twee soorten fouten mogelijk [13](#page=13):
* **Type I fout:** Het verwerpen van de nulhypothese terwijl deze in werkelijkheid waar is. De kans hierop wordt aangeduid met $\alpha$, het significantieniveau [13](#page=13) [15](#page=15).
* **Type II fout:** Het niet verwerpen van de nulhypothese terwijl deze in werkelijkheid onwaar is. De kans hierop wordt aangeduid met $\beta$ [13](#page=13).
Er is een omgekeerde relatie tussen de kans op een type I fout en de kans op een type II fout: als de kans op een type I fout daalt, stijgt de kans op een type II fout, en vice versa. Vaak wordt de focus gelegd op het minimaliseren van de 'ergste' fout [13](#page=13) [14](#page=14).
#### 2.2.1 Het significantieniveau ($\alpha$)
Het significantieniveau ($\alpha$) is de vastgelegde maximale kans op een type I fout. Een veelgebruikte waarde voor $\alpha$ is 0.05 (of 5%). Dit betekent dat in 5% van de gevallen waarin de nulhypothese waar is, we ten onrechte besluiten deze te verwerpen [15](#page=15).
> **Voorbeeld:** Als er 100 onschuldigen voor de rechtbank verschijnen en de nulhypothese is dat de man onschuldig is, dan zullen bij een $\alpha = 0.05$ gemiddeld 5 van hen ten onrechte schuldig worden bevonden en mogelijk de doodstraf krijgen [15](#page=15).
#### 2.2.2 Bepalen van kritieke waarden met $\alpha$
Het significantieniveau $\alpha$ wordt gebruikt om de kritieke waarden ($c$, $c_1$, $c_2$) te bepalen, zodanig dat de kans op een type I fout gelijk is aan $\alpha$ [17](#page=17).
* **Rechtseenzijdige toets** ($H_A: \mu > \mu_0$): We verwerpen $H_0$ als de teststatistiek groter is dan de kritieke waarde $k.p.$, waarbij $P(T > k.p. | H_0 \text{ waar}) = \alpha$. Bij $\alpha = 0.05$ en $n-1 = 99$ vrijheidsgraden, is de kritieke waarde ongeveer 1.658 [19](#page=19) [20](#page=20).
* **Linkseenzijdige toets** ($H_A: \mu < \mu_0$): We verwerpen $H_0$ als de teststatistiek kleiner is dan de kritieke waarde $k.p.$, waarbij $P(T < k.p. | H_0 \text{ waar}) = \alpha$. Bij $\alpha = 0.05$ en $n-1 = 40$ vrijheidsgraden, is de kritieke waarde ongeveer -1.684 [23](#page=23) [24](#page=24).
* **Tweezijdige toets** ($H_A: \mu \ne \mu_0$): We verwerpen $H_0$ als de teststatistiek kleiner is dan $-k.p.$ of groter is dan $+k.p.$, waarbij $P(T < -k.p. | H_0 \text{ waar}) = \alpha/2$ en $P(T > k.p. | H_0 \text{ waar}) = \alpha/2$. Bij $\alpha = 0.05$ (dus $\alpha/2 = 0.025$) en $n-1 = 22$ vrijheidsgraden, zijn de kritieke waarden ongeveer -2.074 en +2.074 [27](#page=27) [28](#page=28).
### 2.3 Het toetsen van hypothesen: stappenplan
Het proces van het testen van hypothesen kan worden gestructureerd aan de hand van de volgende stappen [22](#page=22):
1. **Stel je hypotheses op:** Formuleer duidelijk de nulhypothese ($H_0$) en de alternatieve hypothese ($H_A$). Bepaal of het een rechtseenzijdige, linkseenzijdige of tweezijdige toets betreft [22](#page=22) [30](#page=30).
2. **Ga de voorwaarden na:** Controleer of de aannames voor de gekozen statistische test (zoals normaliteit van de populatie of voldoende grote steekproefomvang) voldaan zijn [22](#page=22).
3. **Bepaal wanneer je de hypothese (niet) zult verwerpen:** Stel de kritieke waarden vast op basis van het gekozen significantieniveau ($\alpha$) en de verdeling van de teststatistiek [22](#page=22).
4. **Doe een steekproef en bereken de gepaste statistieken:** Verzamel data uit een steekproef en bereken het steekproefgemiddelde ($\bar{x}$), de steekproefstandaarddeviatie ($s$) en de waarde van de teststatistiek [22](#page=22).
5. **Trek je conclusie:** Vergelijk de berekende teststatistiek met de kritieke waarden. Formuleer de conclusie in statistische termen (verwerpen of niet verwerpen van $H_0$ op een bepaald significantieniveau) en in de context van de onderzoeksvraag [22](#page=22).
#### 2.3.1 Voorbeeld 1: Tijd tot progressie
Onderzoekers onderzoeken de tijd tot progressie bij 100 patiënten na een experimentele behandeling. De nulhypothese is dat de gemiddelde tijd tot progressie $\mu \le 24$ maanden ($H_0: \mu \le 24$ versus $H_A: \mu > 24$) [21](#page=21).
* **Stap 1:** Hypotheses zijn $H_0: \mu \le 24$ en $H_A: \mu > 24$. Dit is een rechtseenzijdige toets [21](#page=21).
* **Stap 2:** Voorwaarden: $n=100 \ge 30$, dus de teststatistiek volgt een $t$-verdeling [21](#page=21).
* **Stap 3:** We bepalen de kritieke waarde op basis van $\alpha = 0.05$ en $n-1 = 99$ vrijheidsgraden. De kritieke waarde is ongeveer 1.658. We verwerpen $H_0$ als $\frac{\bar{x}-24}{s/\sqrt{n}} > 1.658$ [20](#page=20) [21](#page=21).
* **Stap 4:** Het steekproefgemiddelde is $\bar{x} = 27$ maanden en de steekproefvariantie is $s^2 = 81$. De teststatistiek is:
$$
\frac{27 - 24}{\sqrt{81} / \sqrt{100}} = \frac{3}{9 / 10} = \frac{3}{0.9} = 3.333
$$
[21](#page=21).
* **Stap 5:** De berekende teststatistiek (3.333) is groter dan de kritieke waarde (1.658). **Conclusie:** Op een significantieniveau van 5% verwerpen we de nulhypothese. De tijd tot progressie bij de experimentele behandeling is significant meer dan 24 maanden [21](#page=21).
#### 2.3.2 Voorbeeld 2: Geboortelengte bij meisjes
Onderzocht wordt of de gemiddelde geboortelengte van meisjes significant kleiner is dan 51 cm. Een steekproef van 41 meisjes levert een gemiddelde van 50.8 cm en een variantie van 1.6 op [25](#page=25).
* **Stap 1:** Hypotheses zijn $H_0: \mu \ge 51$ en $H_A: \mu < 51$. Dit is een linkseenzijdige toets [23](#page=23).
* **Stap 2:** Voorwaarden: $n=41 \ge 30$, dus de teststatistiek volgt een $t$-verdeling met 40 vrijheidsgraden [23](#page=23).
* **Stap 3:** Bij $\alpha = 0.05$ en 40 vrijheidsgraden is de kritieke waarde ongeveer -1.684. We verwerpen $H_0$ als $\frac{\bar{x}-51}{s/\sqrt{n}} < -1.684$ [24](#page=24) [25](#page=25).
* **Stap 4:** De teststatistiek is:
$$
\frac{50.8 - 51}{\sqrt{1.6} / \sqrt{41}} = \frac{-0.2}{\sqrt{1.6 / 41}} \approx \frac{-0.2}{0.198} \approx -1.012
$$
[25](#page=25).
* **Stap 5:** De berekende teststatistiek (-1.012) is groter dan de kritieke waarde (-1.684). **Conclusie:** Op een significantieniveau van 5% verwerpen we de nulhypothese niet. De gemiddelde geboortelengte van meisjes is niet significant kleiner dan 51 cm [26](#page=26).
#### 2.3.3 Voorbeeld 3: Gewicht bij hartpatiënten
Er wordt onderzocht of het gemiddelde gewicht bij hartpatiënten significant verschilt van 77 kg. Uit een steekproef van 23 patiënten blijkt het gemiddelde gewicht 83 kg en de variantie 64 kg² [27](#page=27) [29](#page=29).
* **Stap 1:** Hypotheses zijn $H_0: \mu = 77$ en $H_A: \mu \ne 77$. Dit is een tweezijdige toets [27](#page=27).
* **Stap 2:** Voorwaarden: $n=23 < 30$, maar de populatie komt uit een normaal verdeelde populatie, dus de teststatistiek volgt een $t$-verdeling met 22 vrijheidsgraden [27](#page=27).
* **Stap 3:** Bij $\alpha = 0.05$ (dus $\alpha/2 = 0.025$) en 22 vrijheidsgraden zijn de kritieke waarden ongeveer -2.074 en +2.074. We verwerpen $H_0$ als $\frac{\bar{x}-77}{s/\sqrt{n}} < -2.074$ of $\frac{\bar{x}-77}{s/\sqrt{n}} > 2.074$ [28](#page=28) [29](#page=29).
* **Stap 4:** De teststatistiek is:
$$
\frac{83 - 77}{\sqrt{64} / \sqrt{23}} = \frac{6}{8 / \sqrt{23}} \approx \frac{6}{8 / 4.796} \approx \frac{6}{1.668} \approx 3.5969
$$
[29](#page=29).
* **Stap 5:** De berekende teststatistiek (3.5969) ligt buiten het interval [-2.074, +2.074. **Conclusie:** Op een significantieniveau van 5% verwerpen we de nulhypothese. Het gemiddelde gewicht bij hartpatiënten is significant verschillend van 77 kg [29](#page=29).
#### 2.3.4 Soorten hypothesetesten
Er zijn drie algemene soorten hypothesetesten voor het populatiegemiddelde [30](#page=30):
* **Rechtseenzijdige toets:** $H_0: \mu \le \mu_0$ versus $H_A: \mu > \mu_0$.
* **Linkseenzijdige toets:** $H_0: \mu \ge \mu_0$ versus $H_A: \mu < \mu_0$.
* **Tweezijdige toets:** $H_0: \mu = \mu_0$ versus $H_A: \mu \ne \mu_0$.
---
# De p-waarde en de interpretatie ervan
Dit deel behandelt de p-waarde als een instrument voor hypothesetoetsing, inclusief de berekening en interpretatie ervan voor verschillende eenzijdige en tweezijdige toetsen.
## 3 De p-waarde en de interpretatie ervan
De p-waarde is een cruciale maatstaf binnen de statistiek om nulhypothesen te toetsen. Het vertegenwoordigt de waarschijnlijkheid om een teststatistiek te observeren die minstens zo extreem is als de geobserveerde waarde, uitgaande van de geldigheid van de nulhypothese. De interpretatie en berekening van de p-waarde variëren afhankelijk van het type toets dat wordt uitgevoerd: rechtseenzijdig, linkseenzijdig of tweezijdig [31](#page=31) [44](#page=44).
### 3.1 De p-waarde bij een rechtseenzijdige test
Bij een rechtseenzijdige test wordt de p-waarde gedefinieerd als de kans om een teststatistiek te observeren die groter is dan of gelijk is aan de geobserveerde waarde, aangenomen dat de nulhypothese waar is [34](#page=34).
De formule voor de p-waarde bij een rechtseenzijdige test is:
$$ p = P(T_{n-1} \geq \text{geobserveerde waarde}) $$
Hierbij is $T_{n-1}$ de teststatistiek met $n-1$ vrijheidsgraden [34](#page=34).
De beslissingsregel is als volgt:
* Verwerp de nulhypothese ($H_0$) als $p < \alpha$, waarbij $\alpha$ het significantieniveau is (meestal 0.05) [34](#page=34).
* Verwerp de nulhypothese ($H_0$) niet als $p \geq \alpha$ [34](#page=34).
Op de grafieken wordt dit geïllustreerd door de oppervlakte onder de kansdichtheidsfunctie vanaf de geobserveerde waarde naar rechts. Als de geobserveerde waarde aan of onder het kritische punt (k.p.) ligt, is de p-waarde groter dan of gelijk aan 0.05, en wordt de nulhypothese niet verworpen. Ligt de geobserveerde waarde boven het kritische punt, dan is de p-waarde kleiner dan 0.05 en wordt de nulhypothese verworpen [32](#page=32) [33](#page=33).
> **Tip:** Bij een rechtseenzijdige test zoek je naar bewijs in de richting van een grotere waarde dan de nulhypothese suggereert. De p-waarde kwantificeert hoe onwaarschijnlijk de geobserveerde resultaten zijn onder de nulhypothese.
### 3.2 De p-waarde bij een linkseenzijdige test
Voor een linkseenzijdige test wordt de p-waarde gedefinieerd als de kans om een teststatistiek te observeren die kleiner is dan of gelijk is aan de geobserveerde waarde, onder de aanname dat de nulhypothese waar is [37](#page=37).
De formule voor de p-waarde bij een linkseenzijdige test is:
$$ p = P(T_{n-1} \leq \text{geobserveerde waarde}) $$
Hierbij is $T_{n-1}$ de teststatistiek met $n-1$ vrijheidsgraden [37](#page=37).
De beslissingsregel is identiek aan die van de rechtseenzijdige test:
* Verwerp $H_0$ als $p < \alpha$ [37](#page=37).
* Verwerp $H_0$ niet als $p \geq \alpha$ [37](#page=37).
Grafisch wordt dit weergegeven door de oppervlakte onder de kansdichtheidsfunctie vanaf de geobserveerde waarde naar links. Als de geobserveerde waarde aan of boven het kritische punt ligt, is de p-waarde groter dan of gelijk aan 0.05, wat leidt tot het niet verwerpen van de nulhypothese. Wanneer de geobserveerde waarde kleiner is dan het kritische punt, is de p-waarde kleiner dan 0.05 en wordt de nulhypothese verworpen [35](#page=35) [36](#page=36).
> **Tip:** Een linkseenzijdige test wordt gebruikt wanneer je geïnteresseerd bent in bewijs voor een kleinere waarde dan de nulhypothese stelt.
### 3.3 De p-waarde bij een tweezijdige test
Bij een tweezijdige test wordt de p-waarde berekend op een manier die extremen in beide staarten van de verdeling meeneemt. Dit om de beslissingsregel consistent te houden voor elke test [42](#page=42) [43](#page=43).
Er zijn twee manieren om de p-waarde voor een tweezijdige test te definiëren, afhankelijk van het teken van de geobserveerde waarde:
1. **Indien de geobserveerde waarde negatief is:**
De p-waarde, vaak aangeduid als $p^*$, wordt berekend als de kans om een teststatistiek te observeren die kleiner is dan of gelijk is aan de geobserveerde waarde. De uiteindelijke p-waarde ($p$) wordt vervolgens verkregen door dit te vermenigvuldigen met 2 om rekening te houden met extremen in beide staarten [42](#page=42) [43](#page=43).
$$ p^* = P(T_{n-1} \leq \text{geobserveerde waarde}) $$
$$ p = 2 \times P(T_{n-1} \leq \text{geobserveerde waarde}) $$
Beslissingsregel: Verwerp $H_0$ als $p < \alpha$ [42](#page=42) [43](#page=43).
2. **Indien de geobserveerde waarde positief is:**
De p-waarde, $p^*$, wordt berekend als de kans om een teststatistiek te observeren die groter is dan of gelijk is aan de geobserveerde waarde. De uiteindelijke p-waarde ($p$) is tweemaal deze kans [42](#page=42) [43](#page=43).
$$ p^* = P(T_{n-1} \geq \text{geobserveerde waarde}) $$
$$ p = 2 \times P(T_{n-1} \geq \text{geobserveerde waarde}) $$
Beslissingsregel: Verwerp $H_0$ als $p < \alpha$ [42](#page=42) [43](#page=43).
Voor een tweezijdige test wordt de nulhypothese verworpen als de berekende p-waarde kleiner is dan $\alpha/2$ wanneer $p^*$ wordt gebruikt of als de berekende p-waarde kleiner is dan $\alpha$ wanneer $p$ (de verdubbelde waarde) wordt gebruikt. De tweede benadering met de verdubbelde kans ($p$) maakt de beslissingsregel identiek ($p < \alpha$) voor alle soorten toetsen [42](#page=42) [43](#page=43) [44](#page=44).
Op de bijbehorende figuren wordt voor negatieve geobserveerde waarden de linkerstaart ($ \leq \text{geobs. waarde}$) met een oppervlakte van $\alpha/2$ getoond, en voor positieve geobserveerde waarden de rechterstaart ($ \geq \text{geobs. waarde}$) met een oppervlakte van $\alpha/2$. Als de geobserveerde waarde buiten de intervallen ($-\text{k.p.}, +\text{k.p.}$) valt, wordt de nulhypothese verworpen [38](#page=38) [39](#page=39) [40](#page=40) [41](#page=41).
### 3.4 Overzicht van de p-waarde en verwerpingsregel
De p-waarde is een samenvattende statistiek die de mate van ondersteuning voor de nulhypothese weergeeft. De berekening ervan hangt af van de richting van de alternatieve hypothese [44](#page=44):
* **Linkseenzijdige test:** $ p = P(T_{n-1} \leq \text{geobserveerde waarde}) $ [44](#page=44).
* **Rechtseenzijdige test:** $ p = P(T_{n-1} \geq \text{geobserveerde waarde}) $ [44](#page=44).
* **Tweezijdige test:**
* Indien de geobserveerde waarde negatief is: $ p = 2 \times P(T_{n-1} \leq \text{geobserveerde waarde}) $ [44](#page=44).
* Indien de geobserveerde waarde positief is: $ p = 2 \times P(T_{n-1} \geq \text{geobserveerde waarde}) $ [44](#page=44).
De algemene regel voor het verwerpen van de nulhypothese ($H_0$) op basis van de p-waarde is:
* Verwerp $H_0$ als $p < \alpha$ [44](#page=44).
* Verwerp $H_0$ niet als $p \geq \alpha$ [44](#page=44).
### 3.5 Voorbeelden van p-waarde berekening
#### 3.5.1 Voorbeeld 1
Gegeven is de nulhypothese $H_0: \mu \leq 24$ tegen de alternatieve hypothese $H_A: \mu > 24$ met een steekproefgrootte $n=100$. De geobserveerde waarde is 3.33 [45](#page=45).
Dit betreft een rechtseenzijdige test, dus de p-waarde wordt berekend als:
$$ p = P(T_{n-1} \geq \text{geobserveerde waarde}) = P(T_{99} \geq 3.33) $$
Aangezien deze waarde niet direct in de standaard t-verdelingstabellen staat, wordt deze benaderd. De p-waarde is kleiner dan 0.001 [45](#page=45).
**Besluit:** Omdat de berekende p-waarde ($p < 0.001$) kleiner is dan het significantieniveau $\alpha = 0.05$, wordt de nulhypothese verworpen op een significantieniveau van 5% [45](#page=45).
#### 3.5.2 Voorbeeld 2 en 3
Pagina 46 en 47 bevatten verder geen specifieke uitgewerkte voorbeelden van p-waarde berekeningen die hier expliciet samengevat kunnen worden [46](#page=46) [47](#page=47).
> **Tip:** De p-waarde geeft de kans op de geobserveerde data (of extremere data) onder de nulhypothese. Een lage p-waarde (< $\alpha$) suggereert dat de data onwaarschijnlijk zijn onder $H_0$, wat leidt tot verwerping van $H_0$. Een hoge p-waarde ($\geq \alpha$) betekent dat de data plausibel zijn onder $H_0$, dus er is onvoldoende bewijs om $H_0$ te verwerpen.
---
# Hypothesetesten voor een proportie
Dit deel introduceert de procedure voor het testen van hypothesen met betrekking tot een populatieproportie, inclusief de voorwaarden, berekening van de teststatistiek, en interpretatie van resultaten zoals de p-waarde [52](#page=52).
### 4.1 Algemene principes
Net als bij het testen van gemiddelden, is het testen van proporties gebaseerd op de verdeling van een toetsingsgrootheid. De procedure omvat het formuleren van hypothesen, het controleren van de voorwaarden voor de test, het berekenen van de toetsingsgrootheid, en het trekken van een conclusie op basis van de p-waarde of een kritieke waarde [54](#page=54) [55](#page=55).
### 4.2 Formuleren van hypothesen
Hypothesen worden geformuleerd in termen van de populatieproportie, aangeduid met $\pi$. De nulhypothese ($H_0$) stelt een specifieke waarde of een bereik van waarden voor de populatieproportie voor, terwijl de alternatieve hypothese ($H_A$) het tegenovergestelde stelt [53](#page=53).
* **Voorbeeld:** Bij het evalueren van een nieuwe therapie voor Alzheimer, is de klassieke behandeling geassocieerd met 21% van de patiënten die na 12 maanden in een verder stadium van de ziekte zitten. Voor de nieuwe therapie worden de hypothesen geformuleerd als $H_0: \pi \geq 0.21$ versus $H_A: \pi < 0.21$. Dit is een links-eenzijdig toetsingsprobleem omdat men wil weten of de nieuwe therapie *lager* is dan 21% [53](#page=53).
### 4.3 Voorwaarden voor de test
Om de toetsingsgrootheid te kunnen benaderen met een normale verdeling, moeten de volgende voorwaarden voldaan zijn:
* $n\pi_0 \geq 5$
* $n(1-\pi_0) \geq 5$
Hierbij is $n$ de steekproefgrootte en $\pi_0$ de proportie onder de nulhypothese [54](#page=54).
> **Tip:** Als deze voorwaarden niet voldaan zijn, kan de test enkel betrouwbaar worden uitgevoerd met behulp van statistische software zoals R [57](#page=57).
### 4.4 Berekening van de teststatistiek
Wanneer de voorwaarden voldaan zijn, volgt de toetsingsgrootheid bij benadering een standaard normale verdeling, $N(0,1)$. De formule voor de teststatistiek ($Z$) is [54](#page=54):
$$Z = \frac{\bar{p} - \pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}}$$
Hierbij is $\bar{p}$ de steekproefproportie [54](#page=54).
* **Voorbeeld (vervolg):** Gegeven $n=100$ patiënten en $\bar{p} = \frac{16}{100} = 0.16$. De teststatistiek wordt berekend als:
$$Z = \frac{0.16 - 0.21}{\sqrt{\frac{0.21(1-0.21)}{100}}} = \frac{-0.05}{\sqrt{\frac{0.21 \ast 0.79}{100}}} = \frac{-0.05}{\sqrt{\frac{0.1659}{100}}} = \frac{-0.05}{0.04073} \approx -1.228$$
### 4.5 Interpretatie van de resultaten
De interpretatie gebeurt op basis van de p-waarde of door de berekende teststatistiek te vergelijken met een kritieke waarde.
#### 4.5.1 Kritieke waarde benadering
Voor een links-eenzijdig toetsingsprobleem met een significantieniveau $\alpha = 0.05$, is de kritieke waarde voor een $N(0,1)$ verdeling -1.645. Als de berekende teststatistiek kleiner is dan de kritieke waarde, wordt de nulhypothese verworpen [55](#page=55).
* **Voorbeeld (vervolg):** De berekende teststatistiek is ongeveer -1.2276. Aangezien -1.2276 niet kleiner is dan -1.645, wordt de nulhypothese $H_0$ niet verworpen op een significantieniveau van 5%. Dit betekent dat we niet kunnen concluderen dat de proportie in een volgend stadium na 12 maanden significant kleiner is dan 21% [56](#page=56).
#### 4.5.2 P-waarde benadering
De p-waarde is de kans om een teststatistiek te observeren die minstens zo extreem is als de geobserveerde waarde, aannemende dat de nulhypothese waar is [57](#page=57).
* **Voorbeeld (vervolg):** Voor een links-eenzijdig test is de p-waarde:
$p = P(Z \leq \text{geobserveerde waarde}) = P(Z \leq -1.2276)$ [57](#page=57).
Met behulp van een standaard normale verdelingstabel of software: $P(Z \leq -1.2276) \approx 1 - 0.8907 = 0.1093$ [57](#page=57).
Aangezien de p-waarde (0.1093) groter is dan het significantieniveau van 0.05, wordt de nulhypothese niet verworpen [57](#page=57).
### 4.6 Hypothesetest voor een proportie in R
Statistische software zoals R kan worden gebruikt om hypothesetesten voor proporties uit te voeren. De functie vereist het aantal successen ($x$), de steekproefgrootte ($n$), de proportie onder de nulhypothese ($p = \pi_0$), en de specificatie van de alternatieve hypothese (`alternative = “two.sided”`, `“left”` of `“right”`) [58](#page=58).
* **Voorbeeld (vervolg) in R:**
* De input zou zijn: $x=16$, $n=100$, $p=0.21$, `alternative = "left"` (#page=53 58) [53](#page=53) [58](#page=58).
* De output in R kan de teststatistiek en de p-waarde opleveren. In een gerelateerd voorbeeld met een tweezijdige test, wordt vermeld dat de teststatistiek $\frac{\bar{p} - \pi_0}{\sqrt{\frac{\pi_0(1-\pi_0)}{n}}}$ weliswaar een chi-kwadraatverdeling met 1 vrijheidsgraad volgt (wat equivalent is aan $N(0,1)^2$), maar dat voor de oorspronkelijke links-eenzijdige test de $N(0,1)$ teststatistiek directer is. De p-waarde voor de alternatieve hypothese $H_a: \pi > 0.21$ wordt gegeven als 0.1098 [60](#page=60).
* **Besluit:** De p-waarde (0.1098) is groter dan 0.05, dus $H_0$ wordt niet verworpen op 5% significantieniveau. De proportie patiënten die met de nieuwe therapie na 12 maanden in een volgend stadium zitten, is niet significant kleiner dan 21% [61](#page=61).
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Nulhypothese (H0) | De hypothese die het tegenovergestelde beweert van wat men wil aantonen of vermoeden. In de statistiek wordt deze hypothese gebruikt als uitgangspunt om te testen of er voldoende bewijs is om deze te verwerpen ten gunste van de alternatieve hypothese. |
| Alternatieve hypothese (HA) | De hypothese die men verwacht, vermoedt of wil aantonen. Bij het testen van hypothesen wordt getracht voldoende statistisch bewijs te vinden om de nulhypothese te verwerpen en de alternatieve hypothese te ondersteunen. |
| Steekproefgemiddelde (ҧx) | Het gemiddelde dat wordt berekend op basis van een steekproef uit een populatie. Dit is een schatting van het werkelijke populatiegemiddelde en wordt gebruikt om conclusies te trekken over de populatie. |
| Steekproefproportie (ҧp) | Het percentage of aandeel van een bepaalde kenmerk binnen een steekproef. Dit is een schatting van de populatieproportie en wordt gebruikt in hypothesestoetsen voor proporties. |
| Populatiegemiddelde (μ) | Het gemiddelde van een bepaald kenmerk over de gehele populatie. Dit is een theoretische waarde die vaak onbekend is en wordt geschat met behulp van steekproefgemiddelden. |
| Populatieproportie (π) | Het werkelijke aandeel van een bepaald kenmerk in de gehele populatie. Net als het populatiegemiddelde is dit een theoretische waarde die meestal onbekend is. |
| Significantieniveau (α) | De kans op het maken van een Type I fout, oftewel het verwerpen van de nulhypothese terwijl deze waar is. Meestal wordt een significantieniveau van 0.05 (of 5%) gehanteerd. |
| Type I fout | Een fout die optreedt wanneer de nulhypothese ten onrechte wordt verworpen, terwijl deze in werkelijkheid waar is. De kans hierop is gelijk aan het significantieniveau (α). |
| Type II fout | Een fout die optreedt wanneer de nulhypothese ten onrechte niet wordt verworpen, terwijl deze in werkelijkheid onwaar is. De kans hierop wordt aangeduid met β. |
| Teststatistiek of toetsingsgrootheid | Een statistiek berekend uit steekproefgegevens die wordt gebruikt om de nulhypothese te testen. Afhankelijk van de situatie kan dit een z-statistiek of een t-statistiek zijn. |
| Kritisch punt (k.p.) | Een waarde uit de verdeling van de teststatistiek die de grens bepaalt tussen het gebied waar de nulhypothese niet wordt verworpen en het gebied waar deze wel wordt verworpen. |
| p-waarde | De kans om een teststatistiek te observeren die minstens zo extreem is als de geobserveerde waarde, aangenomen dat de nulhypothese waar is. Een lage p-waarde (< α) leidt tot het verwerpen van de nulhypothese. |
| Rechtseenzijdige toets | Een hypothesetest waarbij de alternatieve hypothese een "groter dan" relatie aangeeft (bv. H A: μ > μ0). Het kritieke gebied ligt aan de rechterkant van de verdeling. |
| Linkseenzijdige toets | Een hypothesetest waarbij de alternatieve hypothese een "kleiner dan" relatie aangeeft (bv. H A: μ < μ0). Het kritieke gebied ligt aan de linkerkant van de verdeling. |
| Tweezijdige toets | Een hypothesetest waarbij de alternatieve hypothese een "ongelijk aan" relatie aangeeft (bv. H A: μ ≠ μ0). Het kritieke gebied is verdeeld over beide staarten van de verdeling. |
| t-verdeling (t(n-1)) | Een kansverdeling die lijkt op de normale verdeling, maar met dikkere staarten. Deze wordt gebruikt bij het testen van hypothesen over populatiegemiddelden wanneer de populatiestandaarddeviatie onbekend is en de steekproefomvang klein is of de populatie niet normaal verdeeld is. |
| N(0,1) verdeling | De standaard normale verdeling, met een gemiddelde van 0 en een standaarddeviatie van 1. Deze wordt gebruikt bij het testen van hypothesen over populatieproporties wanneer bepaalde voorwaarden zijn voldaan. |
| Chi-kwadraatverdeling (χ²) | Een kansverdeling die wordt gebruikt in statistische tests, waaronder hypothesetesten voor proporties wanneer de teststatistiek gekwadrateerd wordt. |