Cover
Start nu gratis Set 3 H8 Inferentie Over Proporties.pptx
Summary
# Inferentie voor een enkele proportie
Dit onderdeel behandelt de statistische methoden voor het schatten en toetsen van hypotheses over een enkele populatieproportie, inclusief het bepalen van de benodigde steekproefgrootte.
## 1. Inferentie voor een enkele proportie
De populatieproportie van 'successen', aangeduid met $p$ of $\pi$, wordt geschat met de steekproefproportie $\hat{p}$. De steekproevenverdeling van $\hat{p}$ is bij benadering normaal verdeeld met een gemiddelde gelijk aan de ware populatieproportie $p$ en een standaardfout van $\sqrt{\frac{p(1-p)}{n}}$, waarbij $n$ de steekproefgrootte is.
### 1.1 Betrouwbaarheidsinterval voor een enkele proportie in een grote steekproef
Een betrouwbaarheidsinterval (BI) biedt een reeks plausibele waarden voor de onbekende populatieproportie $p$. Voor grote steekproeven wordt dit als volgt berekend:
Het steekproefgemiddelde is de steekproefproportie:
$$ \hat{p} = \frac{X}{n} $$
waarbij $X$ het aantal successen in de steekproef is.
De standaardfout van de steekproefproportie is:
$$ SE(\hat{p}) = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} $$
Het benaderde betrouwbaarheidsinterval wordt gegeven door:
$$ BI = \text{statistiek} \pm \text{foutmarge} = \hat{p} \pm (z^{\ast} \times SE(\hat{p})) $$
Hierbij is $z^{\ast}$ de kritieke waarde uit de standaardnormaalverdeling die overeenkomt met het gewenste betrouwbaarheidsniveau. Deze formule is geschikt indien $X \geq 15$ en $n - X \geq 15$, en het betrouwbaarheidsniveau minimaal 90% is.
> **Tip:** De 'plus-vier' methode biedt een verbeterde nauwkeurigheid, vooral bij kleinere steekproeven of proporties die dicht bij 0 of 1 liggen. Hierbij worden 2 successen en 2 mislukkingen 'toegevoegd' aan de data.
> De plus-vier schatting van $p$ is:
> $$ \tilde{p} = \frac{X+2}{n+4} $$
> Het plus-vier betrouwbaarheidsinterval is dan:
> $$ \tilde{p} \pm z^{\ast} \sqrt{\frac{\tilde{p}(1-\tilde{p})}{n+4}} $$
**Voorbeeld:**
Iemand beweert dat 50% van de mensen op hun rechter zijde in slaap valt. Een steekproef van 251 personen toonde aan dat 107 dit deden. Bereken en interpreteer een 90% betrouwbaarheidsinterval.
Voor een 90% betrouwbaarheidsniveau is $z^{\ast} = 1.645$.
$\hat{p} = \frac{107}{251} \approx 0.4263$
$SE(\hat{p}) = \sqrt{\frac{0.4263(1-0.4263)}{251}} \approx \sqrt{\frac{0.4263 \times 0.5737}{251}} \approx \sqrt{0.000975} \approx 0.0312$
Foutmarge: $1.645 \times 0.0312 \approx 0.0513$
BI: $0.4263 \pm 0.0513$, wat resulteert in het interval $[0.375; 0.477]$.
Interpretatie: We zijn 90% zeker dat het interval $[0.375; 0.477]$ de ware proportie mensen die inslapen op hun rechter zijde bevat. Aangezien 0.5 niet in dit interval ligt, is er reden om de oorspronkelijke stelling te betwijfelen.
### 1.2 Significantietoets voor een enkele proportie
Een significantietoets wordt gebruikt om te beoordelen of waargenomen data bewijs leveren tegen een nulhypothese over de populatieproportie.
De $z$-statistiek voor het toetsen van de nulhypothese $H_0: p = p_0$ is:
$$ z = \frac{\hat{p} - p_0}{\sqrt{\frac{p_0(1-p_0)}{n}}} $$
Deze $z$-statistiek is bij benadering standaard normaal verdeeld indien de nulhypothese waar is. De $p$-waarde wordt berekend uit de standaardnormaalverdeling, gebaseerd op de alternatieve hypothese ($H_a$).
De test is toepasbaar indien zowel het aantal successen ($n \cdot p_0$) als het aantal mislukkingen ($n \cdot (1-p_0)$) ten minste 10 bedraagt, en de steekproefgrootte $n \geq 10n$.
**Voorbeeld:**
Een producent van chips moet een lading aardappelen retourneren indien meer dan 8% beschadigd is. Een steekproef van 500 aardappelen toont 47 beschadigde exemplaren. Toets met $\alpha = 0.10$ of de lading teruggestuurd moet worden.
Hypothesen:
$H_0: p = 0.08$
$H_a: p > 0.08$
Controle van aannames:
Random: Een toevalssteekproef van 500 aardappelen.
Normaal: Verwacht aantal beschadigden $n \cdot p_0 = 500 \times 0.08 = 40$. Verwacht aantal niet-beschadigden $n \cdot (1-p_0) = 500 \times 0.92 = 460$. Beide zijn groter dan 10.
$z = \frac{\frac{47}{500} - 0.08}{\sqrt{\frac{0.08(1-0.08)}{500}}} = \frac{0.094 - 0.08}{\sqrt{\frac{0.08 \times 0.92}{500}}} = \frac{0.014}{\sqrt{\frac{0.0736}{500}}} = \frac{0.014}{\sqrt{0.0001472}} = \frac{0.014}{0.01213} \approx 1.15$
$p$-waarde: $P(z \geq 1.15) = 1 - P(z < 1.15) = 1 - 0.8749 = 0.1251$.
Conclusie: Aangezien de $p$-waarde (0.1251) groter is dan $\alpha = 0.10$, wordt $H_0$ niet verworpen. Er is onvoldoende bewijs om te stellen dat meer dan 8% van de lading beschadigd is.
### 1.3 Vereiste steekproefgrootte bepalen
Om een populatieproportie te schatten met een gewenste foutmarge $m$ en betrouwbaarheidsniveau, kan de benodigde steekproefgrootte worden berekend.
De formule voor de foutmarge is $m = z^{\ast} \sqrt{\frac{p(1-p)}{n}}$. Om $n$ op te lossen, wordt de formule herschreven als:
$$ n = \frac{(z^{\ast})^2 \cdot p(1-p)}{m^2} $$
Als er geen eerdere schatting van $p$ beschikbaar is, wordt een conservatieve schatting van $p^{\ast} = 0.5$ gebruikt, omdat dit de grootste waarde voor het product $p(1-p)$ oplevert en dus de grootste benodigde steekproefgrootte garandeert.
**Voorbeeld:**
Bepaal de steekproefgrootte om $p$ te schatten binnen een marge van 0.03 met 95% betrouwbaarheid.
Voor 95% betrouwbaarheid is $z^{\ast} = 1.96$.
Conservatieve schatting van $p^{\ast} = 0.5$.
Foutmarge $m = 0.03$.
$$ n = \frac{(1.96)^2 \cdot 0.5(1-0.5)}{(0.03)^2} = \frac{3.8416 \cdot 0.25}{0.0009} = \frac{0.9604}{0.0009} \approx 1067.11 $$
Omdat een fractie van een respondent niet mogelijk is, wordt naar boven afgerond. Er zijn dus 1068 respondenten nodig.
---
# Inferentie voor twee proporties
Dit hoofdstuk behandelt methoden voor het vergelijken van twee proporties afkomstig uit verschillende populaties of steekproeven, met inbegrip van betrouwbaarheidsintervallen, significantietoetsen en het relatieve risico.
### 2.1 Het vergelijken van twee proporties
Het vergelijken van twee proporties, aangeduid als $p_1$ en $p_2$ (of $\pi_1$ en $\pi_2$), is essentieel om te bepalen of een bepaald kenmerk relatief vaker voorkomt in populatie 1 dan in populatie 2. De standaardmethode hiervoor is het nemen van een enkelvoudige aselecte steekproef (EAS) uit elke populatie en vervolgens de resulterende steekproefproporties te vergelijken.
#### 2.1.1 Steekproevenverdeling van een verschil tussen twee proporties bij grote steekproeven
Wanneer we twee EAS'en met omvang $n_1$ en $n_2$ trekken uit grote populaties met respectievelijke onbekende proporties $p_1$ en $p_2$, is de steekproefproportie voor de eerste steekproef $\hat{p}_1 = \frac{X_1}{n_1}$ en voor de tweede steekproef $\hat{p}_2 = \frac{X_2}{n_2}$, waarbij $X_1$ en $X_2$ het aantal "successen" in de respectievelijke steekproeven zijn.
Het verschil tussen de twee steekproefproporties, $\hat{p}_1 - \hat{p}_2$, heeft bij benadering een normale verdeling indien de steekproeven groot genoeg zijn. De voorwaarden voor deze benadering zijn doorgaans dat voor beide steekproeven het aantal successen ($n\hat{p}$) en het aantal mislukkingen ($n(1-\hat{p})$) groter dan of gelijk aan 10 zijn.
De gemiddelde waarde van dit verschil is gelijk aan het werkelijke verschil tussen de populatieproporties:
$$ E(\hat{p}_1 - \hat{p}_2) = p_1 - p_2 $$
De standaardfout van het verschil tussen de twee steekproefproporties wordt gegeven door:
$$ SE(\hat{p}_1 - \hat{p}_2) = \sqrt{\frac{p_1(1-p_1)}{n_1} + \frac{p_2(1-p_2)}{n_2}} $$
Omdat de populatieproporties $p_1$ en $p_2$ onbekend zijn, wordt de standaardfout geschat met de steekproefproporties:
$$ \widehat{SE}(\hat{p}_1 - \hat{p}_2) = \sqrt{\frac{\hat{p}_1(1-\hat{p}_1)}{n_1} + \frac{\hat{p}_2(1-\hat{p}_2)}{n_2}} $$
#### 2.1.2 Betrouwbaarheidsinterval van een verschil tussen twee proporties bij grote steekproeven
Een betrouwbaarheidsinterval voor het verschil tussen twee populatieproporties ($p_1 - p_2$) wordt berekend als:
$$ (\hat{p}_1 - \hat{p}_2) \pm z^\ast \times \widehat{SE}(\hat{p}_1 - \hat{p}_2) $$
Hierbij is $z^\ast$ de kritieke waarde uit de standaardnormaalverdeling die overeenkomt met het gewenste betrouwbaarheidsniveau. Dit interval geeft een bereik van plausibele waarden voor het werkelijke verschil tussen de twee populatieproporties.
> **Tip:** De aanname dat de steekproefgrootte groot genoeg is, wordt vaak gecontroleerd door te eisen dat het aantal successen ($n\hat{p}$) en het aantal mislukkingen ($n(1-\hat{p})$) in beide steekproeven minstens 10 zijn.
**Voorbeeld gebruik sociale media:**
Stel, we willen het verschil in gebruik van sociale netwerksites tussen Amerikaanse tieners en volwassenen schatten. Uit een EAS van 800 tieners geeft 73% aan sociale netwerksites te bezoeken, en uit een EAS van 2253 volwassenen geldt dit voor 47%. We stellen een 95% betrouwbaarheidsinterval op voor het verschil $p_1 - p_2$, waarbij $p_1$ de proportie tieners en $p_2$ de proportie volwassenen is.
De steekproefproporties zijn $\hat{p}_1 = 0.73$ en $\hat{p}_2 = 0.47$.
Het verschil is $\hat{p}_1 - \hat{p}_2 = 0.73 - 0.47 = 0.26$.
De geschatte standaardfout is:
$$ \widehat{SE}(\hat{p}_1 - \hat{p}_2) = \sqrt{\frac{0.73(1-0.73)}{800} + \frac{0.47(1-0.47)}{2253}} = \sqrt{\frac{0.1971}{800} + \frac{0.2492}{2253}} \approx \sqrt{0.000246 + 0.000111} \approx \sqrt{0.000357} \approx 0.0189 $$
Voor een 95% betrouwbaarheidsniveau is $z^\ast \approx 1.96$.
De foutmarge is $1.96 \times 0.0189 \approx 0.037$.
Het 95% betrouwbaarheidsinterval is $0.26 \pm 0.037$, wat resulteert in [0.223; 0.297] of [22.3%; 29.7%].
Dit betekent dat we met 95% betrouwbaarheid kunnen stellen dat de proportie Amerikaanse tieners die sociale media gebruiken tussen 22.3% en 29.7% hoger ligt dan bij volwassenen.
#### 2.1.3 Meer-accurate betrouwbaarheidsintervallen voor de vergelijking van proporties
Net als bij inferentie voor een enkele proportie, kan de nauwkeurigheid van betrouwbaarheidsintervallen voor het verschil tussen twee proporties worden verbeterd door een aanpassing toe te passen, zoals het toevoegen van een aantal imaginaire waarnemingen (bijvoorbeeld 2 successen en 2 mislukkingen in elke groep).
#### 2.1.4 Significantie toets voor het vergelijken van proporties
Een significantietoets voor het vergelijken van twee proporties helpt te bepalen of een waargenomen verschil tussen twee steekproefproporties significant is, of dat het waarschijnlijk het gevolg is van toevallige steekproefvariatie.
De nulhypothese is doorgaans $H_0: p_1 - p_2 = 0$, wat equivalent is aan $H_0: p_1 = p_2$.
De alternatieve hypothese kan eenzijdig zijn ($H_a: p_1 > p_2$ of $H_a: p_1 < p_2$) of tweezijdig ($H_a: p_1 \neq p_2$).
Als de nulhypothese waar is ($p_1 = p_2 = p$), dan schatten we de gemeenschappelijke populatieproportie $p$ door de gegevens van beide steekproeven samen te voegen. De gepoelde (of gecombineerde) steekproefproportie, $\hat{p}_{\text{gepoolt}}$, wordt berekend als:
$$ \hat{p}_{\text{gepoolt}} = \frac{X_1 + X_2}{n_1 + n_2} $$
De teststatistiek voor de $z$-toets voor het verschil tussen twee proporties is:
$$ z = \frac{(\hat{p}_1 - \hat{p}_2) - 0}{\sqrt{\hat{p}_{\text{gepoolt}}(1-\hat{p}_{\text{gepoolt}})(\frac{1}{n_1} + \frac{1}{n_2})}} $$
Deze $z$-statistiek volgt bij benadering een standaardnormaalverdeling onder de nulhypothese, mits aan de voorwaarden voor grote steekproeven is voldaan (aantal successen en mislukkingen $\geq 10$ in beide groepen, of soms $\geq 5$ afhankelijk van de bron).
> **Tip:** De $p$-waarde van de toets wordt bepaald uit de standaardnormaalverdeling op basis van de berekende $z$-statistiek en de richting van de alternatieve hypothese. Als de $p$-waarde kleiner is dan het significantieniveau $\alpha$, wordt de nulhypothese verworpen.
**Voorbeeld significantietoets op proporties:**
Onderzoekers willen weten of het percentage kinderen dat zonder ontbijt naar school komt, verschilt tussen twee scholen in achtergestelde wijken. In school 1 hadden 19 van de 80 onderzochte kinderen niet ontbeten ($\hat{p}_1 = 19/80 = 0.2375$). In school 2 hadden 26 van de 150 onderzochte kinderen niet ontbeten ($\hat{p}_2 = 26/150 \approx 0.1733$). We testen met $\alpha = 0.05$.
Hypothesen:
$H_0: p_1 - p_2 = 0$
$H_a: p_1 - p_2 \neq 0$
Voorwaarden:
Random: De data komen van twee EAS'en.
Normaal: Aantal successen en mislukkingen controleren.
School 1: Successen = 19, Mislukkingen = 80 - 19 = 61.
School 2: Successen = 26, Mislukkingen = 150 - 26 = 124.
Beide aantallen zijn groter dan 5 (of 10), dus de normale benadering is redelijk.
Gepoelde proportie:
$$ \hat{p}_{\text{gepoolt}} = \frac{19 + 26}{80 + 150} = \frac{45}{230} \approx 0.1957 $$
$z$-statistiek:
$$ z = \frac{(0.2375 - 0.1733) - 0}{\sqrt{0.1957(1-0.1957)(\frac{1}{80} + \frac{1}{150})}} = \frac{0.0642}{\sqrt{0.1575(0.0125 + 0.00667)}} = \frac{0.0642}{\sqrt{0.1575 \times 0.01917}} \approx \frac{0.0642}{\sqrt{0.00302}} \approx \frac{0.0642}{0.055} \approx 1.167 $$
De $p$-waarde voor een tweezijdige toets bij $z \approx 1.17$ is $P(|Z| > 1.17) \approx 0.2420$.
Omdat $p$-waarde ($0.2420$) > $\alpha$ ($0.05$), kunnen we de nulhypothese niet verwerpen. Er is onvoldoende bewijs om te concluderen dat de proporties kinderen die zonder ontbijt naar school komen significant verschillen tussen de twee scholen.
#### 2.1.5 Relatief Risico
Een andere methode om twee proporties te vergelijken is door de verhouding van de proporties te beschouwen, bekend als het relatieve risico (RR). Het relatieve risico van 1 duidt op gelijke proporties.
$$ RR = \frac{p_1}{p_2} $$
Het berekenen van een betrouwbaarheidsinterval voor het relatieve risico is complexer en vereist doorgaans gespecialiseerde software, maar is gebaseerd op dezelfde inferentiële principes.
**Voorbeeld relatief risico:**
Een studie naar de leeftijd waarop een vrouw haar eerste kind krijgt en het risico op borstkanker toonde aan dat vrouwen die hun eerste kind na hun 30ste kregen, 1.45 keer meer risico op borstkanker liepen dan vrouwen die hun eerste kind voor hun 30ste kregen. De 95% betrouwbaarheidsinterval was [1.34; 1.57]. Dit suggereert dat vrouwen met een eerste kind na hun 30ste een significant verhoogd risico op borstkanker hebben.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Inferentie | Het proces van het trekken van conclusies over een populatie op basis van gegevens uit een steekproef. Dit omvat het maken van schattingen en het toetsen van hypothesen. |
| Proportie (Fractie) | Een deel of aandeel van een geheel, vaak uitgedrukt als een decimaal getal tussen 0 en 1, of als een percentage. In statistiek vertegenwoordigt het de verhouding van een bepaald kenmerk binnen een populatie of steekproef. |
| Betrouwbaarheidsinterval | Een reeks waarden die, met een bepaald betrouwbaarheidsniveau, naar verwachting de ware populatieparameter zal bevatten. Het geeft een bereik van plausibele waarden voor de parameter. |
| Significantieniveau ($\alpha$) | Het gekozen waarschijnlijkheidsdrempel voor het verwerpen van de nulhypothese. Een veelvoorkomende waarde is 0.05, wat betekent dat er een 5% kans is om de nulhypothese onterecht te verwerpen. |
| Steekproevenverdeling | De verdeling van een statistiek (zoals het steekproefgemiddelde of de steekproefproportie) die wordt verkregen door herhaaldelijk steekproeven van dezelfde grootte uit een populatie te trekken. |
| Steekproefproportie ($\hat{p}$) | De proportie van een bepaald kenmerk in een steekproef, gebruikt als schatter voor de populatieproportie. Het wordt berekend als het aantal successen gedeeld door de steekproefgrootte. |
| Standaardfout | De standaarddeviatie van de steekproevenverdeling van een statistiek. Het meet de typische variatie van de statistiek over verschillende steekproeven. |
| Kritieke waarde | Een waarde uit een kansverdeling (zoals de standaardnormaalverdeling of t-verdeling) die wordt gebruikt om de grenzen van een betrouwbaarheidsinterval te bepalen of om een beslissing te nemen bij een significantietoets. |
| Populatieproportie ($p$ of $\pi$) | De werkelijke proportie van een bepaald kenmerk in de gehele populatie. Deze is meestal onbekend en wordt geschat op basis van steekproefgegevens. |
| Significantietoets | Een statistische procedure die wordt gebruikt om te bepalen of er voldoende bewijs is in de steekproefgegevens om de nulhypothese te verwerpen ten gunste van een alternatieve hypothese. |
| Nulhypothese ($H_0$) | Een stelling over een populatieparameter die wordt aangenomen als waar totdat het steekproefbewijs anders aantoont. Vaak stelt deze dat er geen effect of geen verschil is. |
| Alternatieve hypothese ($H_a$) | Een stelling die het tegendeel beweert van de nulhypothese. Het vertegenwoordigt de claim die we proberen te bewijzen met ons steekproefbewijs. |
| p-waarde | De waarschijnlijkheid om een toetsingsgrootheid te observeren die minstens zo extreem is als de geobserveerde toetsingsgrootheid, aangenomen dat de nulhypothese waar is. Een kleine p-waarde (kleiner dan $\alpha$) leidt tot het verwerpen van $H_0$. |
| Plus-vier schatting | Een methode om betrouwbaarheidsintervallen voor proporties te berekenen door twee "successen" en twee "mislukkingen" toe te voegen aan de waarnemingen, wat de nauwkeurigheid verbetert, vooral bij kleinere steekproeven. |
| Gepoelde (gecombineerde) steekproefproportie | Een proportie die wordt berekend door de aantallen "successen" uit twee groepen te combineren en te delen door de totale gecombineerde steekproefgrootte. Dit wordt gebruikt bij het toetsen van de gelijkheid van twee proporties onder de nulhypothese. |
| Relatief Risico (RR) | De verhouding van de kans op een gebeurtenis in een blootgestelde groep ten opzichte van de kans op dezelfde gebeurtenis in een niet-blootgestelde groep. Een RR van 1 betekent geen verschil in risico. |