Cover
Start nu gratis les 26:09- theorie MODULE 1 (H1-H2-H3).pptx
Summary
# Inleiding tot statistiek en variabele types
Dit deel introduceert de fundamentele concepten van toegepaste statistiek, inclusief de definities van data en variabelen, en een categorisering van verschillende variabele types.
### 1.1 Wat is toegepaste statistiek?
Toegepaste statistiek omvat het analyseren van data om wetenschappelijke vragen te beantwoorden. Data worden verzameld door waarnemingen op variabelen. Om uitspraken te kunnen doen over een grotere groep, de doelpopulatie, wordt een steekproef (de onderzoekspopulatie) genomen uit deze doelpopulatie.
### 1.2 Onderzoeksvormen
Verschillende onderzoeksvormen worden gebruikt om data te verzamelen, waaronder cohortstudies (vooruitkijkend), retrospectieve studies en transversale (cross-sectionele) studies. Case-control studies vergelijken twee groepen met verschillende variabelen.
### 1.3 Variabelen: Terminologie
* **Uitkomstvariabele (outcome, afhankelijke variabele):** Dit is de variabele die we willen voorspellen of verklaren.
* **Onafhankelijke variabele (determinant, verklarende variabele, voorspeller, predictor):** Dit zijn de variabelen die gebruikt worden om de uitkomstvariabele te verklaren of te voorspellen.
### 1.4 Soorten variabelen
Variabelen kunnen worden ingedeeld in twee hoofdtypen:
#### 1.4.1 Categorische / categoriale / kwalitatieve variabelen
Dit zijn variabelen die categorieën vertegenwoordigen.
* **Nominaal:** Categorieën zonder natuurlijke ordening (bv. geslacht, bloedgroep).
* **Ordinaal:** Categorieën met een natuurlijke ordening (bv. opleidingsniveau: laag, middel, hoog; ernst van een ziekte: mild, matig, ernstig).
* **Dichotoom:** Een speciaal geval van categorische variabelen met slechts twee categorieën (bv. ja/nee, aanwezig/afwezig). Deze kunnen vaak worden gecodeerd als 1 (aanwezig) en 0 (afwezig) voor analyse.
#### 1.4.2 Numerieke / kwantitatieve variabelen
Dit zijn variabelen die numerieke waarden vertegenwoordigen.
* **Discreet:** Variabelen die gehele getallen of aantallen vertegenwoordigen en vaak het resultaat zijn van tellen (bv. aantal kinderen, aantal ziekenhuisopnames). Tussen opeenvolgende waarden liggen geen waarden.
* **Continu:** Variabelen die in theorie elk waarde binnen een bepaald bereik kunnen aannemen en vaak het resultaat zijn van meten. Er zijn in theorie oneindig veel mogelijke waarden tussen twee willekeurige punten. Dit type wordt verder onderverdeeld in interval- en ratio-schalen, hoewel de specifieke schalen in dit document niet nader gedefinieerd worden voor de student om te kennen.
### 1.5 Soorten statistiek
Er zijn twee hoofdtypen statistiek:
* **Beschrijvende statistiek:** Dit omvat het samenvatten en weergeven van data op een overzichtelijke manier, zowel grafisch als numeriek. Het doel is om de data te structureren en inzichtelijk te maken.
* **Verklarende / inferentiële statistiek:** Dit type statistiek maakt het mogelijk om effecten en relaties te schatten op basis van steekproefdata. Het beoogt de betrouwbaarheid van onderzoeksresultaten te waarborgen en hypothesen te testen.
#### 1.5.1 Grafische weergave van data
Verschillende grafische methoden worden gebruikt om data weer te geven:
* **Categorische variabelen:**
* **Staafdiagram (bar chart):** Geschikt voor het weergeven van frequenties of percentages van categorieën.
* **Geclusterd of gesegmenteerd staafdiagram:** Handig voor het vergelijken van twee categorische variabelen.
* **Taartdiagram (pie chart):** Toont de proportionele verdeling van categorieën.
* **Continue variabelen:**
* **Histogram:** Geeft de frequentieverdeling van continue variabelen weer, waarbij de breedte van de staven de intervalbreedte voorstelt.
* **Tak-en-blad diagram (stem-and-leaf plot):** Een methode om de verdeling van data te tonen waarbij zowel de vorm van de verdeling als de individuele datapunten zichtbaar blijven.
* **Puntenwolk (scatterplot):** Gebruikt om de relatie tussen twee continue variabelen te visualiseren.
* **Box-and-whisker plot (box plot):** Een grafische weergave die de spreiding, centraliteit en uitschieters van een continue variabele toont.
#### 1.5.2 Numerieke weergave van data
Numerieke samenvattingen bieden kwantitatieve informatie over de data:
* **Categorische variabelen:**
* **Frequentietabel:** Toont het aantal waarnemingen (frequentie) en/of de proportie (percentage) voor elke categorie. Het is belangrijk om aan te geven welke data precies worden weergegeven (bv. 'valid percentage' wanneer er geen missende waarden zijn).
* **Continue variabelen:**
* **Centrummaten:** Beschrijven het typische of centrale niveau van de data.
* **Modus:** De meest voorkomende waarde in een dataset. Kan ook voor categorische variabelen gebruikt worden, maar is vaak weinig informatief.
* **Rekenkundig gemiddelde:** De som van alle waarden gedeeld door het aantal waarden. Een goede indicator bij normaal verdeelde variabelen. Formule: $\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}$
* **Mediaan:** De middelste waarde in een geordende dataset (P50). Een alternatief voor het gemiddelde wanneer de data niet normaal verdeeld zijn.
* **Geometrisch gemiddelde:** Gebruikt voor transformatie van rechts scheve variabelen; het is de exponent van het gemiddelde van de natuurlijke logaritmen van de waarden. Formule: $e^{\text{gemiddelde}(\ln(x_i))}$
* **Spreidingsmaten:** Beschrijven de variabiliteit of verspreiding van de data.
* **Variantie ($s^2$):** De gemiddelde gekwadrateerde afwijking van het gemiddelde. Formule: $s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}$
* **Standaarddeviatie ($s$):** De wortel uit de variantie. Geeft de gemiddelde afstand van elke observatie tot het gemiddelde aan. Formule: $s = \sqrt{s^2}$ Alleen een goede indicator bij normaal verdeelde variabelen.
* **Range:** Het verschil tussen de maximum- en minimumwaarde van de data.
* **Interkwartielafstand (IQR):** Het verschil tussen het 75e en 25e percentiel; vertegenwoordigt de spreiding van de middelste 50% van de data.
#### 1.5.3 Normaliteit van data
Het nagaan van de normaliteit van continue variabelen is cruciaal voor de keuze van beschrijvende en verklarende statistische technieken. Dit kan eenvoudig door:
* Observeren van een histogram.
* Vergelijken van het gemiddelde en de mediaan (voor symmetrie).
* Vergelijken van het gemiddelde en de standaarddeviatie (voor een klokvormige verdeling).
Meer formele indicatoren voor normaliteit bestaan ook.
### 1.6 Principes van verklarende statistiek
Verklarende (inferentiële) statistiek maakt het mogelijk om uitspraken te doen over een doelpopulatie op basis van data uit een steekproef.
* **Doelpopulatie:** Gekenmerkt door populatieparameters (bv. populatiegemiddelde $\mu$).
* **Onderzoekspopulatie/steekproef:** Gekenmerkt door steekproefresultaten (bv. steekproefgemiddelde $\bar{x}$), ook wel puntschattingen genoemd.
#### 1.6.1 Toetsen van hypothesen
Het testen van hypothesen is een kernonderdeel van verklarende statistiek.
* **Onderzoeksvraag:** Wordt vertaald naar statistische hypothesen.
* **Nulhypothese ($H_0$):** Stelt geen effect of geen verschil in de doelpopulatie.
* **Alternatieve hypothese ($H_a$):** Geldt als de nulhypothese onwaar is.
Het proces omvat het verzamelen van data in een steekproef en het beoordelen van de generaliseerbaarheid van de onderzoeksresultaten naar de doelpopulatie.
* **Kans op foutmarge (sampling error):** Er is altijd een zekere mate van onzekerheid.
* **Kwantificeren van onzekerheid:** Dit gebeurt door middel van toetsen (kansberekening) en schatten (betrouwbaarheidsintervallen).
#### 1.6.2 Kansberekening (p-waarde)
* **p-waarde (overschrijdingskans):** De kans op het observeren van het onderzoeksresultaat (of een nog extremer resultaat) als de nulhypothese waar zou zijn. Een lage p-waarde (< 0.05 doorgaans) leidt tot het verwerpen van $H_0$.
#### 1.6.3 Schatten van onzekerheid (betrouwbaarheidsinterval)
* **Betrouwbaarheidsinterval (BI):** Een bereik van waarden rond een puntschatting dat de werkelijke populatiewaarde met een bepaalde mate van zekerheid (bv. 95%) bevat.
#### 1.6.4 Factoren die onzekerheid beïnvloeden
De mate van onzekerheid is afhankelijk van:
* **Grootte van de steekproef (N):** Grotere steekproeven leiden tot meer precisie.
* **Spreiding/heterogeniteit van de observaties:** Meer spreiding leidt tot meer onzekerheid. De standard error of the mean (SEM) kwantificeert deze onzekerheid.
#### 1.6.5 Statistische toetsen
* **Teststatistiek:** Een waarde die de mate van bewijs tegen de nulhypothese samenvat. Een grotere teststatistiek impliceert minder compatibiliteit van de data met $H_0$.
* **Theoretische kansverdelingen:** Worden gebruikt om de p-waarde af te leiden op basis van de teststatistiek. Voorbeelden zijn de binomiale verdeling (voor dichotome variabelen) en de normale verdeling (z-verdeling) of t-verdeling (voor continue variabelen).
* **Standaardnormale kansverdeling (z-verdeling):** Een normale verdeling met een gemiddelde van 0 en een standaarddeviatie van 1. De z-score geeft aan hoeveel standaarddeviaties een waarde verwijderd is van het gemiddelde.
* **t-verdeling:** Gelijkaardig aan de z-verdeling maar met bredere staarten, afhankelijk van het aantal vrijheidsgraden (df), wat vaak gelijk is aan $N-1$. De t-verdeling benadert de z-verdeling naarmate N toeneemt.
#### 1.6.6 p-waarde en significantie
* **Significantieniveau ($\alpha$):** Een vooraf bepaalde drempelwaarde, meestal 0.05.
* **Statistisch significant resultaat:** Als de p-waarde kleiner is dan $\alpha$ (p < 0.05), wordt $H_0$ verworpen en $H_a$ aanvaard.
#### 1.6.7 Interpretatie van toetsen en schatten
* **Toetsen:** Een kwalitatieve benadering ("alles-of-niets") die aangeeft óf er een statistisch significant effect is. Vereist kritische interpretatie.
* **Schatten:** Een kwantitatieve benadering die informatie geeft over de grootte van het effect en de onzekerheid errond (via betrouwbaarheidsintervallen). Dit is over het algemeen informatief.
#### 1.6.8 Centrale limietstelling (CLS)
De CLS stelt dat, bij voldoende grote steekproeven, de steekproefgemiddelden een normale kansverdeling zullen volgen, ongeacht de oorspronkelijke verdeling van de variabele. Dit maakt het testen van hypothesen mogelijk, zelfs als de onderliggende variabele niet normaal verdeeld is.
* **Tip:** De CLS is fundamenteel voor veel inferentiële statistische methoden, omdat het de toepassing van normale en t-verdelingen rechtvaardigt, zelfs met niet-normaal verdeelde populaties, mits de steekproefgrootte voldoende is.
#### 1.6.9 Toetsen vs. Schatten
* Als de waarde van de nulhypothese ($H_0$) buiten het 95% betrouwbaarheidsinterval valt, dan is de p-waarde kleiner dan 0.05.
* Het is belangrijk om kritisch te zijn bij het interpreteren van statistische significantie, aangezien een statistisch significant resultaat niet noodzakelijk klinisch relevant is.
---
# Beschrijvende statistiek: grafische en numerieke weergave
Dit deel van de cursus behandelt methoden om data overzichtelijk samen te vatten en weer te geven, zowel grafisch als numeriek.
### 2.1 Overzicht beschrijvende statistiek
Beschrijvende statistiek richt zich op het samenvatten van data om een overzicht te creëren. Dit kan zowel grafisch als numeriek gebeuren. De keuze van de weergavemethode is afhankelijk van het type variabele dat geanalyseerd wordt.
### 2.2 Grafische weergave
Grafische weergaven helpen bij het visualiseren van de verdeling en patronen in data.
#### 2.2.1 Weergave van categorische variabelen
* **Staafdiagram (bar chart):** Geschikt voor nominale en ordinale variabelen. De hoogte van de staven geeft de frequentie of het percentage van elke categorie weer.
* **Geclusterd staafdiagram:** Gebruikt om de distributie van een categorische variabele binnen de categorieën van een andere categorische variabele te vergelijken.
* **Gesegmenteerd staafdiagram:** Gebruikt om de relatieve proporties van subcategorieën binnen elke hoofdcategorie weer te geven.
* **Taartdiagram (pie chart):** Geschikt voor nominale variabelen om de proportionele verdeling van categorieën weer te geven. Elk segment vertegenwoordigt een categorie, waarbij de grootte van het segment evenredig is met de frequentie of het percentage.
#### 2.2.2 Weergave van continue variabelen
* **Histogram:** Toont de frequentieverdeling van continue variabelen. De variabele wordt verdeeld in intervallen (klassen), en de hoogte van de staven geeft de frequentie van observaties binnen elk interval aan.
* **Tak-en-blad diagram (stem-and-leaf plot):** Een methode om zowel de verdeling als de individuele datapunten van continue variabelen weer te geven. Het scheidt elk datapunt in een "tak" (meestal de voorste cijfers) en een "blad" (het laatste cijfer).
* **Puntenwolk (scatterplot):** Wordt gebruikt om de relatie tussen twee continue variabelen weer te geven. Elk punt op de grafiek vertegenwoordigt een observatie met waarden voor beide variabelen.
* **Box-and-whisker plot (box-plot):** Een grafische weergave die de centrale tendens, spreiding en uitschieters van een continue variabele samenvat. Het toont de mediaan, kwartielen en het bereik van de data.
### 2.3 Numerieke weergave
Numerieke samenvattingen bieden concrete waarden om kenmerken van de data te beschrijven.
#### 2.3.1 Weergave van categorische variabelen
* **Frequentietabel:** Een tabel die voor elke categorie van een variabele de absolute frequentie (aantal observaties) en het relatieve percentage weergeeft.
* **Valid percentage:** Het percentage berekend op basis van het aantal geldige observaties, waarbij missende waarden worden uitgesloten.
#### 2.3.2 Centrummaten voor continue variabelen
Centrummaten beschrijven de typische waarde in een dataset.
* **Modus:** De waarde die het meest frequent voorkomt in de dataset. Kan ook worden gebruikt voor categorische variabelen. Het is vaak weinig informatief voor continue variabelen.
* **Rekenkundig gemiddelde ($\bar{x}$ of $\mu$):** De som van alle observaties gedeeld door het aantal observaties. Het is een goede indicator van het centrum, maar gevoelig voor uitschieters. Enkel een goede indicator bij normaal verdeelde variabelen.
$$ \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} $$
* **Mediaan (P50):** De middelste waarde in een geordende dataset. Als er een even aantal observaties is, is het gemiddelde van de twee middelste waarden. De mediaan is een robuuste maat voor het centrum, minder gevoelig voor uitschieters dan het gemiddelde.
* **Geometrisch gemiddelde:** Een alternatief voor het rekenkundig gemiddelde, met name nuttig voor rechts-scheve verdelingen. Het wordt berekend door het gemiddelde te nemen van de natuurlijke logaritmen van de waarden en vervolgens de inverse van de natuurlijke logaritme toe te passen.
$$ \text{Geometrisch gemiddelde} = e^{\left(\frac{\sum_{i=1}^{n} \ln(x_i)}{n}\right)} $$
#### 2.3.3 Spreidingsmaten voor continue variabelen
Spreidingsmaten beschrijven hoe verspreid de data is rond het centrum.
* **Variantie ($s^2$ of $\sigma^2$):** Het gemiddelde van de gekwadrateerde afwijkingen van elke observatie ten opzichte van het gemiddelde. De formule voor de steekproefvariantie is:
$$ s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1} $$
* **Standaarddeviatie ($s$ of $\sigma$):** De vierkantswortel van de variantie. Het vertegenwoordigt de gemiddelde afstand van elke observatie tot het gemiddelde. Net als het gemiddelde, is het een goede indicator bij normaal verdeelde variabelen.
$$ s = \sqrt{s^2} = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1}} $$
* **Range:** Het verschil tussen de maximum- en minimumwaarde in de dataset. Dit is een eenvoudige maat voor spreiding, maar zeer gevoelig voor uitschieters.
$$ \text{Range} = \text{maximum} - \text{minimum} $$
* **Interkwartielafstand (IQR):** Het verschil tussen het derde kwartiel (P75) en het eerste kwartiel (P25). Het vertegenwoordigt de spreiding van de middelste 50% van de data en is minder gevoelig voor uitschieters dan de range.
$$ \text{IQR} = P75 - P25 $$
### 2.4 Normaliteit van continue variabelen
Het beoordelen van de normaliteit van continue variabelen is cruciaal voor de keuze van beschrijvende en verklarende statistische technieken.
#### 2.4.1 Kenmerken van de normale verdeling
* **Symmetrie:** Observaties zijn symmetrisch verdeeld rond het gemiddelde.
* **Gelijk gemiddelde en mediaan:** In een perfect normale verdeling zijn het gemiddelde en de mediaan gelijk.
* **Klokvorm:** De grafiek heeft een kenmerkende klokvorm, waarbij de meeste observaties zich rond het gemiddelde bevinden en de frequentie afneemt naarmate men verder van het gemiddelde afwijkt.
* **Vuistregel:** Ongeveer 95% van de waarnemingen ligt binnen twee standaarddeviaties van het gemiddelde ($\text{gemiddelde} \pm 2 \times \text{sd}$).
#### 2.4.2 Niet-normale verdelingen
* **Rechtse scheve verdeling (skewed to the right):** De staart van de verdeling wijst naar rechts. Hierbij geldt dat het gemiddelde groter is dan de mediaan ($\text{gemiddelde} > \text{mediaan}$).
* **Linkse scheve verdeling (skewed to the left):** De staart van de verdeling wijst naar links. Hierbij geldt dat het gemiddelde kleiner is dan de mediaan ($\text{gemiddelde} < \text{mediaan}$).
#### 2.4.3 Nagaan van normaliteit
* **Visuele inspectie:** Observeren van een histogram of een box-plot.
* **Vergelijken van centrummaten:** Vergelijken van het gemiddelde en de mediaan. Als ze sterk verschillen, kan dit wijzen op scheefheid.
* **Formele statistische tests:** Meer formele methoden (vaak buiten het bestek van dit deel) kunnen worden gebruikt om normaliteit te toetsen.
> **Tip:** Het combineren van centrummaten met spreidingsmaten geeft een completer beeld van de data dan het gebruik van één maat alleen. Bij niet-normaal verdeelde data zijn de mediaan en de interkwartielafstand vaak betere samenvattingen dan het gemiddelde en de standaarddeviatie.
---
# Principes van verklarende statistiek: hypothesetoetsing en schatten
Oké, hier is een gedetailleerde samenvatting van de principes van verklarende statistiek, inclusief hypothesetoetsing en schatten, gebaseerd op de verstrekte documentatie.
## 3. Principes van verklarende statistiek
Dit deel legt de fundamenten van inferentiële statistiek uit, inclusief het formuleren en toetsen van hypothesen, het concept van p-waarden, betrouwbaarheidsintervallen, en de verschillen en relaties tussen toetsen en schatten.
### 3.1 Doel van verklarende statistiek
Verklarende (of inferentiële) statistiek heeft als doel om uitspraken te doen over een **doelpopulatie** door middel van **steekproefresultaten**. Terwijl de doelpopulatie gekenmerkt wordt door parameters, worden in de steekproef (onderzoekspopulatie) steekproefresultaten verzameld, die dienen als punt-schattingen van deze parameters.
Het centrale probleem in verklarende statistiek is het vertalen van de geobserveerde resultaten uit een steekproef naar de bredere doelpopulatie. Hierbij is het cruciaal om de betrouwbaarheid van deze generalisatie te beoordelen en de mate van onzekerheid te kwantificeren. Deze onzekerheid wordt veroorzaakt door de **sampling error**, het inherente verschil tussen de steekproef en de doelpopulatie.
### 3.2 Kwantificeren van onzekerheid
Om de mate van onzekerheid te kwantificeren, maakt verklarende statistiek gebruik van twee hoofdbenaderingen:
1. **Toetsen van hypothesen**: Dit proces maakt gebruik van kansberekening, met name het concept van de p-waarde.
2. **Schatten van de onzekerheid**: Dit wordt gedaan door het berekenen van een betrouwbaarheidsinterval rond het onderzoeksresultaat (de punt-schatting).
### 3.3 Hypothesetoetsing
Hypothesetoetsing start vanuit onderzoeksvragen die betrekking hebben op de doelpopulatie. Deze vragen worden geformuleerd als statistische hypothesen:
* **Nulhypothese ($H_0$)**: Deze hypothese veronderstelt géén effect, verschil of relatie in de doelpopulatie. Het is de "voorzichtige" aanname.
* **Alternatieve hypothese ($H_a$)**: Deze hypothese stelt dat er wél een effect, verschil of relatie is in de doelpopulatie, geldig indien de nulhypothese onwaar is.
Na dataverzameling in een steekproef, wordt geëvalueerd in hoeverre de steekproefdata de nulhypothese ondersteunen.
#### 3.3.1 Het proces van hypothesetoetsing
1. **Formuleren van hypothesen**: Definieer de $H_0$ en $H_a$.
2. **Dataverzameling**: Verzamel data uit een steekproef van de doelpopulatie.
3. **Berekenen van de teststatistiek**: Dit is een waarde die de mate van evidentie tegen de $H_0$ weergeeft, rekening houdend met de onzekerheid (steekproefgrootte $N$ en spreiding). Een grotere teststatistiek impliceert minder compatibiliteit van de data met de $H_0$.
4. **Bepalen van de p-waarde**: De p-waarde is de kans om een onderzoeksresultaat te observeren dat minstens zo extreem is als het gevonden resultaat, *als de nulhypothese waar zou zijn*.
5. **Beslissing**: Vergelijk de p-waarde met een vooraf bepaald significantieniveau ($\alpha$). Doorgaans wordt $\alpha = 0.05$ gehanteerd.
* Als $p < \alpha$: De nulhypothese wordt verworpen en de alternatieve hypothese wordt aanvaard. Het resultaat wordt als **statistisch significant** beschouwd.
* Als $p \ge \alpha$: De nulhypothese wordt niet verworpen op basis van deze studie. Dit betekent *niet* dat de $H_0$ waar of bewezen is, maar slechts dat er onvoldoende bewijs is om deze te verwerpen.
#### 3.3.2 Teststatistieken en kansverdelingen
Teststatistieken volgen theoretische kansverdelingen die rond de $H_0$ zijn gedefinieerd. Deze verdelingen maken het mogelijk de p-waarde af te leiden. Belangrijke verdelingen zijn:
* **Binomiale verdeling**: Voor dichotome uitkomstvariabelen.
* **Standaardnormale kansverdeling (z-verdeling)**: Voor continue uitkomstvariabelen, met een gemiddelde van 0 en een standaarddeviatie van 1. De z-score standaardiseert een variabele door deze uit te drukken in het aantal standaarddeviaties van het gemiddelde.
* **Student's t-verdeling**: Een afgeleide van de z-verdeling, gebruikt bij het schatten van gemiddelden. Deze verdeling is breder dan de z-verdeling en de vorm ervan hangt af van het aantal **vrijheidsgraden** ($df$), dat gerelateerd is aan de steekproefgrootte ($df = N-1$). Naarmate $N$ toeneemt, benadert de t-verdeling de z-verdeling.
#### 3.3.3 Tweezijdig toetsen
Bij tweezijdig toetsen worden hypothesen niet in één specifieke richting geformuleerd. Dit wordt beschouwd als een meer "conservatieve" benadering, waarbij de p-waarde tweemaal zo groot is als bij een eenzijdig toets.
#### 3.3.4 Power van een test
De power van een test is de kans om een waar effect (een onware nulhypothese) correct te detecteren. Het is gelijk aan $1 - \beta$, waarbij $\beta$ de kans op een Type II fout is (het niet verwerpen van een onware $H_0$). De power hangt af van het significantieniveau ($\alpha$), de effectgrootte, de spreiding van de data en de steekproefgrootte.
### 3.4 Schatten van onzekerheid via betrouwbaarheidsintervallen
Een betrouwbaarheidsinterval (BI) biedt een bereik van waarden waarbinnen de werkelijke parameterwaarde in de doelpopulatie met een bepaalde mate van zekerheid ligt.
* Een **95% betrouwbaarheidsinterval** betekent dat we 95% zeker zijn dat de werkelijke waarde in de doelpopulatie binnen dit interval ligt. Dit is gekoppeld aan het significantieniveau $\alpha = 0.05$.
* De breedte van het betrouwbaarheidsinterval weerspiegelt de precisie van de schatting. Een smaller interval duidt op een preciezere schatting.
* De breedte van het BI wordt beïnvloed door de steekproefgrootte ($N$) en de spreiding van de data. Een grotere $N$ en kleinere spreiding leiden tot een smaller interval.
### 3.5 Relatie tussen toetsen en schatten
Er is een nauwe relatie tussen hypothesetoetsing en het berekenen van betrouwbaarheidsintervallen:
* Als de waarde gespecificeerd in de nulhypothese ($H_0$) *buiten* het 95% betrouwbaarheidsinterval valt, dan is de p-waarde kleiner dan 0.05 ($p < 0.05$), wat leidt tot het verwerpen van de $H_0$.
* Omgekeerd, als de waarde van $H_0$ *binnen* het 95% BI valt, dan is $p \ge 0.05$, en wordt de $H_0$ niet verworpen.
#### 3.5.1 Toetsen vs. schatten: een vergelijking
* **Toetsen** wordt vaak gezien als een kwalitatieve benadering ("alles-of-niets"). Het geeft aan of een resultaat statistisch significant is, maar zegt weinig over de grootte van het effect.
* **Schatten** via betrouwbaarheidsintervallen wordt gezien als een kwantitatieve benadering. Het is informatiever omdat het iets zegt over de grootte en precisie van het effect, wat klinisch relevanter kan zijn.
> **Tip:** Hoewel een statistisch significant resultaat belangrijk is, betekent dit niet automatisch dat het resultaat ook klinisch relevant is. De grootte van het effect, zoals weergegeven door het betrouwbaarheidsinterval, is essentieel voor de interpretatie in de praktijk.
### 3.6 Centrale Limietstelling (CLS)
De Centrale Limietstelling is een fundamenteel concept dat stelt dat, bij een voldoende grote steekproef ($N$), het steekproefgemiddelde een normale kansverdeling volgt, *ongeacht de oorspronkelijke verdeling van de variabele in de populatie*. Dit is cruciaal omdat het ons in staat stelt om hypothesetoetsen uit te voeren en betrouwbaarheidsintervallen te berekenen, zelfs als de onderliggende data niet normaal verdeeld is, of als de verdeling onbekend is.
> **Tip:** De CLS is de reden waarom veel statistische methoden, die uitgaan van normaliteit, toch toepasbaar zijn op data die oorspronkelijk niet normaal verdeeld zijn, zolang de steekproef maar groot genoeg is. Een "voldoende grote" steekproef wordt vaak geschat op $N > 30$, maar dit kan variëren afhankelijk van de mate van scheefheid van de oorspronkelijke verdeling.
### 3.7 t-verdeling versus z-verdeling
* De **z-verdeling** wordt gebruikt wanneer de populatiestandaarddeviatie ($\sigma$) bekend is. Dit is in de praktijk zelden het geval.
* De **t-verdeling** wordt gebruikt wanneer de populatiestandaarddeviatie onbekend is en geschat wordt met de steekproefstandaarddeviatie ($s$). De t-verdeling is breder dan de z-verdeling en corrigeert voor de extra onzekerheid die voortkomt uit het schatten van $\sigma$.
* Met toenemende steekproefgrootte ($N$) benadert de t-verdeling de z-verdeling.
> **Conventie:** Hoewel de z-verdeling theoretisch correct is voor grote steekproeven, is het in de praktijk gebruikelijk om altijd de t-verdeling te gebruiken, ongeacht de steekproefgrootte, omdat deze de meest algemene en robuuste keuze is.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Toegepaste statistiek | Het analyseren van data om een wetenschappelijke vraag te beantwoorden. |
| Data | Waarnemingen op variabelen die verzameld worden tijdens een onderzoek. |
| Doelpopulatie | De volledige groep individuen of eenheden waarover uitspraken gedaan willen worden in een onderzoek. |
| Steekproef | Een selectie van individuen of eenheden uit de doelpopulatie, gebruikt om informatie te verzamelen en conclusies over de populatie te trekken. |
| Onderzoekspopulatie | Wordt gelijkgesteld aan de steekproef, de groep die daadwerkelijk geobserveerd en geanalyseerd wordt. |
| Uitkomstvariabele (outcome, afhankelijke variabele) | De variabele die voorspeld of verklaard wordt in een onderzoek; het resultaat dat men wil meten. |
| Onafhankelijke variabele (determinant, verklarende variabele, voorspeller, predictor) | De variabele die wordt gebruikt om de uitkomstvariabele te verklaren of te voorspellen. |
| Categorische variabele | Een variabele die waarden aanneemt die tot discrete categorieën behoren, zoals geslacht of bloedgroep. |
| Nominale variabele | Een categorische variabele zonder natuurlijke ordening; categorieën zijn gelijkwaardig (bv. kleuren). |
| Ordinale variabele | Een categorische variabele met een natuurlijke ordening of rangschikking tussen de categorieën (bv. opleidingsniveau). |
| Dichotome variabele | Een categorische variabele met slechts twee mogelijke categorieën (bv. ja/nee, man/vrouw). |
| Numerieke variabele (kwantitatieve variabele) | Een variabele die numerieke waarden aanneemt die gemeten of geteld kunnen worden. |
| Discrete variabele | Een numerieke variabele waarbij de waarden tellende getallen zijn, meestal zonder tussenliggende waarden (bv. aantal kinderen). |
| Continue variabele | Een numerieke variabele waarbij de waarde in theorie elke waarde binnen een bepaald bereik kan aannemen (bv. lengte, gewicht). |
| Beschrijvende statistiek | Het samenvatten van data op een overzichtelijke manier, zowel grafisch als numeriek, om inzicht te geven in de data. |
| Verklarende statistiek (inferentiële statistiek) | Het schatten van effecten en relaties, het toetsen van hypothesen en het trekken van conclusies over een populatie op basis van een steekproef. |
| Staafdiagram (bar chart) | Een grafische weergave van de frequentie of proportie van categorische variabelen, met staven die de categorieën vertegenwoordigen. |
| Taartdiagram (pie chart) | Een cirkelvormige grafiek die de proportionele verdeling van categorieën in een dataset weergeeft. |
| Histogram | Een grafische weergave van de frequentieverdeling van continue variabelen, met aangrenzende staven die de frequentie in bepaalde intervallen aangeven. |
| Tak-en-blad diagram (stem-and-leaf plot) | Een grafische methode om data te visualiseren die zowel de vorm van de verdeling als de individuele datapunten toont. |
| Puntenwolk (scatterplot) | Een grafische weergave die de relatie tussen twee continue variabelen toont, waarbij elk punt een observatiepaartje vertegenwoordigt. |
| Frequentietabel | Een tabel die de frequentie (aantal voorkomens) van elke waarde of categorie van een variabele weergeeft. |
| Centrummaten | Statistieken die het "midden" of de typische waarde van een dataset samenvatten (bv. modus, gemiddelde, mediaan). |
| Modus | De waarde die het vaakst voorkomt in een dataset. |
| Rekenkundig gemiddelde | De som van alle waarden gedeeld door het aantal waarden; het meest gebruikte gemiddelde. |
| Mediaan | De middelste waarde in een geordende dataset; het punt waaronder 50% van de data valt (P50). |
| Geometrisch gemiddelde | Een gemiddelde dat wordt gebruikt voor exponentiële groei of veranderende percentages, berekend als de n-de wortel van het product van n getallen of de exponent van het gemiddelde van de logaritmen. |
| Spreidingsmaten | Statistieken die de variabiliteit of de spreiding van data rond het centrum weergeven (bv. variantie, standaarddeviatie, range, interkwartielafstand). |
| Variantie | De gemiddelde gekwadrateerde afwijking van elke observatie tot het gemiddelde; een maat voor spreiding. |
| Standaarddeviatie (sd) | De vierkantswortel van de variantie; geeft de gemiddelde afstand van observaties tot het gemiddelde aan in de oorspronkelijke eenheden. |
| Range | Het verschil tussen de maximum- en minimumwaarde in een dataset. |
| Interkwartielafstand (IQR) | Het verschil tussen het derde kwartiel (P75) en het eerste kwartiel (P25); vertegenwoordigt de spreiding van de middelste 50% van de data. |
| Box-en-whisker plot (box-plot) | Een grafische weergave die de centrale tendens, spreiding en uitschieters van een dataset samenvat, gebaseerd op kwartielen. |
| Normaliteit | De eigenschap van data om een symmetrische, klokvormige verdeling te volgen, zoals de normale verdeling. |
| Normale verdeling | Een continue kansverdeling die symmetrisch is rond het gemiddelde en klokvormig is; vele natuurlijke fenomenen volgen deze verdeling. |
| Scheve verdeling (skewed distribution) | Een asymmetrische verdeling waarbij de data meer geconcentreerd is aan één kant; kan naar rechts (positief scheef) of naar links (negatief scheef) zijn. |
| Transformatie | Wiskundige bewerkingen (zoals het nemen van de natuurlijke logaritme) toegepast op data om de verdeling ervan te wijzigen, vaak om deze normaler te maken. |
| P-waarde (overschrijdingskans) | De kans om een onderzoeksresultaat te verkrijgen dat minstens zo extreem is als het waargenomen resultaat, aangenomen dat de nulhypothese waar is. |
| Betrouwbaarheidsinterval (BI) | Een reeks waarden die, met een bepaalde mate van zekerheid (bv. 95%), de werkelijke populatiewaarde van een parameter bevat. |
| Hypothesetoetsing | Een statistische methode om te bepalen of er voldoende bewijs is om een nulhypothese te verwerpen ten gunste van een alternatieve hypothese. |
| Nulhypothese (H0) | De hypothese die stelt dat er geen effect, verschil of relatie is in de doelpopulatie. |
| Alternatieve hypothese (Ha) | De hypothese die stelt dat er wel een effect, verschil of relatie is, die wordt aanvaard als de nulhypothese wordt verworpen. |
| Significantieniveau (α) | De drempelwaarde (vaak 0.05) waaronder de p-waarde wordt beschouwd als "klein genoeg" om de nulhypothese te verwerpen. |
| Statisch significant | Een resultaat waarbij de p-waarde lager is dan het significantieniveau, wat aangeeft dat het resultaat waarschijnlijk niet aan toeval te wijten is. |
| Teststatistiek | Een waarde berekend uit steekproefdata die gebruikt wordt om te toetsen of de nulhypothese verworpen kan worden. |
| Kansverdeling (probabiliteitsdistributie) | Een wiskundige functie die de kans op verschillende uitkomsten van een willekeurige variabele beschrijft. |
| Standaardnormale kansverdeling (z-verdeling) | Een normale verdeling met een gemiddelde van 0 en een standaarddeviatie van 1, gebruikt voor toetsing van gemiddelden bij grote steekproeven. |
| Student's t-verdeling | Een kansverdeling die lijkt op de z-verdeling maar breder is, vooral bij kleinere steekproeven; gebruikt voor toetsing van gemiddelden wanneer de populatiestandaarddeviatie onbekend is. |
| Vrijheidsgraden (df) | Een parameter die de t-verdeling bepaalt, gerelateerd aan de steekproefgrootte (vaak N-1). |
| Centrale limietstelling (CLS) | Stelt dat, ongeacht de oorspronkelijke verdeling van een variabele, het steekproefgemiddelde van voldoende grote steekproeven normaal verdeeld zal zijn. |
| Eenzijdig toetsen | Het toetsen van een hypothese waarbij de alternatieve hypothese een specifieke richting van het effect impliceert. |
| Tweezijdig toetsen | Het toetsen van een hypothese waarbij de alternatieve hypothese een effect in beide richtingen (positief of negatief) toestaat. |
| Type I fout | Het ten onrechte verwerpen van de nulhypothese (vals positief). |
| Type II fout | Het ten onrechte niet verwerpen van de nulhypothese (vals negatief). |
| Power van een test | De kans om een werkelijk bestaand effect te detecteren, oftewel 1 min de kans op een Type II fout (1 - β). |
| Betrouwbaarheid van meetinstrumenten | De mate waarin een meetinstrument consistente resultaten oplevert onder vergelijkbare omstandigheden. |