Cover
ابدأ الآن مجانًا stat samenvatting testen.pdf
Summary
# Overzicht van biostatistische testen
Dit document geeft een overzicht van biostatistische testen, ingedeeld op basis van het type data en de onderzoeksvraag (verschillen of relaties), en onderscheidt parametrische van non-parametrische benaderingen met hun assumpties [2](#page=2).
### 1.1 Parametrische versus non-parametrische testen
Biostatistische testen kunnen worden onderverdeeld in parametrische en non-parametrische benaderingen. De keuze tussen deze twee hangt af van of de assumpties voor parametrische testen voldaan zijn [2](#page=2).
#### 1.1.1 Parametrische testen
Parametrische testen gaan ervan uit dat de data een specifieke verdeling volgt, vaak een normale verdeling. Ze worden gebruikt voor continue data en wanneer de assumpties voldaan zijn [2](#page=2).
* **Verschillen tussen groepen:**
* **Twee groepen:** Student's unpaired T-test (voor onafhankelijke groepen) of Paired T-test (voor afhankelijke/gepaarde groepen) ] [2](#page=2).
* **Tip:** Indien de resultaten significant zijn, kunnen paarsgewijze testen zoals Tukey's of Bonferroni's worden toegepast voor verdere analyse [2](#page=2).
* **Meer dan twee groepen:** ANOVA (Analysis of Variance) ] [2](#page=2).
* **Tip:** Indien de resultaten significant zijn, kunnen paarsgewijze testen zoals Tukey's of Bonferroni's worden toegepast voor verdere analyse [2](#page=2).
* **Relaties tussen variabelen:**
* **Pearson's correlatie (r):** Meet de lineaire relatie tussen twee continue variabelen [2](#page=2).
#### 1.1.2 Non-parametrische testen
Non-parametrische testen hebben minder strikte assumpties over de datadistributie en worden vaak gebruikt wanneer de assumpties van parametrische testen niet voldaan zijn of wanneer de data discreet of categorisch is [2](#page=2).
* **Verschillen tussen groepen:**
* **Twee groepen:** Mann-Whitney U test of Wilcoxon rank sum test (voor onafhankelijke groepen) . Indien de resultaten significant zijn, kunnen paarsgewijze testen met de Wilcoxon-Mann-Whitney test worden uitgevoerd [2](#page=2).
* **Meer dan twee groepen:** Kruskal-Wallis Test [2](#page=2).
* **Tip:** Indien significant, kunnen paarsgewijze testen met de Wilcoxon-Mann-Whitney test worden toegepast [2](#page=2).
* **Relaties tussen variabelen:**
* **Spearman's rank correlation:** Meet de rang-ordinale relatie tussen twee variabelen [2](#page=2).
### 1.2 Testen op basis van data type en onderzoeksvraag
De keuze voor een biostatistische test hangt af van het type data (discreet/categorisch of continu) en de onderzoeksvraag (verschillen of relaties) ] [2](#page=2).
#### 1.2.1 Testen voor verschillen
* **Continue data:**
* **Twee groepen:** Student's unpaired T-test, Paired T-test (parametrisch) of Mann-Whitney U/Wilcoxon rank sum test (non-parametrisch) ] [2](#page=2).
* **Meer dan twee groepen:** ANOVA (parametrisch) of Kruskal-Wallis test (non-parametrisch) ] [2](#page=2).
* **Discreet/categorische data:**
* **Pearson's chi-square tests:** Gebruikt voor het onderzoeken van verschillen of relaties tussen categorische variabelen. Deze kunnen worden toegepast op one-sample en two-sample situaties [2](#page=2).
#### 1.2.2 Testen voor relaties
* **Pearson's correlatie (r):** Voor continue data [2](#page=2).
* **Spearman's rank correlation:** Voor rang-ordinale data [2](#page=2).
### 1.3 Overwegingen bij de keuze van testen
#### 1.3.1 Assumpties en data transformatie
Bij de keuze van een statistische test is het cruciaal om te evalueren of de assumpties van de test voldaan zijn. Indien de assumpties voor parametrische testen niet voldaan zijn, kan data transformatie een optie zijn om de assumpties te normaliseren. Indien data transformatie niet slaagt, moet worden uitgeweken naar een non-parametrische test [2](#page=2).
#### 1.3.2 Onafhankelijke data
De testen worden ook geselecteerd op basis van de onafhankelijkheid van de data. Voor onafhankelijke data worden andere testen gebruikt dan voor afhankelijke of gepaarde data [2](#page=2).
* **Tip:** Een handig schema op basis van data type, de onderzoeksvraag en parametrische/non-parametrische benaderingen helpt bij het maken van de juiste keuze [2](#page=2).
---
# Relaties en correlaties in data
Dit hoofdstuk behandelt methoden voor het onderzoeken van relaties tussen variabelen, met een focus op correlatieanalyses en regressieanalyse [2](#page=2).
### 2.1 Correlatieanalyse
Correlatieanalyse wordt gebruikt om de sterkte en richting van de lineaire relatie tussen twee continue variabelen te meten. Er zijn verschillende typen correlatieanalyses, afhankelijk van de aard van de data en de te onderzoeken relatie [2](#page=2).
#### 2.1.1 Pearson's correlatiecoëfficiënt ($r$)
Pearson's correlatiecoëfficiënt, aangeduid met $r$, meet de sterkte van de lineaire relatie tussen twee continue variabelen. De waarde van $r$ ligt tussen -1 en +1 [2](#page=2).
* Een waarde van +1 geeft een perfecte positieve lineaire relatie aan.
* Een waarde van -1 geeft een perfecte negatieve lineaire relatie aan.
* Een waarde van 0 geeft aan dat er geen lineaire relatie is.
De berekening van Pearson's $r$ vereist dat de data voldoet aan bepaalde assumpties, zoals normaliteit en lineariteit. Indien de assumpties niet voldaan zijn, kan data transformatie nodig zijn [2](#page=2).
#### 2.1.2 Spearman's rangcorrelatie
Spearman's rangcorrelatie is een non-parametrische meting van de monotone relatie tussen twee variabelen. In tegenstelling tot Pearson's $r$, vereist Spearman's rangcorrelatie niet dat de data normaal verdeeld is. Deze methode is nuttig wanneer de relatie niet strikt lineair is of wanneer er sprake is van ordinale data. De berekening is gebaseerd op de rangen van de data [2](#page=2).
### 2.2 Regressieanalyse
Regressieanalyse is een statistische methode die gebruikt wordt om de relatie tussen een afhankelijke variabele en een of meer onafhankelijke variabelen te modelleren. Het doel is om een voorspellend model te creëren [2](#page=2).
#### 2.2.1 Lineaire regressie
Een veelvoorkomende vorm is de lineaire regressie, die wordt gebruikt om de lineaire relatie tussen een continue afhankelijke variabele en een of meer continue of categorische onafhankelijke variabelen te analyseren. Het resultaat is een regressievergelijking die de verwachte waarde van de afhankelijke variabele kan voorspellen op basis van de waarden van de onafhankelijke variabelen.
> **Tip:** Regressieanalyse kan zowel voor voorspellende als verklarende doeleinden worden ingezet. Het is cruciaal om de assumpties van de gekozen regressiemethode te controleren om de validiteit van de resultaten te waarborgen [2](#page=2).
### 2.3 Keuze van analyse
De keuze tussen correlatieanalyse en regressieanalyse, en de specifieke test binnen deze categorieën, hangt af van de onderzoeksvraag en de aard van de data (continue, discrete, categorische variabelen) [2](#page=2).
* **Relaties** worden primair onderzocht met correlatieanalyse en regressieanalyse [2](#page=2).
* **Verschillen** tussen groepen worden onderzocht met andere statistische tests zoals t-toetsen, ANOVA, Mann-Whitney U, of Kruskal-Wallis, afhankelijk van het aantal groepen en de parametrische/non-parametrische aard van de data [2](#page=2).
> **Tip:** Een belangrijk onderscheid is dat correlatie de *sterkte van de relatie* aangeeft, terwijl regressie een *voorspellend model* opstelt. Correlatie impliceert geen causaliteit [2](#page=2).
---
# Meten van overeenkomst en nauwkeurigheid
Dit gedeelte behandelt het concept van het meten van de overeenkomst tussen een gemeten waarde en een aangenomen werkelijke waarde, met nadruk op de kwantificering van nauwkeurigheid [3](#page=3).
### 3.1 De maat voor overeenkomst
De overeenkomst tussen een gemeten waarde en de aangenomen werkelijke waarde wordt gekwantificeerd door middel van een specifieke maatstaf. Deze maatstaf is gebaseerd op het verschil tussen het experimenteel verkregen gemiddelde en de veronderstelde werkelijke waarde [3](#page=3).
#### 3.1.1 Formule voor de maat van overeenkomst
De formule die het verschil tussen het experimentele gemiddelde en de werkelijke waarde weergeeft, wordt als volgt uitgedrukt:
Het experimentele gemiddelde wordt hier aangeduid met $\mu$ [3](#page=3).
De aangenomen werkelijke waarde wordt ook aangeduid met $\mu$ [3](#page=3).
De maat voor de overeenkomst wordt gedefinieerd als het verschil tussen het experimentele gemiddelde en de aangenomen werkelijke waarde. Hoewel de precieze formule niet expliciet in de verstrekte tekst staat, wordt het concept beschreven als een "maat voor de overeenkomst tussen de gemeten waarde en de (aangenomen) echte waarde = experimenteel gemiddelde waarde $\mu$ = aangenomen echte waarde". Dit suggereert dat nauwkeurigheid in feite de afwijking van het gemiddelde van de metingen ten opzichte van de werkelijke waarde is [3](#page=3).
> **Tip:** In de context van metingen is het cruciaal om te onderscheiden tussen nauwkeurigheid (hoe dicht de metingen bij de werkelijke waarde liggen) en precisie (hoe dicht de metingen bij elkaar liggen). Dit gedeelte focust specifiek op nauwkeurigheid.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Biostatistiek | Een tak van de statistiek die zich bezighoudt met de ontwikkeling en toepassing van statistische methoden in biologische en medische wetenschappen. Het helpt bij het interpreteren van data verkregen uit experimenten en observaties. |
| Pearson's chi-square test | Een statistische test die gebruikt wordt om te bepalen of er een significant verband bestaat tussen twee categorische variabelen door de geobserveerde frequenties te vergelijken met de verwachte frequenties onder de nulhypothese van onafhankelijkheid. |
| Onafhankelijke data | Data waarbij de observaties binnen een dataset geen invloed hebben op elkaar. Dit is een belangrijke aanname voor veel statistische toetsen. |
| Regressieanalyse | Een reeks statistische methoden die worden gebruikt om de relatie tussen een afhankelijke variabele en een of meer onafhankelijke variabelen te modelleren. Het doel is om de afhankelijke variabele te voorspellen op basis van de onafhankelijke variabelen. |
| Correlatieanalyse | Een statistische methode die wordt gebruikt om de sterkte en richting van een lineair verband tussen twee continue variabelen te meten. Het resultaat is een correlatiecoëfficiënt. |
| Spearman's rank correlation | Een non-parametrische maat voor de correlatie tussen de rangschikkingen van twee variabelen. Het meet de sterkte en richting van de associatie tussen twee variabelen op ordinaal niveau. |
| Pearson's correlatie(r) | Een parametrische maat voor de lineaire correlatie tussen twee continue variabelen. De coëfficiënt, aangeduid met 'r', varieert van -1 tot +1, waarbij 1 perfecte positieve correlatie, -1 perfecte negatieve correlatie en 0 geen lineaire correlatie aangeeft. |
| F-test | Een statistische test die wordt gebruikt om de varianties van twee of meer populaties te vergelijken. Het wordt vaak gebruikt in de context van ANOVA om te testen of de groepsgemiddelden significant van elkaar verschillen. |
| Data transformatie | Een techniek die wordt toegepast op data om de verdeling ervan te wijzigen, vaak om te voldoen aan de assumpties van parametrische statistische testen, zoals normaliteit of homogeniteit van varianties. |
| Kruskal-Wallis Test | Een non-parametrische statistische test die wordt gebruikt om te bepalen of er significante verschillen zijn tussen de medianen van drie of meer onafhankelijke groepen. Het is de non-parametrische equivalent van een eenweg ANOVA. |
| Mann-Whitney U test | Een non-parametrische statistische test die gebruikt wordt om te bepalen of er significante verschillen zijn tussen de medianen van twee onafhankelijke groepen. Het is de non-parametrische equivalent van de ongepaarde T-test. |
| Wilcoxon rank sum test | Een synoniem voor de Mann-Whitney U test, een non-parametrische test om twee onafhankelijke groepen te vergelijken. |
| Paarsgewijze testen | Statistische toetsen die worden uitgevoerd nadat een significante resultaat is gevonden in een analyse met meerdere groepen (zoals ANOVA of Kruskal-Wallis), om specifieke paren van groepen te vergelijken en te bepalen welke groepen van elkaar verschillen. |
| ANOVA (Analysis of Variance) | Een statistische methode die wordt gebruikt om verschillen tussen de gemiddelden van drie of meer groepen te analyseren. Het deelt de totale variatie in de data op in verschillende bronnen van variatie. |
| Student's unpaired T-test | Een parametrische statistische test die wordt gebruikt om de gemiddelden van twee onafhankelijke groepen te vergelijken. Het controleert of het verschil tussen de gemiddelden statistisch significant is. |
| Paired T-test | Een parametrische statistische test die wordt gebruikt om de gemiddelden van twee gerelateerde metingen te vergelijken, zoals metingen voor en na een behandeling bij dezelfde individuen. |
| Tukey's HSD (Honestly Significant Difference) | Een post-hoc test die wordt gebruikt na een significante ANOVA om te bepalen welke specifieke paren van groepsgemiddelden statistisch significant van elkaar verschillen. |
| Bonferroni correctie | Een methode om de significantiedrempel aan te passen bij het uitvoeren van meerdere statistische toetsen om het risico op een type I fout (onterechte verwerping van de nulhypothese) te verminderen. |
| Discreet, categorisch | Beschrijft data die worden geclassificeerd in distincte, niet-overlappende categorieën. Categorische data kunnen nominaal (geen inherente volgorde) of ordinaal (wel een volgorde) zijn. |
| Continue data | Beschrijft data die elke waarde binnen een bepaald bereik kunnen aannemen, zoals lengte, gewicht of temperatuur. Deze data kunnen theoretisch oneindig veel waarden hebben. |
| Variatie | De mate waarin data punten verspreid zijn rondom het gemiddelde. Statistieken zoals variantie en standaarddeviatie meten dit. |
| Gemiddelde | De som van alle waarden in een dataset gedeeld door het aantal waarden. Het is een maat voor de centrale tendens van de data. |
| Non-parametrisch | Een klasse van statistische testen die geen aannames doen over de verdeling van de populatie waaruit de data zijn getrokken, zoals normaliteit. Ze zijn geschikt voor data op ordinaal of nominaal niveau, of voor parametrische data die niet aan de assumpties voldoen. |
| Parametrisch | Een klasse van statistische testen die aannames doen over de verdeling van de populatie, meestal dat de data normaal verdeeld zijn. Ze worden doorgaans gebruikt voor continue data. |
| Overeenkomst | De mate waarin twee of meer metingen of observaties vergelijkbaar zijn. In de context van metingen, verwijst het naar de nauwkeurigheid en precisie van de gemeten waarde ten opzichte van de werkelijke waarde. |
| Experimenteel gemiddelde waarde | Het gemiddelde van metingen verkregen uit een experiment of studie. |
| Aangenomen echte waarde ($\mu$) | De theoretische of werkelijke waarde van een parameter of meting, die vaak als referentie wordt gebruikt bij het evalueren van de nauwkeurigheid van experimentele resultaten. |