Cover
Inizia ora gratuitamente Hoorcollege 1_2025.pdf
Summary
# Algemene informatie en studievoorbereiding
Dit gedeelte biedt een overzicht van het vak statistiek, de benodigde voorbereiding, beschikbare studiematerialen, communicatiekanalen en evaluatiemethoden.
### 1.1 Algemeen
* Het vak statistiek is bedoeld om studenten een grondig inzicht te verschaffen in de basisbegrippen van de statistiek [4](#page=4).
* Het succesvol afronden van dit vak vereist een stevige kennis van statistiek, wat essentieel is voor de studie van menselijk gedrag [4](#page=4).
* Deze kennis bereidt studenten direct voor op andere statistiekvakken, stelt hen in staat om gegevens van eigen onderzoek te verwerken (zoals voor een masterproef of practicum methoden), en helpt bij het lezen van wetenschappelijke artikelen [4](#page=4).
* Bovendien traint het vak het vermogen om nieuwe problemen te vatten, te structureren en scherp te denken [4](#page=4).
* Het vak telt 7 studiepunten, wat neerkomt op 25 tot 30 studie-uren per studiepunt [4](#page=4).
* Het is cruciaal om de studiewijzer op Toledo aandachtig te lezen [4](#page=4).
### 1.2 Voorkennis en voorbereiding
* Statistiek bouwt voort op wiskundige voorkennis uit het secundair onderwijs [5](#page=5).
* Studenten die hun voorkennis willen controleren, kunnen een voorkennistoets op Toledo afleggen. Deze toets is de enige manier om ingedeeld te worden in een practicumgroep en mag zonder rekenmachine gemaakt worden. De deadline voor deze toets is 26 september [5](#page=5).
* Om de voorkennis bij te spijkeren, kan gebruik gemaakt worden van ALEKS [5](#page=5).
### 1.3 Communicatiekanalen
* Het primaire communicatieplatform is Toledo, specifiek de cursus P0X74a Statistiek voor psychologen, deel 1: theorie. Hier worden mededelingen, praktische informatie, lesmateriaal per hoorcollege en practicum, en een discussieforum gedeeld [6](#page=6).
* E-mail dient zo weinig mogelijk gebruikt te worden. Inhoudelijke vragen horen niet via e-mail of Toledo gesteld te worden. Voor praktische vragen die niet in de studiewijzer of FAQ worden behandeld, kan men terecht op statistiekpsy1@kuleuven.be [6](#page=6).
### 1.4 Studiemateriaal
* Het studiemateriaal omvat slides die beschikbaar zijn op Toledo [7](#page=7).
* Daarnaast worden practicumopgaven en bijbehorende oplossingen via Toledo aangeboden [7](#page=7).
* De voorgeschreven rekenmachine is de TI-30XS/XB MultiView (CuDi) [7](#page=7).
### 1.5 Onderwijsactiviteiten
* **Hoorcolleges:** Deze sessies behandelen de eigenlijke leerstof [8](#page=8).
* **Vragencolleges:** Er zijn twee vragencolleges gepland. Studenten dienen hun vragen vooraf in te dienen via Toledo, uiterlijk op maandagochtend om 9 uur. Opnames van deze colleges zijn achteraf beschikbaar op Toledo, tenzij er technische problemen zijn [8](#page=8).
> **Tip:** Het is strikt verboden om geluids- of beeldopnames te maken van onderwijsactiviteiten omwille van auteursrecht. Het is tevens verboden om leermateriaal verder te vermenigvuldigen en verspreiden [8](#page=8).
* **Practica:** In kleinere groepen worden oefeningen gemaakt onder begeleiding van een practicumbegeleider. Studenten die nieuw zijn in de opleiding worden automatisch ingedeeld in een reguliere practicumgroep na het afleggen van de voorkennistoets. Studenten die het vak herkansen, kunnen zich inschrijven voor een reguliere groep of een bisgroep indien er een grote achterstand is, via een link in de studiewijzer [9](#page=9).
* **Begeleidingssessies:** Dit zijn sessies op afspraak waarbij studenten vragen kunnen stellen aan een practicumbegeleider over zowel theorie als oefeningen. Per tijdslot zijn er maximaal 4 studenten. Studenten die zich inschrijven maar zonder geldige reden niet komen opdagen, verliezen de kans om zich nadien nog in te schrijven [10](#page=10).
* **Proefexamen:** Er wordt een proefexamen georganiseerd op 3 november. Dit examen telt niet mee voor het eindresultaat, maar is sterk aanbevolen. Het vindt on campus plaats, vergelijkbaar met het echte examen, maar duurt slechts 1,5 uur en behandelt een beperkt deel van de leerstof [11](#page=11).
### 1.6 Leerstrategieën
* Vermijd uitstelgedrag [12](#page=12).
* Verwerk de leerstof actief [12](#page=12).
* Oefeningen mogen niet "verbrand" worden; ze moeten actief gebruikt worden om begrip te bevorderen [12](#page=12).
* Maak optimaal gebruik van de geboden begeleidingsmogelijkheden [12](#page=12).
### 1.7 Evaluatie
* Het examen vindt plaats op 12 januari 2026 [13](#page=13).
* Het examen is schriftelijk, duurt 3 uur, en mag enkel met de rekenmachine gemaakt worden [13](#page=13).
* Het examen bestaat uit 16 meerkeuzevragen met giscorrectie en 4 open vragen [13](#page=13).
* De oefeningen op het examen peilen naar inzicht en transfer van de leerstof [13](#page=13).
* Examenfeedback wordt voorzien in de periodes van 9 tot 12 februari en 11 tot 17 september. Tijdens deze momenten kan de eigen examenkopie samen met de modelantwoorden ingekeken worden; dit is achteraf niet meer mogelijk [14](#page=14).
### 1.8 Veelgestelde vragen (FAQ)
* **Bijles:** De meest efficiënte manier om bijstand te krijgen, is door wekelijks gratis gebruik te maken van de begeleidingssessies bij de practicumbegeleiders. Externe bijlesgevers zijn niet op de hoogte van de recente wijzigingen aan het vak, en de universiteit werkt nooit samen met dergelijke bijlesgevers [15](#page=15).
---
# Objectieven en situering van de statistiek
Statistiek kent drie hoofddoelstellingen: het ontwerpen van proefopzetten voor gegevensverzameling, het beschrijven van verzamelde gegevens, en het induceren van algemenere informatie vanuit deze gegevens. Dit vak deelt de statistiek in over deze doelstellingen heen [17](#page=17).
### 2.1 De hoofddoelstellingen van de statistiek
#### 2.1.1 Ontwerpen van proefopzetten voor gegevensverzameling
Het ontwerpen van een geschikte proefopzet (experimental design) is de eerste cruciale stap voor een onderzoeker, zoals een psycholoog, die specifieke vragen wil beantwoorden. Dit plan bepaalt hoe gegevens zodanig verzameld moeten worden dat er een efficiënt antwoord op de onderzoeksvragen mogelijk is [18](#page=18).
#### 2.1.2 Methoden om aspecten van gegevens te beschrijven (beschrijvende statistiek)
* **Functie:** De beschrijvende statistiek, ook wel exploratieve data-analyse genoemd, richt zich op het omgaan met gegevens die vaak een veelheid van ongeordende informatie vormen [19](#page=19).
* **Taken:** De beschrijvende statistiek omvat taken zoals het controleren van de juistheid van gegevens, het systematisch ordenen en presenteren van gegevens om inzicht te verschaffen, het identificeren van ongebruikelijke observaties, patronen en relaties, en het samenvatten en communiceerbaar maken van de gegevens [19](#page=19).
* **Belang van grafische representaties:** Grafische voorstellingen spelen een groot belang in het proces van beschrijvende statistiek [19](#page=19).
* **Publieke perceptie:** Veel 'leken' identificeren statistiek uitsluitend met de producten van de beschrijvende statistiek [19](#page=19).
#### 2.1.3 Methoden om vanuit gegevens algemenere informatie te induceren (inductieve statistiek)
* **Context:** De gegevens waarmee een onderzoeker werkt en waarop conclusies gebaseerd worden, zijn altijd specifiek. Echter, in veel gevallen is de onderzoeker geïnteresseerd in het trekken van algemenere conclusies [20](#page=20).
* **Inductie:** Dit proces van algemenisering impliceert een overstijgen van de specifieke gegevens, wat neerkomt op een vorm van inductie [20](#page=20).
* **Redenering:**
* **Deductie:** Gaat van het algemene naar het bijzondere. Een voorbeeld is: "Alle mensen zijn sterfelijk. Harry Styles is een mens. Dus, Harry Styles is sterfelijk." [21](#page=21).
* **Inductie:** Gaat van het bijzondere naar het algemene. Een voorbeeld is: "Einstein is sterfelijk. Queen Elizabeth is sterfelijk. Mijn grootmoeder is sterfelijk. [...] Dus, alle mensen zijn sterfelijk." [21](#page=21).
* **Populatie en steekproef:** Inductieve statistiek werkt met concepten van populatie en steekproef [22](#page=22).
* **Steekproef:** De specifieke onderzoekseenheden (personen, objecten, meetmomenten, etc.) die betrokken zijn bij het onderzoek en geselecteerd zijn uit de populatie [22](#page=22).
* **Populatie:** Het totale geheel van alle onderzoekseenheden waarover conclusies getrokken willen worden [22](#page=22).
* **Zekerheid en kans:** Deductieve afleidingen zijn zeker. Inductieve afleidingen daarentegen zijn meestal niet zeker en maken gebruik van het begrip kans of waarschijnlijkheid. De inductieve statistiek biedt de hulpmiddelen om inductieve redeneringen op basis van gegevens uit te voeren [23](#page=23).
### 2.2 Situering van het vak 'Statistiek voor Psychologen: deel 1'
Het vak 'Statistiek voor Psychologen: deel 1' is gestructureerd rond de genoemde objectieven [24](#page=24):
* **Deel I:** Behandelt de beschrijvende statistiek (hoorcolleges 1 t.e.m. 4) [24](#page=24).
* **Deel II:** Behandelt de inductieve statistiek (hoorcolleges 5 t.e.m. 12). Hierbij worden de basisbegrippen van inductieve statistiek geïntroduceerd, met verdere uitdieping in 'Statistiek voor Psychologen: deel 2' [24](#page=24).
---
# Beschrijvende statistiek: conceptueel kader en variabelen
Dit deel introduceert de fundamentele concepten van beschrijvende statistiek, met een focus op populatie, steekproef, en de verschillende soorten variabelen die in onderzoek worden gebruikt [26](#page=26).
### 3.1 Populatie, steekproef en variabele
Beschrijvende statistiek omvat het samenvatten en presenteren van gegevens op een zinvolle manier. De kernbegrippen hierbij zijn [26](#page=26):
* **Populatie:** Dit is de volledige verzameling van onderzoekseenheden (zoals personen, gezinnen, dagen, situaties) waarover uitspraken gedaan willen worden in een studie [27](#page=27).
* **Steekproef:** Dit is een selectie van onderzoekseenheden uit de populatie. Op deze geselecteerde eenheden wordt daadwerkelijk een proef of experiment uitgevoerd [27](#page=27).
* **Variabele:** Dit is een eigenschap van de onderzoekseenheden. Concreet koppelt een variabele aan elk lid van de populatie een specifieke uitkomst of eigenschap. Een steekproef kan dus beschouwd worden als een set van uitkomsten die voortkomen uit een experiment [27](#page=27).
> **Tip:** Het is cruciaal om het onderscheid tussen populatie en steekproef te begrijpen, aangezien conclusies over de populatie gebaseerd worden op de observaties uit de steekproef.
### 3.2 Soorten variabelen
Een belangrijk onderscheid binnen variabelen is dat tussen kwalitatieve en kwantitatieve variabelen [28](#page=28).
#### 3.2.1 Kwalitatieve variabele
Een kwalitatieve variabele koppelt elk lid van de populatie aan iets niet-numerieks. Bij dit soort variabelen is ordening, optellen of aftrekken niet zinvol [28](#page=28).
* **Voorbeeld:** De onderwijsvorm die een leerling volgt (bijvoorbeeld ASO, TSO, BSO, KSO, thuisonderwijs) is een kwalitatieve variabele [31](#page=31).
#### 3.2.2 Kwantitatieve variabele
Een kwantitatieve variabele koppelt elk lid van de populatie aan een numerieke waarde. Voor deze waarden is ordening, optellen en aftrekken zinvol [28](#page=28).
* **Voorbeeld 1:** Een IQ-score is een numerieke waarde die een eigenschap van een leerling meet [29](#page=29).
* **Voorbeeld 2:** Hartslag, gemeten in slagen per minuut, is een numerieke waarde die de toestand van een patiënt beschrijft [30](#page=30).
### 3.3 Illustratieve voorbeelden
De volgende voorbeelden verduidelijken de concepten van populatie, steekproef en variabelen:
* **Voorbeeld 1: IQ-scores**
* Onderzoeksvraag: Wat is de gemiddelde IQ-score van leerlingen in het vijfde middelbaar [29](#page=29)?
* Populatie: Alle Vlaamse leerlingen ingeschreven in het vijfde middelbaar [29](#page=29).
* Variabele: IQ-score (kwantitatief) [29](#page=29).
* Steekproef: 200 leerlingen willekeurig gekozen uit secundaire scholen verspreid over de provincies [29](#page=29).
* **Voorbeeld 2: Hartslag variatie**
* Onderzoeksvraag: Hoe varieert de hartslag van een patiënt doorheen de dag [30](#page=30)?
* Populatie: Alle mogelijke tijdstippen waarop een hartslagmeting zou kunnen gebeuren [30](#page=30).
* Variabele: Hartslag (kwantitatief) [30](#page=30).
* Steekproef: Meetmomenten elke 10 minuten tussen 8 uur en 16 uur [30](#page=30).
* **Voorbeeld 3: Onderwijsvorm**
* Onderzoeksvraag: Welke onderwijsvorm volgen de meeste 14-jarigen in België [31](#page=31)?
* Populatie: Alle 14-jarigen in België [31](#page=31).
* Variabele: Onderwijsvorm (ASO, TSO, BSO, KSO, thuisonderwijs) (kwalitatief) [31](#page=31).
* Steekproef: 500 leerlingen willekeurig gekozen uit secundaire scholen verspreid over de provincies [31](#page=31).
* **Voorbeeld 4: Patiëntgegevens**
* Gegevens verzameld: Plaats, aantal aanwezige anderen, en angstniveau op 30 meetmomenten. Hierbij zouden 'plaats' en 'aantal aanwezige anderen' (indien geteld als discrete getallen) mogelijks als kwantitatief beschouwd kunnen worden, terwijl 'angstniveau' afhankelijk van de schaal (bv. numeriek van 1 tot 10) ook kwantitatief is [32](#page=32).
---
# Frequentie- en proportiefuncties en grafische voorstellingen
Dit gedeelte behandelt de concepten van frequentie- en proportiefuncties en hoe deze gevisualiseerd kunnen worden met verschillende grafische methoden [33](#page=33).
### 4.1 Frequentie- en proportiefuncties
#### 4.1.1 Frequentiefunctie
Een frequentiefunctie geeft aan hoe vaak een bepaalde waarde of uitkomst voorkomt binnen een dataset. Voor een variabele $X$ met observaties $x_1, x_2, \dots, x_n$, waarbij $n$ de steekproefgrootte is en $i$ varieert van 1 tot $n$, kunnen we de mogelijke waarden of uitkomsten aanduiden als $x_1, x_2, \dots, x_m$, waarbij $m$ het totale aantal unieke uitkomsten is en $j$ varieert van 1 tot $m$. De frequentie van een specifieke waarde $x_j$ wordt genoteerd als $\text{freq}(x_j)$ [36](#page=36) [37](#page=37).
> **Tip:** Let op de gereserveerde indexletters: $i, j, n, m$ hebben een specifieke betekenis en moeten op het examen correct worden toegepast [37](#page=37).
> **Voorbeeld:** Als we kijken naar de variabele 'plaats' en de observaties zijn 'buitenshuis', 'thuis', en 'werk', dan is de frequentie van 'thuis' 15 uit een totaal van 30 observaties. Hier is $m=3$ en bijvoorbeeld $x_1$ kan 'buitenshuis' zijn, $x_2$ 'thuis', en $x_3$ 'werk'. $\text{freq}(x_2) = 15$ [34](#page=34) [35](#page=35) [37](#page=37).
#### 4.1.2 Proportiefunctie
De proportiefunctie, ook wel relatieve frequentie genoemd, geeft de frequentie van een waarde weer ten opzichte van het totale aantal observaties $n$. De proportie van een waarde $x_j$ wordt berekend met de formule [38](#page=38):
$$ p(x_j) = \frac{\text{freq}(x_j)}{n} $$
De som van alle frequenties moet gelijk zijn aan de steekproefgrootte:
$$ \sum_{j=1}^{m} \text{freq}(x_j) = n $$
En de som van alle proporties moet gelijk zijn aan 1:
$$ \sum_{j=1}^{m} p(x_j) = 1 $$
> **Tip:** De kolom met frequenties of proporties bevat de waarden voor alle uitkomsten $x_j$ (voor $j=1, \dots, m$). Daarom wordt vaak $\text{freq}(x)$ of $p(x)$ geschreven, in plaats van $\text{freq}(x_j)$ of $p(x_j)$. De proporties liggen altijd tussen 0 en 1 inclusief [38](#page=38).
> **Voorbeeld:** Voor de variabele 'plaats', met $\text{freq}(\text{buitenshuis})=4$, $\text{freq}(\text{thuis})=15$, en $\text{freq}(\text{werk})=11$, en $n=30$, zijn de proporties:
> $p(\text{buitenshuis}) = \frac{4}{30} \approx 0.1333$
> $p(\text{thuis}) = \frac{15}{30} = 0.5$
> $p(\text{werk}) = \frac{11}{30} \approx 0.3667$
> [38](#page=38).
### 4.2 Grafische voorstellingen
Grafische voorstellingen helpen bij het visualiseren van de frequentie- en proportieverdelingen van data. De keuze van de grafiek hangt af van het type variabele (kwalitatief of kwantitatief).
#### 4.2.1 Grafische voorstellingen voor kwalitatieve variabelen
Kwalitatieve variabelen, zoals 'plaats', kunnen worden weergegeven met lijndiagrammen, staafdiagrammen en taartdiagrammen.
##### 4.2.1.1 Lijndiagram
Een lijndiagram wordt gebruikt om de frequentie of proportie van verschillende categorieën weer te geven. De categorieën staan op de horizontale as en de frequentie/proportie op de verticale as. Lijnen verbinden de punten die de frequentie/proportie voor elke categorie aangeven [41](#page=41).
> **Voorbeeld:** Een lijndiagram voor de variabele 'plaats' toont de frequentie van 'buitenshuis', 'thuis' en 'werk' [41](#page=41).
##### 4.2.1.2 Staafdiagram
Een staafdiagram is zeer geschikt voor het visualiseren van de frequenties of proporties van kwalitatieve variabelen. Elke categorie heeft een staaf waarvan de hoogte overeenkomt met de frequentie of proportie. De staven staan los van elkaar, wat de discrete aard van de categorieën benadrukt [42](#page=42).
> **Voorbeeld:** Een staafdiagram voor de variabele 'plaats' toont staven voor 'buitenshuis', 'thuis' en 'werk' met hoogtes die hun respectievelijke frequenties representeren [42](#page=42).
##### 4.2.1.3 Taartdiagram
Een taartdiagram (of cirkeldiagram) verdeelt een cirkel in sectoren, waarbij elke sector een categorie vertegenwoordigt. De grootte van elke sector is proportioneel aan de frequentie of proportie van die categorie. Dit diagram is nuttig om de relatieve bijdrage van elke categorie aan het geheel te tonen [43](#page=43).
> **Voorbeeld:** Een taartdiagram voor 'plaats' toont sectoren voor 'buitenshuis' (13%), 'thuis' (50%) en 'werk' (37%) [43](#page=43).
#### 4.2.2 Grafische voorstellingen voor kwantitatieve variabelen
Voor kwantitatieve variabelen, zoals 'aantal anderen', zijn grafische methoden zoals lijndiagrammen en histogrammen geschikt.
##### 4.2.2.1 Lijndiagram
Net als bij kwalitatieve variabelen kan een lijndiagram gebruikt worden voor kwantitatieve data, waarbij de waarden op de horizontale as worden geplaatst. Dit kan nuttig zijn om trends of patronen te identificeren, vooral als de kwantitatieve variabele een ordinale schaal heeft of als de waarden in een reeks geordend kunnen worden [45](#page=45).
> **Voorbeeld:** Een lijndiagram voor de variabele 'aantal anderen' kan de frequentie van elk specifiek aantal (bijvoorbeeld 0, 1, 2, etc.) weergeven [45](#page=45).
##### 4.2.2.2 Histogram
Een histogram is de meest geschikte grafiek voor het weergeven van de verdeling van een kwantitatieve variabele. In tegenstelling tot een staafdiagram, staan de staven in een histogram aan elkaar vast, wat de continue aard van kwantitatieve data symboliseert. De horizontale as wordt verdeeld in klassen of intervallen, en de hoogte van elke staaf representeert de frequentie of proportie van observaties binnen dat interval [46](#page=46).
> **Vragen die een histogram kan helpen beantwoorden:**
> * Zijn er uitbijters [47](#page=47)?
> * Welke vorm neemt de verdeling aan [47](#page=47)?
> * Is er één of zijn er meerdere toppen (modi) [47](#page=47)?
> * Is de verdeling symmetrisch of scheef (positief of negatief) [47](#page=47)?
> **Tip:** Zorg ervoor dat de verticale as van een histogram altijd begint op de waarde 0 om misleidende interpretaties te voorkomen [49](#page=49).
> **Tip:** Bij het maken van een histogram met gegroepeerde frequenties, kies zoveel mogelijk voor gelijke klassenbreedtes. Dit voorkomt een misleidende indruk van de concentratie van waarden. De frequentiedichtheid wordt berekend als $\frac{\text{frequentie}}{\text{klassenbreedte}}$ [50](#page=50).
##### 4.2.2.3 Stam-en-loofdiagram (Stem-and-leaf plot)
Een stam-en-loofdiagram is een grafische methode die kenmerken van zowel een staafdiagram als een frequentieverdeling combineert, terwijl de individuele gegevenspunten behouden blijven. Het splitst elk gegevenspunt in een 'stam' (meestal de voorste cijfers) en een 'loof' (meestal het laatste cijfer) [51](#page=51).
> **Voorbeeld:** Voor de angstscore van 38, is de stam '3' en het loof '8'. Voor de scores 12, 13, 15, 15, 15, 16 [51](#page=51):
> Stam | Loof
> -----|------
> 1 | 235556
> [51](#page=51) [52](#page=52) [54](#page=54).
> **Variaties:**
> * **Tweede stam- en loofdiagram:** Kan worden gebruikt om de gegevens fijner te groeperen, waarbij de stam meer informatie bevat of de loof-waarden worden opgesplitst [52](#page=52).
> * **Rug-aan-rug stam-en-loofdiagram:** Twee stam-en-loofdiagrammen die rug-aan-rug worden geplaatst om de verdelingen van twee groepen te vergelijken [53](#page=53).
> **Formule bij stam-en-loofdiagram:** De oorspronkelijke getallen kunnen worden gereconstrueerd met de formule: $\text{getal} = (\text{stam} \times 10^k) + (\text{loof} \times 10^l)$, waar $k$ en $l$ afhangen van de plaatsing van de stam en het loof. Bijvoorbeeld, als de stam het tiental vertegenwoordigt en het loof het eenheidscijfer, dan is het getal gelijk aan (stam $\times$ 10) + loof [54](#page=54).
---
# Cumulatieve proportiefunctie en kwantielen
Dit deel introduceert de cumulatieve proportiefunctie en het concept van kwantielen, welke essentieel zijn voor het samenvatten en interpreteren van data van kwantitatieve variabelen.
### 5.1 De cumulatieve proportiefunctie
De cumulatieve proportiefunctie, aangeduid als $F(x)$ is een functie die voor elke waarde $x$ van een kwantitatieve variabele de proportie van de observaties weergeeft die kleiner dan of gelijk aan $x$ zijn. Deze functie is enkel zinvol voor kwantitatieve variabelen [56](#page=56) [57](#page=57).
#### 5.1.1 Berekening van de cumulatieve proportie
De cumulatieve proportie voor een bepaalde waarde $x$ wordt berekend door de proporties van alle waarden kleiner dan of gelijk aan $x$ op te tellen. Dit kan worden weergegeven met de formule [57](#page=57):
$$F(x) = \sum_{j \le x} p(j) = \sum_{j \le x} \frac{\text{freq}(j)}{n}$$
waarbij $p(j)$ de proportie is van waarde $j$, $\text{freq}(j)$ de frequentie van waarde $j$ is, en $n$ het totale aantal observaties is [57](#page=57).
**Voorbeeld van berekening:**
Gegeven de frequentieverdeling voor 'aantal anderen (X)':
| Aantal anderen (X) | freq(x) | cfreq(x) | p(x) | F(x) |
| :----------------- | :------ | :------- | :----- | :----- |
| 0 | 7 | 7 | .2333 | .2333 |
| 1 | 8 | 15 | .2667 | .50 |
| 2 | 4 | 19 | .1333 | .6333 |
| 3 | 5 | 24 | .1667 | .80 |
| 4 | 1 | 25 | .0333 | .8333 |
| 5 | 3 | 28 | .1 | .9333 |
| 6 | 0 | 28 | 0 | .9333 |
| 7 | 1 | 29 | .0333 | .9667 |
| 8 | 0 | 29 | 0 | .9667 |
| ... | ... | ... | ... | ... |
| 15 | 1 | 30 | .0333 | 1 |
De cumulatieve proportie voor $X=2$ is $F = \text{p} + \text{p} + \text{p} =.2333 +.2667 +.1333 =.6333$. Dit betekent dat in 63.33% van de geobserveerde meetmomenten het aantal anderen aanwezig 2 of minder was [1](#page=1) [2](#page=2) [57](#page=57).
#### 5.1.2 Grafische weergave van de cumulatieve proportiefunctie
De cumulatieve proportiefunctie ($F(x)$) en de cumulatieve frequentiefunctie ($cfreq(x)$) worden grafisch voorgesteld als niet-strikt stijgende stapfuncties. De functie begint met een waarde van 0 (of de proportie van de kleinste waarde) en eindigt altijd met de waarde 1 [57](#page=57) [58](#page=58) [66](#page=66).
> **Tip:** Let op de specifieke manier waarop de grafiek wordt getekend. De horizontale lijnen vertegenwoordigen de waarden tussen twee opeenvolgende observaties, en de verticale sprongen markeren de cumulatieve proporties op specifieke datapunten [58](#page=58).
### 5.2 Kwantielen
Kwantielen zijn waarden van de variabele $x$ waarvoor de cumulatieve proportie een bepaalde drempelwaarde $r$ bereikt of overschrijdt, waarbij $r$ een getal is tussen 0 en 1 ($0 \le r \le 1$). Het $r$-de kwantiel, genoteerd als $x_r$, is dus de waarde van $x$ waarvoor geldt dat $F(x) \ge r$ [61](#page=61).
#### 5.2.1 Berekening van kwantielen
De berekening van een kwantiel hangt af van hoe de cumulatieve proportie zich verhoudt tot de drempelwaarde $r$ [63](#page=63).
* **Als de gezochte cumulatieve proportie samenvalt met een trap in de grafiek:** Neem de waarde in het midden van de lijn. Dit is het gemiddelde van de begin- en eindwaarde van de horizontale lijnsegmenten van de trap [63](#page=63).
* **Als de gezochte cumulatieve proportie niet samenvalt met een trap in de grafiek:** Neem de waarde van het eerste bolletje (datapunten) van de trap die hoger ligt dan de gezochte proportie [63](#page=63).
**Voorbeeld van berekening van kwantielen:**
Gebruikmakend van de tabel met cumulatieve proporties [61](#page=61):
* **Het.75ste kwantiel ($x_{.75}$):** We zoeken de waarde $x$ waarvoor $F(x) \ge.75$. De cumulatieve proportie 0.80 bereikt deze drempel. De waarde van $x$ die hierbij hoort is 3. Dus, $x_{.75} = 3$ [61](#page=61).
* **Het.97ste kwantiel ($x_{.97}$):** Hier moeten we de regel toepassen voor wanneer de gezochte proportie niet direct samenvalt met een trap. $F =.9333$ en $F =.9667$. Omdat we de waarde zoeken waarvoor $F(x) \ge.97$, moeten we naar de volgende stap kijken. Echter, de formule geeft hier aan dat $x_{.97} = (7+15)/2 = 11$. Dit suggereert een specifieke interpretatie waarbij als de proportie exact op een lijnstuk valt, het gemiddelde wordt genomen, en als het een sprong is, de waarde van het datapunten na de sprong wordt gebruikt. De tabel op pagina 61 laat zien [61](#page=61) [63](#page=63) [6](#page=6) [7](#page=7):
* $F =.9333$ [6](#page=6).
* $F =.9667$ [7](#page=7).
* $F = 1$ [15](#page=15).
Voor $x_{.97}$, waar $F(x) \ge.97$, moeten we kijken naar de waarde waar de stap groter of gelijk wordt aan.97. De tabel toont dat $F =.9667$. De volgende stap is bij $X=15$, met $F =1$. De interpretatie voor $x_{.97}$ als $(7+15)/2$ suggereert dat bij een situatie waar een waarde precies op de grens ligt van een interval, het gemiddelde wordt gebruikt, of een specifieke interpolatiemethode die hieruit volgt. Meer specifiek, als de gezochte proportie $r$ precies samenvalt met de beginwaarde van een horizontale lijnsegment, dan wordt dat punt genomen. Als het ergens op het segment valt, wordt het gemiddelde van de x-waarden die bij de begin- en eindpunten van het segment horen genomen. Echter, de tabel zelf toont $x_{.97} = (7+15)/2 = 11$. Dit kan duiden op een interpolatie waarbij, als de cumulatieve proportie exact op een stap valt, het gemiddelde van de x-waarden gebruikt wordt die bij het begin- en eindpunt van die stap horen. Een meer gangbare definitie is de kleinste $x$ zodanig dat $F(x) \ge r$. Volgens die definitie zou $x_{.97}$ de waarde 15 zijn. De uitwerking op pagina 61 is specifiek: $x_{.97} = (7 + 15)/2 = 11$. Dit impliceert dat als de cumulatieve proportie tussen twee getallen valt, we interpoleren [15](#page=15) [63](#page=63) [7](#page=7).
* **Het.80ste kwantiel ($x_{.80}$):** $F =.80$. Omdat de cumulatieve proportie hier exact samenvalt met een trap, nemen we het gemiddelde van de begin- en eindwaarde van de trap. De voorgaande cumulatieve proportie is $F =.6333$ en de huidige is $F =.80$. De stap bij $X=3$ is van $0.6333$ naar $0.80$. De interpretatie op pagina 61 geeft $x_{.80} = (3+4)/2 = 3.5$. Dit betekent dat de waarde 3.5 de grens is waar de cumulatieve proportie.80 bereikt [2](#page=2) [3](#page=3) [61](#page=61) [63](#page=63).
#### 5.2.2 Bijzondere kwantielen
Er zijn specifieke kwantielen die veel gebruikt worden:
* **Percentielen ($Pc_k$):** Dit zijn de kwantielen $x_{0.01}, x_{0.02}, \dots, x_{0.99}$. Het $k$-de percentiel is de waarde $x$ waarvoor $k\%$ van de data kleiner of gelijk is aan $x$ [64](#page=64).
* **Decielen ($D_k$):** Dit zijn de kwantielen $x_{0.1}, x_{0.2}, \dots, x_{0.9}$. Het $k$-de deciel verdeelt de data in tien gelijke delen [64](#page=64).
* **Kwartielen ($Q_k$):** Dit zijn de kwantielen $x_{0.25}, x_{0.50}, x_{0.75}$ [64](#page=64).
* $Q_1$ (eerste kwartiel): De waarde waarvoor 25% van de data kleiner of gelijk is aan deze waarde ($x_{0.25}$) [64](#page=64).
* $Q_2$ (tweede kwartiel): De waarde waarvoor 50% van de data kleiner of gelijk is aan deze waarde. Dit is ook de mediaan ($x_{0.50}$) [64](#page=64).
* $Q_3$ (derde kwartiel): De waarde waarvoor 75% van de data kleiner of gelijk is aan deze waarde ($x_{0.75}$) [64](#page=64).
> **Studiehulp:** Probeer te focussen op de relatie tussen frequentie, proportie, cumulatieve frequentie en cumulatieve proportie. Begrijp hoe je van de ene naar de andere rekent en wat de specifieke kenmerken zijn van de cumulatieve proportiefunctie, zowel in tabelvorm als grafisch. Oefen met het berekenen van verschillende kwantielen en het interpreteren van hun betekenis [66](#page=66).
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Studiepunten | Een studiepunt vertegenwoordigt een bepaalde hoeveelheid studietijd die nodig is om de leerstof van een vak te beheersen, typisch tussen 25 en 30 uren per studiepunt. |
| Steekproef | Een selectie van onderzoekseenheden uit een grotere populatie, waarop effectief een proef of experiment wordt uitgevoerd om conclusies te kunnen trekken. |
| Populatie | De volledige set van onderzoekseenheden (zoals personen, objecten, of situaties) waarover men in een studie uitspraken wil doen. |
| Variabele | Een eigenschap van onderzoekseenheden die kan variëren. Concreet koppelt een variabele aan elk lid van de populatie een bepaalde uitkomst of eigenschap. |
| Kwalitatieve variabele | Een variabele waarbij de uitkomsten niet-numeriek zijn (bv. woorden) en waarop ordening, optelling of aftrekking geen zinvolle betekenis hebben. |
| Kwantitatieve variabele | Een variabele waarbij de uitkomsten numerieke waarden zijn, waarvoor ordening, optelling en aftrekking zinvol is. |
| Frequentiefunctie | Een functie die aangeeft hoe vaak een bepaalde waarde of uitkomst voorkomt binnen een set van observaties of gegevens. |
| Proportiefunctie | De relatieve frequentie van een bepaalde waarde of uitkomst ten opzichte van het totaal aantal observaties, berekend als de frequentie gedeeld door het totale aantal observaties (n). |
| Grafische voorstelling | Visuele methoden om gegevens weer te geven, zoals lijndiagrammen, staafdiagrammen, taartdiagrammen en histogrammen, om patronen en inzichten te onthullen. |
| Lijndiagram | Een grafische voorstelling die punten verbindt met lijnen, vaak gebruikt om de relatie tussen twee variabelen te tonen of de frequentiefunctie weer te geven. |
| Staafdiagram | Een grafische voorstelling die rechthoekige staven gebruikt om de frequentie of proportie van verschillende categorieën van een variabele weer te geven. |
| Taartdiagram | Een cirkelvormige grafiek die is verdeeld in sectoren, waarbij elke sector de proportie van een categorie ten opzichte van het geheel voorstelt. |
| Histogram | Een grafische voorstelling die de frequentieverdeling van continue kwantitatieve gegevens weergeeft, met staven die de frequentie binnen bepaalde klassen of intervallen tonen. |
| Stam- en loofdiagram | Een grafische methode om de verdeling van gegevens weer te geven, waarbij de stammen de eerste cijfers van de data vertegenwoordigen en de loof de laatste cijfers. |
| Cumulatieve frequentie | De som van de frequenties van alle waarden die kleiner zijn dan of gelijk zijn aan een bepaalde waarde. |
| Cumulatieve proportie | De som van de proporties van alle waarden die kleiner zijn dan of gelijk zijn aan een bepaalde waarde. Dit is de proportie van observaties die tot en met die waarde vallen. |
| Kwantiel | Een waarde die een dataset opdeelt in een aantal gelijke delen. Voorbeelden zijn percentielen, decielen en kwartielen. |
| Percentiel | Een kwantiel dat een dataset opdeelt in 100 gelijke delen; de $p$-de percentiel is de waarde waarvoor $p\%$ van de gegevens eronder ligt. |
| Deciel | Een kwantiel dat een dataset opdeelt in 10 gelijke delen; het $d$-de deciel is de waarde waarvoor $d/10$ van de gegevens eronder ligt. |
| Kwartiel | Een kwantiel dat een dataset opdeelt in 4 gelijke delen. Het eerste kwartiel ($Q1$) is de waarde waarvoor 25% van de gegevens eronder ligt, het tweede kwartiel ($Q2$) is de mediaan (50%), en het derde kwartiel ($Q3$) is de waarde waarvoor 75% van de gegevens eronder ligt. |
| Deductie | Een vorm van redeneren waarbij men vanuit algemene principes tot specifieke conclusies komt. De conclusie is noodzakelijkerwijs waar als de premissen waar zijn. |
| Inductie | Een vorm van redeneren waarbij men vanuit specifieke observaties tot algemene conclusies komt. De conclusie is waarschijnlijk, maar niet noodzakelijk waar. |
| Beschrijvende statistiek | Het deel van statistiek dat zich bezighoudt met methoden om aspecten van gegevens te ordenen, samenvatten en presenteren op een inzichtelijke manier. |
| Inductieve statistiek | Het deel van statistiek dat methoden verschaft om vanuit specifieke gegevens algemenere informatie te induceren, wat vaak gepaard gaat met kansberekening. |