Cover
Zacznij teraz za darmo HC 11_Het beschrijven van twee variabelen (associatiematen op ordinaal niveau) BB_.pptx
Summary
# Inleiding tot associatiematen op ordinaal niveau
Dit hoorcollege introduceert associatiematen voor variabelen gemeten op ordinaal niveau, waarbij de nadruk ligt op de keuze van de juiste maat op basis van het meetniveau en de aard van het verband, alsook de interpretatie van de richting van een verband.
### 1.1 Situering en inhoud van het hoorcollege
Dit onderdeel schetst de plaats van het hoorcollege binnen de bredere statistische context en introduceert de belangrijkste leerdoelen.
#### 1.1.1 Formules en hulpmiddelen
De formules die in dit hoorcollege worden behandeld, kunnen qua notatie enigszins afwijken van die in het boek of de online documentatie, maar komen conceptueel op hetzelfde neer. Alle relevante formules staan op het formularium dat beschikbaar is op Blackboard onder 'evaluatie' -> 'hulpmiddelen'. Dit formularium mag gebruikt worden tijdens het examen, waardoor het niet noodzakelijk is om de formules van buiten te leren. Het is wel essentieel om ermee te kunnen werken. Bij berekeningen dient altijd te worden afgerond tot twee cijfers na de komma. Kleine verschillen in uitkomsten door afrondingen tijdens tussenstappen of het ontbreken daarvan worden op het examen meegenomen binnen een foutenmarge.
#### 1.1.2 Doel van associatiematen
Associatiematen, ook wel samenhangmaten genoemd, geven aan of er een samenhang bestaat tussen twee variabelen.
#### 1.1.3 Keuze van de juiste associatiemaat
De keuze voor de geschikte associatiemaat wordt bepaald door twee hoofdfactoren:
1. **Meetniveau van de variabelen:**
* Indien minstens één variabele van nominaal meetniveau is, wordt een associatiemaat op nominaal niveau gekozen.
* Wanneer één variabele ordinaal is en de andere niet-nominaal, wordt een associatiemaat op ordinaal niveau gebruikt.
* Als beide variabelen minimaal van intervalniveau zijn, wordt een associatiemaat op interval/ratio niveau toegepast.
2. **Verondersteld verband tussen de variabelen:**
* Bij een symmetrisch verband zijn asymmetrische associatiematen niet mogelijk.
* Bij een asymmetrisch verband zijn symmetrische associatiematen wel mogelijk, hoewel dit niet de volledige asymmetrie van de analyse benut.
Binnen Statistiek 1 ligt de focus op symmetrische associatiematen op verschillende meetniveaus.
### 1.2 De richting van een verband
In tegenstelling tot maten op nominaal niveau, die enkel de sterkte van een verband aangeven, duiden maten op ordinaal niveau zowel de sterkte als de richting van een verband aan.
#### 1.2.1 Sterkte en richting
* **Sterkte van een verband:** Geeft de mate van samenhang aan, variërend van geen verband tot een perfect verband.
* **Richting van een verband:** Kan positief of negatief zijn.
* **Positief verband:** Hogere waarden van de ene variabele gaan samen met hogere waarden van de andere variabele (hoog-hoog en laag-laag).
* **Negatief verband:** Hogere waarden van de ene variabele gaan samen met lagere waarden van de andere variabele (laag-hoog en hoog-laag).
Bij nominale variabelen is er geen rangordening, waardoor het niet mogelijk is om te spreken van 'hogere' of 'lagere' waarden en dus ook niet over de richting van het verband.
#### 1.2.2 Oefeningen richting van een verband
* **Oefening 1:**
* TV/PC en beweging: negatief verband.
* TV/PC en BMI: positief verband.
* **Oefening 2:** Verwachtingen over positieve/negatieve samenhang:
* Pestgedrag: Vaak negatief samenhangend met slaapkwaliteit en positief met eenzaamheid en faalangst.
* Slaapkwaliteit: Vaak positief samenhangend met pestgedrag (negatief) en negatief met eenzaamheid en faalangst.
* Eenzaamheid: Vaak positief samenhangend met pestgedrag en faalangst, en negatief met slaapkwaliteit.
* Faalangst: Vaak positief samenhangend met pestgedrag en eenzaamheid, en negatief met slaapkwaliteit.
### 1.3 Samenhang onderzoeken op ordinaal niveau
Op ordinaal niveau kan de samenhang tussen variabelen op verschillende manieren worden onderzocht.
#### 1.3.1 Eerste indicatie via de kruistabel
Een eerste, voorzichtige indicatie van het verband kan worden verkregen aan de hand van een kruistabel. Door kolom- of rijpercentages te analyseren, kan men nagaan of de verdeling van de ene variabele verschilt binnen de categorieën van de andere variabele. Een verschil tussen de marginale verdelingen van de kolompercentages duidt op samenhang.
* **Voorbeeld vraagstelling:** Hoe vaak heeft u ruzie met uw partner? versus Hoe vaak hebt u overwogen de relatie te beëindigen?
Als de marginale verdeling van de kolompercentages verschilt (bijvoorbeeld 34.13% ≠ 72.55% ≠ 10.53% ≠ 7.14%), duidt dit op samenhang.
Bovendien kunnen celpercentages in een kruistabel een eerste inzicht geven in de richting van het verband. Een positief verband wordt gekenmerkt doordat hogere waarden op de ene variabele samengaan met hogere waarden op de andere variabele.
#### 1.3.2 Definitieve conclusie met associatiematen
Voor een definitieve en betrouwbaardere conclusie over de samenhang wordt een geschikte associatiemaat berekend.
##### 1.3.2.1 Associatiematen op ordinaal niveau
Op ordinaal niveau kunnen diverse maten worden berekend.
> **Tip:** Raadpleeg de kennisclip van vorig academiejaar op Blackboard voor gedetailleerde berekeningsstappen van deze maten.
##### 1.3.2.2 Omgaan met gelijke waarden (rangnummers)
Wanneer meerdere respondenten dezelfde waarde hebben (bijvoorbeeld bij IQ-scores), wordt het gemiddelde van de rangnummers toegekend aan deze respondenten.
* **Voorbeeld:** Sarah en Mo scoren 111 en staan daarmee op een gedeelde 2e en 3e plaats. Cindy, Grace en Ruth scoren 103 en staan daarmee op een gedeelde 5e, 6e en 7e plaats.
##### 1.3.2.3 Interpretatie van associatiematen
De interpretatie van de berekende associatiemaat gebeurt op basis van twee componenten:
* **Sterkte:** Wordt afgeleid uit de numerieke waarde van de maat:
* 0: geen verband
* 0.01 – 0.10: Zeer zwak verband
* 0.11 – 0.30: Zwak verband
* 0.31 – 0.50: Medium verband
* 0.51 – 0.80: Sterk verband
* 0.81 – 0.99: Zeer sterk verband
* 1: Perfect verband
* **Richting:** Wordt afgeleid uit het teken van de maat:
* Een negatieve maat duidt op een negatieve samenhang.
* Een positieve maat duidt op een positieve samenhang.
* Een maat van 0 duidt op geen samenhang.
> **Belangrijk:** De interpretatierichtlijnen voor de sterkte en richting van het verband moeten vanbuiten geleerd worden.
* **Voorbeeld interpretatie:** Een berekende maat van 0.65 duidt op een positieve sterke samenhang.
---
# Het onderzoeken van samenhang op ordinaal niveau met kruistabellen
Dit gedeelte legt uit hoe een eerste indicatie van de samenhang tussen ordinale variabelen verkregen kan worden met behulp van kruistabellen, inclusief de interpretatie van kolompercentages en celpercentages.
### 2.1 Introductie tot associatiematen
Associatiematen geven aan of er een samenhang (of verband) bestaat tussen twee variabelen. De keuze voor de juiste associatiemaat hangt af van het meetniveau van de variabelen en het veronderstelde verband (symmetrisch of asymmetrisch). Voor statistiek 1 ligt de focus op symmetrische associatiematen op verschillende meetniveaus.
#### 2.1.1 Symmetrische versus asymmetrische associatiematen
* **Symmetrische verbanden:** Hierbij maakt het niet uit welke variabele als onafhankelijk en welke als afhankelijk wordt beschouwd. De associatiemaat berekent de sterkte van de relatie tussen de twee variabelen.
* **Asymmetrische verbanden:** Hierbij wordt wel een onderscheid gemaakt tussen een onafhankelijke en een afhankelijke variabele. Asymmetrische associatiematen zijn niet mogelijk als minstens één variabele nominaal is. Als beide variabelen minimaal interval zijn, zijn asymmetrische associatiematen wel mogelijk, maar het gebruik ervan kan betekenen dat men de asymmetrie in de analyse niet ten volle benut.
#### 2.1.2 Richting van een verband
In tegenstelling tot maten op nominaal niveau, die enkel de sterkte van een verband aangeven, duiden maten op ordinaal niveau naast de sterkte ook de richting van een verband aan:
* **Positief verband:** Hogere waarden van de ene variabele gaan samen met hogere waarden van de andere variabele (hoog-hoog, laag-laag).
* **Negatief verband:** Hogere waarden van de ene variabele gaan samen met lagere waarden van de andere variabele (laag-hoog, hoog-laag).
### 2.2 Samenhang onderzoeken op ordinaal niveau
Op ordinaal niveau kan samenhang op verschillende manieren worden onderzocht. Een eerste, voorzichtige indicatie van het verband kan worden verkregen met behulp van kruistabellen. Voor een definitieve en meer betrouwbare conclusie is het berekenen van een gepaste associatiemaat noodzakelijk.
#### 2.2.1 Een eerste indicatie met kruistabellen
Kruistabellen, in combinatie met kolom- of rijpercentages, kunnen een eerste indruk geven van een mogelijke samenhang tussen twee ordinale variabelen.
* **Samenhang vaststellen:** Er is sprake van samenhang als de verdeling van de ene variabele significant verschilt binnen de categorieën van de andere variabele. Dit kan worden waargenomen wanneer de marginale verdelingen van de kolompercentages niet gelijk zijn.
> **Tip:** Als de kolompercentages binnen elke kolom sterk van elkaar verschillen, duidt dit op een mogelijke samenhang.
* **Richting van het verband met celpercentages:** De celpercentages in een kruistabel kunnen een eerste indicatie geven van de richting van het verband.
> **Voorbeeld:** Stel, we onderzoeken de samenhang tussen "Frequentie ruzie met partner" en "Overwegen relatie te beëindigen". Als in de cel waar "vaak ruzie" en "vaak overwegen relatie te beëindigen" zich bevinden, een relatief hoog celpercentage wordt gevonden, kan dit wijzen op een positief verband (meer ruzie hangt samen met vaker overwegen de relatie te beëindigen).
#### 2.2.2 Interpretatie van kolom- en celpercentages
* **Kolompercentages:** Deze laten zien hoe de ene variabele verdeeld is binnen de categorieën van de andere variabele. Als deze verdelingen significant van elkaar verschillen, is er waarschijnlijk sprake van samenhang.
> **Voorbeeld:** Als 70% van de respondenten die "vaak ruzie" aangeven ook "vaak relatie overwegen te beëindigen", terwijl slechts 10% van de respondenten die "nooit ruzie" aangeven dit doen, is er een duidelijk verschil in verdeling en dus een mogelijke samenhang.
* **Celpercentages:** Deze geven het percentage aan van de totale steekproef dat in een specifieke cel van de kruistabel valt. Ze kunnen helpen bij het inschatten van de sterkte en richting van het verband.
#### 2.2.3 Associatiematen op ordinaal niveau
Voor een definitieve conclusie over de samenhang op ordinaal niveau, worden specifieke associatiematen berekend. Deze maten kwantificeren zowel de sterkte als de richting van het verband.
* **Sterkte van het verband:** De sterkte wordt beoordeeld aan de hand van de numerieke waarde van de associatiemaat:
* $0$: geen verband
* $0.01$ – $0.10$: zeer zwak verband
* $0.11$ – $0.30$: zwak verband
* $0.31$ – $0.50$: medium verband
* $0.51$ – $0.80$: sterk verband
* $0.81$ – $0.99$: zeer sterk verband
* $1$: perfect verband
* **Richting van het verband:** De richting wordt bepaald door het teken van de associatiemaat:
* Een positief teken ($+$) duidt op een positieve samenhang.
* Een negatief teken ($-$) duidt op een negatieve samenhang.
* Een waarde van $0$ duidt op geen samenhang.
> **Tip:** De interpretatierichtlijnen voor de sterkte van het verband op ordinaal niveau moeten vanbuiten geleerd worden.
#### 2.2.4 Omgaan met gelijke waarden (ties)
Bij het berekenen van associatiematen op ordinaal niveau, kan het voorkomen dat meerdere respondenten dezelfde waarde hebben op een variabele. In dergelijke gevallen krijgen de respondenten met dezelfde waarde het gemiddelde van hun rangnummers toegewezen.
> **Voorbeeld:** Als twee respondenten de score $111$ hebben en daarmee op een gedeelde $2^{e}$ en $3^{e}$ plaats staan, krijgen ze beiden het gemiddelde rangnummer $\frac{2+3}{2} = 2.5$.
> Als drie respondenten de score $103$ hebben en daarmee op een gedeelde $5^{e}$, $6^{e}$ en $7^{e}$ plaats staan, krijgen ze allen het gemiddelde rangnummer $\frac{5+6+7}{3} = 6$.
Het is aan te raden de specifieke kennisclips en het formularium te raadplegen voor de precieze berekeningsstappen van de associatiematen op ordinaal niveau. Bij alle berekeningen wordt afgerond tot twee cijfers na de komma.
---
# Associatiematen op ordinaal niveau: sterkte en richting
Dit gedeelte behandelt de berekening en interpretatie van associatiematen voor variabelen op ordinaal niveau, waarbij zowel de sterkte als de richting van het verband worden geanalyseerd, inclusief de omgang met gelijke scores.
### 3.1 Inleiding tot associatiematen
Associatiematen, ook wel samenhangmaten genoemd, geven aan of er een verband bestaat tussen twee variabelen. De keuze van de juiste associatiemaat hangt af van het meetniveau van de variabelen en het veronderstelde verband. Voor de analyse binnen Statistiek 1 focussen we op symmetrische associatiematen.
#### 3.1.1 Het kiezen van de geschikte associatiemaat
De keuze voor een specifieke associatiemaat is gebaseerd op twee criteria:
* **Meetniveau van de variabelen:**
* Indien minstens één variabele nominaal is, wordt een associatiemaat op nominaal niveau gebruikt.
* Als één variabele ordinaal is en de andere niet-nominaal, wordt een associatiemaat op ordinaal niveau toegepast.
* Wanneer beide variabelen minimaal intervalniveau hebben, worden associatiematen op interval- of rationiveau gebruikt.
* **Verondersteld verband tussen de variabelen:**
* Bij een symmetrisch verband zijn enkel symmetrische associatiematen mogelijk.
* Bij een asymmetrisch verband zijn zowel symmetrische als asymmetrische associatiematen mogelijk. Binnen Statistiek 1 wordt echter gefocust op symmetrische maten.
### 3.2 De richting van een verband
Associatiematen op ordinaal niveau bieden, in tegenstelling tot maten op nominaal niveau, informatie over zowel de sterkte als de richting van een verband.
* **Sterkte van een verband:** Geeft de mate van samenhang aan, variërend van geen verband tot een perfect verband.
* **Richting van een verband:**
* **Positief verband:** Hogere waarden van de ene variabele gaan samen met hogere waarden van de andere variabele (hoog-hoog en laag-laag).
* **Negatief verband:** Hogere waarden van de ene variabele gaan samen met lagere waarden van de andere variabele (laag-hoog en hoog-laag).
Bij nominale variabelen is er geen rangordening, waardoor de begrippen "hogere" en "lagere" waarden niet van toepassing zijn en er geen uitspraak gedaan kan worden over de richting van het verband.
### 3.3 Samenhang onderzoeken op ordinaal niveau
Op ordinaal niveau kan samenhang op verschillende manieren worden onderzocht, beginnend met een voorlopige analyse van een kruistabel en gevolgd door de berekening van een specifieke associatiemaat voor een meer betrouwbare conclusie.
#### 3.3.1 Samenhang onderzoeken a.d.h.v. de kruistabel
Een eerste indicatie van de samenhang kan verkregen worden door de kolom- of rijpercentages in een kruistabel te analyseren. Er is sprake van samenhang wanneer de verdeling van de ene variabele significant verschilt binnen de categorieën van de andere variabele, wat tot uiting komt in verschillen tussen de marginale verdelingen van de kolom- of rijpercentages.
> **Voorbeeld:** Als de kolompercentages van de variabele Y sterk verschillen binnen de categorieën van variabele X, duidt dit op samenhang. Bijvoorbeeld, als 34.13% in de ene kolom anders is dan 72.55% in een andere kolom, is er sprake van samenhang.
Celpercentages in een kruistabel kunnen tevens een eerste indicatie geven van de richting van het verband. Een positief verband is zichtbaar wanneer hogere waarden op beide variabelen samengaan.
#### 3.3.2 Overzicht associatiematen op ordinaal niveau
Voor een definitieve en betrouwbare conclusie over de samenhang op ordinaal niveau, wordt een specifieke associatiemaat berekend. Deze maten geven zowel de sterkte als de richting aan.
##### 3.3.2.1 Omgaan met gelijke scores
Bij variabelen op ordinaal niveau kan het voorkomen dat meerdere respondenten dezelfde score behalen. Dit vereist een specifieke aanpak bij het toekennen van rangnummers:
* Wanneer meerdere respondenten dezelfde waarde hebben, wordt aan hen het gemiddelde van de toe te wijzen rangnummers toegekend.
* **Voorbeeld:** Als Sarah en Mo beiden de score 111 hebben, en dit hen respectievelijk de 2e en 3e plaats zou geven, krijgen zij beiden het gemiddelde rangnummer $(2+3)/2 = 2.5$.
* **Voorbeeld:** Als Cindy, Grace en Ruth allen de score 103 hebben, en dit hen respectievelijk de 5e, 6e en 7e plaats zou geven, krijgen zij allen het gemiddelde rangnummer $(5+6+7)/3 = 6$.
##### 3.3.2.2 Interpretatie van de associatiemaat
De berekende associatiemaat op ordinaal niveau wordt geïnterpreteerd op basis van zijn numerieke waarde en teken:
* **Sterkte (het getal):**
* $0$: Geen verband
* $0.01$ – $0.10$: Zeer zwak verband
* $0.11$ – $0.30$: Zwak verband
* $0.31$ – $0.50$: Medium verband
* $0.51$ – $0.80$: Sterk verband
* $0.81$ – $0.99$: Zeer sterk verband
* $1$: Perfect verband
* **Richting (het teken):**
* Een negatief teken ($−$) duidt op een negatieve samenhang.
* Een positief teken ($+$) duidt op een positieve samenhang.
* Een teken van $0$ duidt op geen samenhang.
> **Tip:** De interpretatierichtlijnen voor zowel de sterkte als de richting van het verband moeten gememoriseerd worden voor het examen.
> **Tip:** Gebruik het formularium dat beschikbaar is op het examen. Het is essentieel om te weten hoe je hiermee kunt werken, aangezien de formules niet uit het hoofd geleerd hoeven te worden. Rond bij berekeningen altijd af tot twee cijfers na de komma. Kleine verschillen in de uitkomst door afrondingen tijdens tussenstappen worden op het examen meegenomen in een foutenmarge.
> **Voorbeeld van een interpretatie:** Een berekende maat van $0.65$ duidt op een **sterke positieve samenhang**.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Associatiemaat | Een maat die aangeeft of er sprake is van samenhang tussen twee variabelen. Associatiematen worden ook wel samenhangmaten genoemd en helpen bij het kwantificeren van de relatie tussen variabelen. |
| Meetniveau | De schaal waarop een variabele gemeten wordt, wat bepaalt welke statistische analyses mogelijk zijn. De belangrijkste meetniveaus zijn nominaal, ordinaal, interval en ratio. |
| Nominaal niveau | Een meetniveau waarbij variabelen worden ingedeeld in categorieën zonder inherente volgorde of rangorde. Voorbeelden zijn geslacht of haarkleur. |
| Ordinaal niveau | Een meetniveau waarbij variabelen worden ingedeeld in categorieën die een logische volgorde hebben, maar de afstanden tussen de categorieën zijn niet noodzakelijk gelijk. Voorbeelden zijn opleidingsniveau of tevredenheidsschaal. |
| Intervalniveau | Een meetniveau waarbij variabelen een geordende schaal hebben met gelijke afstanden tussen opeenvolgende punten. Er is echter geen absoluut nulpunt. Een voorbeeld is temperatuur in Celsius. |
| Rationiveau | Een meetniveau waarbij variabelen een geordende schaal hebben met gelijke afstanden en een absoluut nulpunt. Hierdoor zijn alle rekenkundige bewerkingen mogelijk. Een voorbeeld is lengte of gewicht. |
| Kruistabel | Een tabel die de frequentieverdeling van twee of meer categorische variabelen weergeeft. Het helpt bij het visueel inspecteren van de relatie tussen variabelen door de frequenties in de cellen te tonen. |
| Kolompercentages | Percentages berekend ten opzichte van het totaal van een kolom in een kruistabel. Deze worden gebruikt om de verdeling van de ene variabele te vergelijken binnen de categorieën van de andere variabele. |
| Celpercentages | Percentages berekend ten opzichte van het totaal aantal observaties in de gehele kruistabel. Deze geven de proportie van het totale monster weer die tot een specifieke cel behoort. |
| Symmetrisch verband | Een verband tussen twee variabelen waarbij de relatie in beide richtingen gelijk is. De analyse verandert niet, ongeacht welke variabele als afhankelijk of onafhankelijk wordt beschouwd. |
| Asymmetrisch verband | Een verband tussen twee variabelen waarbij de ene variabele de andere beïnvloedt of voorspelt. De analyse is afhankelijk van welke variabele als afhankelijk en welke als onafhankelijk wordt beschouwd. |
| Positief verband | Een verband waarbij hogere waarden van de ene variabele de neiging hebben samen te gaan met hogere waarden van de andere variabele, en lagere waarden samen met lagere waarden. |
| Negatief verband | Een verband waarbij hogere waarden van de ene variabele de neiging hebben samen te gaan met lagere waarden van de andere variabele, en vice versa. |