Cover
立即免费开始 Werkcollege2_oplossing.docx
Summary
# Statistische analyse van kredietkaartuitgaven
Dit onderwerp behandelt de statistische analyse van kredietkaartuitgaven, specifiek gericht op het vergelijken van gemiddelde uitgaven met populatiegemiddelden en tussen verschillende groepen zoals geslacht en jaartal.
## 1. Statistische analyse van kredietkaartuitgaven
### 1.1 Vergelijken van steekproefgemiddelden met populatiegemiddelden
Dit deel van de analyse richt zich op het vergelijken van het gemiddelde van een steekproef van kredietkaartuitgaven met een bekend populatiegemiddelde.
#### 1.1.1 De one-sample t-test
* **Doel:** Nagaan of het gemiddelde van een interval gemeten variabele (in dit geval 'amount spent' of uitgegeven bedrag) in een steekproef significant verschilt van een specifiek populatiegemiddelde.
* **Hypotheses:**
* Nulhypothese ($H_0$): Het gemiddelde uitgavenbedrag is gelijk aan het populatiegemiddelde.
$H_0: \mu_{\text{amount spent}} = \mu_{\text{populatie}}$
* Alternatieve hypothese ($H_a$): Het gemiddelde uitgavenbedrag verschilt van het populatiegemiddelde.
$H_a: \mu_{\text{amount spent}} \neq \mu_{\text{populatie}}$
* **Toepassing:** Gegeven een populatiegemiddelde van 500 dollars, wordt de 'amount spent' variabele vergeleken met deze waarde.
* **Resultaten:**
* In de steekproef met 300 respondenten wordt een gemiddeld uitgavenbedrag van 191.8413 dollars waargenomen, met een standaardafwijking van 203.13275 dollars.
* De 'One-Sample Test' tabel toont de t-waarde, vrijheidsgraden en het tweezijdig significantieniveau.
* **Interpretatie:** Als het significantieniveau (p-waarde) kleiner is dan 0.05, wordt de nulhypothese verworpen, wat aangeeft dat het steekproefgemiddelde statistisch significant verschilt van het populatiegemiddelde. In het gegeven voorbeeld is de p-waarde kleiner dan 0.05 (vaak wordt dit als 'p < .000' gerapporteerd in software), wat leidt tot de conclusie dat het gemiddelde in de steekproef significant verschilt van 500 dollars.
> **Tip:** De one-sample t-test is geschikt wanneer je de gemiddelde waarde van één groep wilt vergelijken met een bekende, vastgestelde waarde (het populatiegemiddelde).
#### 1.1.2 Gemiddelde vergelijken tussen groepen: Geslacht
* **Doel:** Het gemiddelde uitgavenbedrag tussen verschillende groepen vergelijken, specifiek tussen mannen en vrouwen.
* **Hypotheses:**
* Nulhypothese ($H_0$): Het gemiddelde uitgavenbedrag van mannen is gelijk aan dat van vrouwen.
$H_0: \mu_{\text{amount spent, man}} = \mu_{\text{amount spent, vrouw}}$
* Alternatieve hypothese ($H_a$): Het gemiddelde uitgavenbedrag van mannen verschilt van dat van vrouwen.
$H_a: \mu_{\text{amount spent, man}} \neq \mu_{\text{amount spent, vrouw}}$
* **Test:** Independent samples t-test.
* **Toepassing:** De variabele 'amount spent' wordt vergeleken tussen de groepen 'gender' (mannen en vrouwen).
* **Resultaten:**
* Mannen (149 respondenten) gaven gemiddeld 192.8440 dollars uit (standaardafwijking: 205.53192 dollars).
* Vrouwen (151 respondenten) gaven gemiddeld 190.8519 dollars uit (standaardafwijking: 201.41656 dollars).
* **Voorwaarde: Levene's Test voor Gelijkheidsvarianties:**
* Voordat de t-test geïnterpreteerd wordt, moet de Levene's test gecontroleerd worden om te beoordelen of de varianties tussen de groepen gelijk zijn.
* De nulhypothese van de Levene's test is dat de varianties gelijk zijn. Als de p-waarde van de Levene's test groter is dan 0.05 (niet significant), worden gelijke varianties aangenomen (de eerste rij van de 'Independent Samples Test' tabel wordt geïnterpreteerd).
* In het gegeven voorbeeld is de Levene's test niet significant (p = 0.825), dus wordt aangenomen dat de varianties gelijk zijn.
* **Interpretatie:** De onafhankelijke t-test wordt uitgevoerd. Als de p-waarde van de t-test groter is dan 0.05, wordt de nulhypothese niet verworpen, wat betekent dat er geen statistisch significant verschil is in uitgaven tussen mannen en vrouwen. In het voorbeeld is de p-waarde 0.932, wat leidt tot de conclusie dat er geen significant verschil is.
> **Tip:** De Levene's test is cruciaal bij de independent samples t-test om te bepalen welke resultaten (gelijke of ongelijke varianties) je moet raadplegen in de output.
#### 1.1.3 Gemiddelde vergelijken tussen groepen: Jaartal
* **Doel:** Het gemiddelde uitgavenbedrag vergelijken tussen verschillende jaartallen waarin de uitgaven werden gedaan.
* **Hypotheses:**
* Nulhypothese ($H_0$): Het gemiddelde uitgavenbedrag in 2009 is gelijk aan dat in 2010.
$H_0: \mu_{\text{amount spent, 2009}} = \mu_{\text{amount spent, 2010}}$
* Alternatieve hypothese ($H_a$): Het gemiddelde uitgavenbedrag in 2009 verschilt van dat in 2010.
$H_a: \mu_{\text{amount spent, 2009}} \neq \mu_{\text{amount spent, 2010}}$
* **Test:** Independent samples t-test.
* **Toepassing:** De variabele 'amount spent' wordt vergeleken tussen de groepen 'jaartal' (2009 en 2010). Er wordt aangenomen dat dit onafhankelijke groepen zijn, aangezien het om verschillende metingen in verschillende jaren gaat.
* **Resultaten:**
* In 2009 (170 respondenten) was het gemiddelde uitgavenbedrag 204.8603 dollars (standaardafwijking: 212.96987 dollars).
* In 2010 (130 respondenten) was het gemiddelde uitgavenbedrag 174.8164 dollars (standaardafwijking: 188.95725 dollars).
* **Voorwaarde: Levene's Test voor Gelijkheidsvarianties:**
* De Levene's test toont aan dat de varianties gelijk zijn (niet significant, p = 0.252). Daarom worden de resultaten van de 'Equal variances assumed' rij geïnterpreteerd.
* **Interpretatie:** De onafhankelijke t-test wordt uitgevoerd. De p-waarde is 0.205. Aangezien dit groter is dan 0.05, wordt de nulhypothese niet verworpen. Er is geen statistisch significant verschil in gemiddelde kredietkaartuitgaven tussen 2009 en 2010.
> **Tip:** Bij het vergelijken van gemiddelden tussen twee onafhankelijke groepen is het altijd essentieel om eerst de Levene's test te controleren om de juiste interpretatie van de t-test te garanderen.
---
Dit samenvattingsgedeelte is gebaseerd op de informatie die beschikbaar is op pagina's 1-3 van het document met betrekking tot de statistische analyse van kredietkaartuitgaven.
---
# Evaluatie van reclamecampagnes en winkelervaring met self-scanning
Dit hoofdstuk behandelt de evaluatie van reclamecampagnes door de merkattitude voor en na de campagne te vergelijken, en analyseert de impact van self-scanning op de winkelervaring.
### 2.1 Evaluatie van reclamecampagnes
De effectiviteit van een reclamecampagne wordt geëvalueerd door de merkattitude van consumenten te meten vóór en na blootstelling aan de campagne. Een stijging in de merkattitude na de campagne duidt op succes.
#### 2.1.1 Statistische analyse van merkattitude
Om te bepalen of het verschil in merkattitude statistisch significant is, wordt een **paired samples t-test** uitgevoerd. Deze test is geschikt wanneer twee metingen (vóór en na de campagne) worden gedaan bij dezelfde groep respondenten, wat resulteert in afhankelijke "groepen".
* **Hypothesen:**
* Tweezijdig testen:
* Nulhypothese ($H_0$): Het gemiddelde van de merkattitude vóór de campagne is gelijk aan het gemiddelde van de merkattitude na de campagne.
* Alternatieve hypothese ($H_a$): Het gemiddelde van de merkattitude vóór de campagne is niet gelijk aan het gemiddelde van de merkattitude na de campagne.
* Eenzijdig testen (gericht op een verbetering):
* Nulhypothese ($H_0$): Het gemiddelde van de merkattitude vóór de campagne is groter dan of gelijk aan het gemiddelde van de merkattitude na de campagne.
* Alternatieve hypothese ($H_a$): Het gemiddelde van de merkattitude vóór de campagne is kleiner dan het gemiddelde van de merkattitude na de campagne.
* **Procedure:**
De analyse wordt uitgevoerd via `Analyze > Compare Means > Paired Samples T-Test`. De variabele voor de merkattitude vóór de campagne en de variabele voor de merkattitude na de campagne worden als paren ingevoerd.
* **Interpretatie van resultaten:**
1. **Paired Samples Statistics:** Geeft het gemiddelde en de standaardafwijking voor zowel de attitude vóór als na de campagne weer. Hieruit kan een eerste indruk worden verkregen of de attitude na de campagne hoger is.
2. **Paired Samples Test:** Toont de t-waarde, de vrijheidsgraden, en het tweezijdig significantieniveau (p-waarde). Als het significantieniveau kleiner is dan .05, wordt de nulhypothese verworpen, wat aangeeft dat de campagne een statistisch significant effect heeft gehad op de merkattitude (in dit specifieke geval een verhoging).
> **Tip:** Bij een eenzijdige test moet het significantieniveau uit de Paired Samples Test tabel worden gedeeld door twee om het correcte significantieniveau te verkrijgen.
#### 2.1.2 Voorbeeld van merkattitude analyse
In een onderzoek met 30 respondenten werd de merkattitude vóór een reclamecampagne gemeten als gemiddeld 4.70 met een standaardafwijking van 1.56. Na de campagne steeg de gemiddelde merkattitude naar 5.70 met een standaardafwijking van 1.62. De paired samples t-test gaf een t-waarde van -2.921 met 29 vrijheidsgraden en een tweezijdig significantieniveau van .007. Aangezien p < .05, wordt de nulhypothese verworpen, wat bevestigt dat de reclamecampagne geleid heeft tot een statistisch significant hogere merkattitude.
### 2.2 Impact van self-scanning op de winkelervaring
De implementatie van self-scanning technologie in supermarkten is bedoeld om de winkelervaring te verbeteren. Onderzoek hiernaar omvat het analyseren van consumentenpercepties en gedragingen met betrekking tot self-scanning.
#### 2.2.1 Onderzoeksvragen en statistische methoden
Verschillende onderzoeksvragen kunnen worden gesteld over de impact van self-scanning, waarvoor specifieke statistische toetsen nodig zijn.
* **Onderzoeksvraag 1: Is de gemiddelde perceived waiting time minder dan 3 minuten?**
* **Methode:** One-sample t-test.
* **Hypothesen:**
* $H_0$: Gemiddelde waargenomen wachttijd $\geq$ 3 minuten.
* $H_a$: Gemiddelde waargenomen wachttijd $<$ 3 minuten.
* **Resultaat:** In een steekproef was de gemiddelde waargenomen wachttijd 2.34 minuten, wat statistisch significant lager was dan 3 minuten ($t(413) = -5.34, p < .001$). De nulhypothese werd verworpen.
* **Onderzoeksvraag 2: Verwachten klanten minder tijd in de winkel te besteden dan ze daadwerkelijk doen?**
* **Methode:** Paired t-test (vergelijking van twee afhankelijke metingen bij dezelfde respondenten).
* **Hypothesen:**
* $H_0$: Verwachte tijd $\geq$ Werkelijke tijd.
* $H_a$: Verwachte tijd $<$ Werkelijke tijd.
* **Resultaat:** De verwachte tijd (M = 25.39 minuten) was significant korter dan de werkelijke tijd (M = 27.31 minuten) ($t(413) = -2.71, p < .01$). Klanten onderschatten dus de tijd die ze nodig hebben.
* **Onderzoeksvraag 3: Is het aandeel klanten dat self-scanning gebruikt groter dan 30%?**
* **Methode:** Binomiale test (toetsen van een proportie).
* **Hypothesen:**
* $H_0$: Aandeel self-scanning gebruik (SST) $\leq$ 30%.
* $H_a$: Aandeel self-scanning gebruik (SST) $>$ 30%.
* **Resultaat:** Het aandeel gebruikers van self-scanning was 40%, wat significant groter was dan 30% ($p = .001$). Het streefdoel was dus behaald.
> **Tip:** Let op hoe de test-proportie in SPSS wordt vergeleken; soms moet de codering van de variabele of de test-proportie aangepast worden.
* **Onderzoeksvraag 4: Zijn de ervaren wachttijden lager bij self-scanning gebruikers dan bij niet-gebruikers?**
* **Methode:** Independent samples t-test (vergelijking van twee onafhankelijke groepen).
* **Hypothesen:**
* $H_0$: Waargenomen wachttijd (SST-gebruikers) $\geq$ Waargenomen wachttijd (niet-SST-gebruikers).
* $H_a$: Waargenomen wachttijd (SST-gebruikers) $<$ Waargenomen wachttijd (niet-SST-gebruikers).
* **Resultaat:** De ervaren wachttijd bij self-scanning gebruikers (1.74) was significant kleiner dan bij niet-gebruikers (2.69) ($t(412) = 3.94, p < .001$). Self-scanning gebruikers ervaren dus kortere wachttijden.
* **Onderzoeksvraag 5: Gebruiken shoppers met een hogere opleiding vaker zelfscanning?**
* **Methode:** Chi-kwadraat test (X²-test) van onafhankelijkheid (vergelijking van twee nominale variabelen).
* **Hypothesen:**
* $H_0$: Aandeel self-scanning gebruik (hogere opleiding) $\leq$ Aandeel self-scanning gebruik (lagere opleiding).
* $H_a$: Aandeel self-scanning gebruik (hogere opleiding) $>$ Aandeel self-scanning gebruik (lagere opleiding).
* **Resultaat:** Het percentage shoppers met een hogere opleiding dat self-scanning gebruikte (37.3%) was niet significant hoger dan het percentage met een lagere opleiding (36.4%) ($X^2 = .041, p > .84$). De nulhypothese kon niet verworpen worden.
> **Tip:** Let bij kruistabellen op welke percentages relevant zijn voor de onderzoeksvraag (kolom-, rij- of totaalpercentages) en controleer of de cellen groot genoeg zijn voor de Chi²-test.
#### 2.2.2 Dataverzameling voor self-scanning onderzoek
De data voor dit onderzoek werd verzameld via een veldexperiment met enquêtes bij het binnengaan en buitengaan van de winkel. Variabelen die werden gemeten, omvatten het gebruik van self-scanning, het aantal shoppers, het aantal beschikbare self-scanners, wachtrijlengtes, en de waargenomen wachttijd. Elke rij in de dataset representeert één consument.
---
# Analyse van de relatie tussen geslacht en CD-aankoopgedrag
Deze sectie onderzoekt de associatie tussen het geslacht van de respondent en het al dan niet aankopen van een CD, met behulp van kruistabellen en de chi-kwadraat toets.
### 3.1 Inleiding en databron
De analyse wordt uitgevoerd op basis van de 'Database CM_bb', die informatie bevat over het geslacht van respondenten en of zij een CD hebben aangeschaft. Dit stelt ons in staat om te onderzoeken of er een significante relatie bestaat tussen deze twee variabelen.
### 3.2 Variabelen
* **Geslacht van de respondent:** Dit is een nominale variabele.
* **Al dan niet aankopen van een CD:** Dit is eveneens een nominale variabele.
### 3.3 Onderzoeksvraag en hypothesen
De centrale onderzoeksvraag is of er een significante associatie bestaat tussen het geslacht van de respondent en het al dan niet aankopen van een CD.
De bijbehorende hypothesen luiden:
* Nulhypothese ($H_0$): Het aandeel mannen dat CD's koopt, is hetzelfde als het aandeel vrouwen.
* Alternatieve hypothese ($H_a$): Het aandeel mannen dat CD's koopt, is niet hetzelfde als het aandeel vrouwen.
### 3.4 Statistische analyse: Kruistabel en Chi-kwadraat toets
Om de relatie tussen twee nominale variabelen te onderzoeken, wordt een kruistabel met een chi-kwadraat toets gebruikt.
#### 3.4.1 Uitvoering van de analyse
De analyse wordt als volgt uitgevoerd in statistische software:
1. Ga naar `Analyze > Descriptive Statistics > Crosstabs`.
2. Plaats de variabele 'buying' (CD gekocht: ja/nee) in de rij (`Row(s)`).
3. Plaats de variabele 'gender' (geslacht) in de kolom (`Column(s)`).
4. Onder de tab `Statistics`, selecteer `Chi-square`.
5. Onder de tab `Cells`, vraag `Expected counts` en `Column percentages` op.
#### 3.4.2 Interpretatie van de resultaten
De interpretatie van de resultaten omvat verschillende stappen:
1. **Case Processing Summary:** Controleer het aantal respondenten en eventuele missende waarden. De analyse in dit voorbeeld omvat 100 respondenten met 0 missende waarden.
2. **Kruistabel (Crosstabulation):**
* Deze tabel toont de absolute aantallen (counts) en de percentages per cel. Het is cruciaal om de **kolompercentages** te interpreteren om de relatie tussen de variabelen te beoordelen.
* In het gegeven voorbeeld:
* Van de vrouwen heeft $66.7\%$ de CD gekocht, terwijl slechts $27.3\%$ van de mannen de CD heeft gekocht.
* Dit suggereert een potentieel verschil in aankoopgedrag tussen mannen en vrouwen.
3. **Voorwaarden voor de Chi-kwadraat toets:**
* Voordat de chi-kwadraat toets geïnterpreteerd kan worden, moeten de voorwaarden gecontroleerd worden. De belangrijkste voorwaarde is dat de verwachte aantallen (expected counts) in de cellen niet te klein mogen zijn. Een gangbare vuistregel is dat minder dan 20% van de cellen een verwachte count kleiner dan 5 mag hebben, en geen enkele cel mag een verwachte count kleiner dan 1 hebben.
* In het voorbeeld wordt aangegeven dat $0\%$ van de cellen een verwachte waarde kleiner dan 5 heeft, en de minimale verwachte waarde is $20.25$. Dit betekent dat de voorwaarden voor de chi-kwadraat toets **niet geschonden** zijn, en de test kan betrouwbaar geïnterpreteerd worden.
4. **Chi-Square Tests tabel:**
* Deze tabel bevat de resultaten van de chi-kwadraat toets. De belangrijkste waarde is de `Pearson Chi-Square` met bijbehorende `Asymptotic Significance (2-sided)`.
* In het voorbeeld is de `Pearson Chi-Square` gelijk aan $15.519$ met $1$ vrijheidsgraad (`df`).
* Het significantieniveau (`Sig. (2-tailed)`) is kleiner dan $0.05$ (in dit geval $0.000$).
#### 3.4.3 Conclusie
Aangezien het significantieniveau kleiner is dan $0.05$, wordt de nulhypothese verworpen. Dit betekent dat er een **statistisch significante associatie** is tussen het geslacht van de respondent en het al dan niet aankopen van de CD. Specifiek, vrouwen kopen significant vaker een CD dan mannen in deze steekproef.
> **Tip:** Bij het interpreteren van kruistabellen is het essentieel om te focussen op de percentages die de relatie tussen de categorieën van de variabelen weergeven. Kolompercentages zijn vaak het meest informatief wanneer er een causale of voorspellende relatie wordt onderzocht (bijvoorbeeld, hoe geslacht voorspelt aankoop).
> **Voorbeeld:** De kruistabel toont dat 15 vrouwen de CD niet hebben gekocht en 40 mannen de CD niet hebben gekocht. Echter, in termen van percentages binnen hun eigen geslacht, betekent dit dat 33.3% van de vrouwen en 72.7% van de mannen de CD niet heeft gekocht. Dit percentageverschil is significant en wijst op een verband.
---
# Invloed van land, stereotypen en geslacht op advertentieattitude
Dit gedeelte behandelt de invloed van land, stereotypen en geslacht op de attitude ten opzichte van advertenties, inclusief de methodologische stappen om de vergelijkbaarheid van steekproeven te waarborgen en de analyse van deze attitudes door middel van factoranalyse.
## 4.5 Invloed van land, stereotypen en geslacht op advertentieattitude
### 4.5.1 Vergelijkbaarheid van steekproeven (land: Zweden vs. Duitsland)
Om de invloed van verschillende factoren op de attitude ten opzichte van advertenties te onderzoeken, is het cruciaal om eerst de vergelijkbaarheid van de gebruikte steekproeven te waarborgen. In dit specifieke geval worden de steekproeven uit Zweden en Duitsland vergeleken op het gebied van leeftijd en geslacht. Grote verschillen in deze demografische variabelen tussen de landen zouden namelijk kunnen verklaren waarom er verschillen in attitude ten opzichte van advertenties worden waargenomen, in plaats van de onderzochte factoren (land, stereotypen, geslacht model).
#### 4.5.1.1 Vergelijking van leeftijd tussen Zweden en Duitsland
* **Onderzoeksvraag:** Is er een verschil in gemiddelde leeftijd tussen de steekproeven uit Zweden en Duitsland?
* **Variabelen:** Leeftijd (interval variabele) en Land (nominale variabele met twee onafhankelijke groepen).
* **Statistische toets:** Independent samples t-test.
* **Hypothesen:**
* $H_0$: De gemiddelde leeftijd in Zweden is gelijk aan de gemiddelde leeftijd in Duitsland.
* $H_a$: De gemiddelde leeftijd in Zweden is niet gelijk aan de gemiddelde leeftijd in Duitsland.
* **Resultaten:**
* De Levene's test voor gelijke varianties gaf een significantieniveau groter dan .05, wat impliceert dat we uitgaan van gelijke varianties (equal variances assumed).
* De t-test liet zien dat er geen statistisch significant verschil is in de gemiddelde leeftijd tussen Duitsland ($M = 42.58$, $SD = 12.70$) en Zweden ($M = 42.54$, $SD = 13.65$). De resultaten waren $t(1011) = 0.054$, $p = 0.957$.
* **Conclusie:** De gemiddelde leeftijd van de respondenten in de Duitse en Zweedse steekproeven is vergelijkbaar, wat de vergelijkbaarheid van de steekproeven op dit aspect garandeert.
#### 4.5.1.2 Vergelijking van geslacht tussen Zweden en Duitsland
* **Onderzoeksvraag:** Is de verhouding tussen mannen en vrouwen statistisch significant verschillend tussen de steekproeven uit Zweden en Duitsland?
* **Variabelen:** Geslacht (nominale variabele) en Land (nominale variabele met twee onafhankelijke groepen).
* **Statistische toets:** Kruistabel met Chi-kwadraat toets ($\chi^2$).
* **Hypothesen:**
* $H_0$: De verhouding geslachten in Zweden is gelijk aan de verhouding geslachten in Duitsland.
* $H_a$: De verhouding geslachten in Zweden is niet gelijk aan de verhouding geslachten in Duitsland.
* **Resultaten:**
* De analyse van de kruistabel toonde aan dat de verdeling van mannen en vrouwen in Duitsland (48.8% mannen) en Zweden (49.9% mannen) niet statistisch significant verschilde. De resultaten waren $\chi^2(1, N=1013) = 0.120$, $p = 0.729$.
* De voorwaarden voor de Chi-kwadraat toets waren niet geschonden, aangezien er geen cellen waren met een verwachte count kleiner dan 5 en de minimum verwachte count ruim voldoende was.
* **Conclusie:** De samenstelling van de steekproeven qua geslacht is vergelijkbaar tussen Zweden en Duitsland, wat bijdraagt aan de vergelijkbaarheid van de steekproeven.
### 4.5.2 Factoranalyse van attitudes tegenover de advertentie
Na het vaststellen van de vergelijkbaarheid van de steekproeven, wordt de attitude ten opzichte van de advertentie onderzocht door middel van factoranalyse. Dit helpt om de onderliggende dimensies van de attitude te identificeren.
* **Procedure:** Factoranalyse wordt uitgevoerd via het menu `Analyze > Dimension Reduction > Factor`.
* **Interpretatie van Tabellen:** De interpretatie van de verschillende outputtabellen (zoals Communalities, Total Variance Explained, en Rotated Component Matrix) is analoog aan eerdere oefeningen in datareductie.
* **Belangrijkste conclusies:**
* Er worden **twee factoren** geïdentificeerd die samen 72.98% van de totale variantie in de attitude ten opzichte van de advertentie verklaren.
* **Factor 1** omvat de items die de **algemene attitude** tegenover de advertentie bevragen.
* **Factor 2** omvat drie items die specifiek de **ethische attitude** ten opzichte van de advertentie bevragen.
> **Tip:** Factoranalyse helpt om een complex geheel van variabelen te reduceren tot een kleiner aantal latente constructen (factoren). Dit is essentieel om de structuur van attitudes te begrijpen en de belangrijkste dimensies te isoleren.
> **Voorbeeld:** Als een reeks vragen gaat over de aantrekkelijkheid, informativiteit en overtuigingskracht van een advertentie, en deze items groeperen zich sterk onder één factor, dan duidt dit op een onderliggende dimensie van "algemene positieve evaluatie" van de advertentie. Items die daarentegen specifiek de waarachtigheid of correctheid van de advertentie bevragen, kunnen een aparte factor van "ethische beoordeling" vormen.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Populatie | De volledige verzameling van individuen of objecten waarover een statistisch onderzoek uitspraken wil doen. |
| Steekproef | Een subset van de populatie die wordt geselecteerd om de kenmerken van de populatie te schatten. |
| Gemiddelde | De som van alle waarden gedeeld door het aantal waarden, wat een maat is voor centrale tendens. |
| Afhankelijke variabele | De variabele die wordt gemeten of geobserveerd en waarvan men vermoedt dat deze wordt beïnvloed door de onafhankelijke variabele. |
| Onafhankelijke variabele | De variabele die wordt gemanipuleerd of geobserveerd om te zien of deze een effect heeft op de afhankelijke variabele. |
| Interval gemeten variabele | Een variabele waarbij de verschillen tussen opeenvolgende waarden gelijk zijn en er een zinvolle ordinale volgorde is, maar geen absoluut nulpunt. |
| Nulhypothese (H0) | Een stelling die stelt dat er geen effect, verschil of relatie bestaat tussen de variabelen die onderzocht worden. |
| Alternatieve hypothese (Ha) | Een stelling die stelt dat er wel een effect, verschil of relatie bestaat tussen de variabelen die onderzocht worden. |
| One-sample t-test | Een statistische toets om te bepalen of het gemiddelde van een enkele steekproef significant verschilt van een bekend populatiegemiddelde. |
| t-waarde | De toetsingsgrootheid van de t-test, die de steekproefstatistiek relateert aan de nulhypothese. |
| Vrijheidsgraden (df) | Het aantal waarden in de berekening van een statistiek dat vrij kan variëren; het bepaalt de vorm van de t-verdeling. |
| Significantieniveau (p-waarde) | De kans om de geobserveerde resultaten (of extremere) te verkrijgen, gegeven dat de nulhypothese waar is. Een lage p-waarde (typisch < .05) leidt tot verwerping van de nulhypothese. |
| Independent samples t-test | Een statistische toets om te bepalen of de gemiddelden van twee onafhankelijke groepen significant van elkaar verschillen. |
| Groep | Een verzameling individuen of objecten die gemeenschappelijke kenmerken delen. |
| Levene’s Test | Een statistische toets om te bepalen of de varianties van twee of meer groepen gelijk zijn, wat een voorwaarde is voor de independent samples t-test. |
| Gelijk(e) varianties aangenomen | De aanname dat de varianties van de groepen die vergeleken worden, gelijk zijn. |
| Gelijk(e) varianties niet aangenomen | De situatie waarin de varianties van de groepen die vergeleken worden, significant verschillen. |
| Paired samples t-test | Een statistische toets om te bepalen of de gemiddelden van twee gerelateerde (afhankelijke) metingen significant van elkaar verschillen. |
| Merkattitude | De algemene evaluatie die een consument heeft ten opzichte van een bepaald merk. |
| Factoranalyse | Een statistische methode die wordt gebruikt om de onderliggende structuur van een set geobserveerde variabelen te identificeren en te meten. |
| Variantie | Een maat voor de spreiding van gegevens rondom het gemiddelde; de gemiddelde gekwadrateerde afwijking van het gemiddelde. |
| Binomial test | Een statistische toets die wordt gebruikt om te bepalen of de proportie van succesvolle uitkomsten in een reeks van onafhankelijke Bernoulli-experimenten significant verschilt van een verwachte proportie. |
| Crosstabs (Kruistabellen) | Een tabel die de frequentieverdeling van twee of meer categorische variabelen toont, waardoor de relatie ertussen kan worden geanalyseerd. |
| Chi-kwadraat toets (X²) | Een statistische toets die wordt gebruikt om te bepalen of er een significante associatie is tussen twee categorische variabelen. |
| Nominale variabele | Een variabele waarbij de waarden categorisch zijn zonder inherente volgorde (bv. geslacht, kleur). |
| Frequentie | Het aantal keren dat een bepaalde waarde of categorie voorkomt in een dataset. |
| Percentage | Een proportie uitgedrukt als een deel van honderd. |
| Associatie | Een statistische relatie tussen twee of meer variabelen, waarbij veranderingen in de ene variabele gepaard gaan met veranderingen in de andere. |
| KMO and Bartlett's Test | Statistieken die worden gebruikt om de geschiktheid van gegevens voor factoranalyse te beoordelen. De KMO meet de mate waarin de steekproef adequaat is voor factoranalyse, en Bartlett's test van sfericiteit toetst of er correlaties bestaan tussen de variabelen. |
| Communalities | In factoranalyse, de proportie van de variantie van een variabele die wordt verklaard door de geëxtraheerde factoren. |
| Eigenvalues | In factoranalyse, waarden die de hoeveelheid variantie weergeven die door een factor wordt verklaard. |
| Rotated Component Matrix | Een componentenmatrix waarin de factoren zijn geroteerd om de interpretatie te vergemakkelijken door de ladingen op de factoren te maximaliseren. |