Business Intelligence
Cover
Data Driven alle Powerpoints.pptx
Summary
# Inleiding tot data-gedreven management
Dit document introduceert het concept van data-gedreven management, waarbij de nadruk ligt op het nemen van geïnformeerde beslissingen op basis van data in moderne bedrijfspraktijken.
## 1. Data-gedreven management
### 1.1 Definitie en belang
Management is fundamenteel gericht op het nemen van beslissingen. In de hedendaagse zakelijke omgeving is het cruciaal dat deze beslissingen geïnformeerd zijn, wat betekent dat ze gebaseerd zijn op concrete data in plaats van op intuïtie alleen. Dit vereist dat managers data kunnen verzamelen, analyseren en interpreteren om effectieve strategieën te ontwikkelen en operationele uitdagingen aan te gaan.
### 1.2 Rol van data in besluitvorming
Het gebruik van data in managementprocessen transformeert de manier waarop bedrijven opereren. Data stelt organisaties in staat om:
* **Inzichten te verkrijgen:** Door data te analyseren, kunnen patronen, trends en afwijkingen worden ontdekt die anders verborgen zouden blijven.
* **Processen te optimaliseren:** Data kan leiden tot verbeteringen in efficiëntie, kostenbesparingen en kwaliteitsverbeteringen.
* **Strategische beslissingen te onderbouwen:** Data biedt een solide basis voor investeringsbeslissingen, marktanalyses en concurrentievoordeel.
### 1.3 Kernvragen van de cursus
Deze cursus behandelt diverse aspecten van data-gedreven management, waaronder:
* De impact van data op moderne managementbesluitvorming.
* De kenmerken van een data-gedreven organisatie en het principe van evidence-based decision making.
* De data die wordt gegenereerd binnen verschillende bedrijfsprocessen.
* De rol van zakelijke tools en Enterprise Resource Planning (ERP) systemen.
* De identificatie en het gebruik van Key Performance Indicators (KPI's) per proces.
* De methoden voor het creëren van efficiënte dashboards.
## 2. Data-gedreven praktijken in de praktijk
Verschillende sectoren en bedrijven maken reeds intensief gebruik van data om hun activiteiten te verbeteren:
### 2.1 Case studies
* **Aanbevelingssystemen:** Platforms zoals Netflix gebruiken data om gepersonaliseerde contentaanbevelingen te doen, wat de klantbetrokkenheid verhoogt.
* **Dynamische prijsstelling:** Hotels passen hun prijzen real-time aan op basis van vraag, bezettingsgraad en externe factoren.
* **Voorraadbeheer en mode:** Zara gebruikt data van connected POS-systemen en sensoren om klantgedrag te analyseren, vraag te voorspellen en designs binnen 15 dagen aan te passen aan veranderende consumentenvoorkeuren.
* **Sportanalyse:** Data wordt gebruikt voor prestatieanalyse van atleten, blessurepreventie en strategische teamplanning.
### 2.2 Business processen en Key Performance Indicators (KPI's)
Elk bedrijfsproces genereert specifieke data die kan worden omgezet in bruikbare inzichten via KPI's.
#### 2.2.1 Marketing & Sales
* **Marketing Funnel:** Het proces van het genereren van leads tot het converteren van deze leads naar betalende klanten.
* **Cost per Click (CPC):** De kosten die gemaakt worden voor elke klik op een online advertentie.
$ \text{CPC} = \frac{\text{Totale advertentiekosten}}{\text{Aantal klikken}} $
* **Click-Through Rate (CTR):** Het percentage van de mensen dat op een link klikt in relatie tot het aantal mensen dat de content heeft gezien (bv. e-mail, advertentie).
$ \text{CTR} = \frac{\text{Aantal klikken}}{\text{Aantal vertoningen}} \times 100\% $
* **Voorbeeld:** 7.500 mensen openden een e-mail, 435 klikten op de link. De CTR is $ \frac{435}{7500} \times 100\% = 5,8\% $.
* **Conversion Rate:** Het percentage van bezoekers dat een gewenste actie uitvoert (bv. aankoop).
$ \text{Conversion Rate} = \frac{\text{Aantal conversies}}{\text{Totaal aantal bezoekers}} \times 100\% $
* **Voorbeeld:** 135.000 bezoekers per maand, 6.200 plaatsen een bestelling. De Conversion Rate is $ \frac{6.200}{135.000} \times 100\% = 4,6\% $.
* **Return on Ads Spend (ROAS):** Meet de omzet die gegenereerd wordt voor elke euro die aan advertenties wordt uitgegeven. Een ROAS groter dan 1 is positief.
$ \text{ROAS} = \frac{\text{Extra omzet door campagne}}{\text{Totale advertentiekosten van campagne}} $
* **Voorbeeld:** Campagnekosten 6.000 euro, extra omzet 29.000 euro. ROAS is $ \frac{29.000}{6.000} = 4,83 $.
* **Sales Manager KPI's:**
* **Customer Acquisition Cost (CAC):** De totale kosten van verkoop en marketing gedeeld door het aantal nieuwe klanten dat in een periode is verworven.
$ \text{CAC} = \frac{\text{Totale kosten verkoop + marketing}}{\text{Aantal nieuwe klanten}} $
* **Voorbeeld:** Totale marketingkosten 2023 = 178.560 dollar, totale verkoopkosten 2023 = 68.530 dollar, nieuwe klanten 2023 = 520. CAC = $ \frac{178.560 + 68.530}{520} = 475,17 \text{ dollar} $.
* **Customer Lifetime Value (CLV):** De totale verwachte winst die een klant gedurende de gehele relatie met het bedrijf zal genereren.
$ \text{CLV} = \text{Gemiddelde klantwaarde} \times \text{Gemiddelde klantlevensduur} $
* **Berekening Gemiddelde Klantwaarde:** Gemiddelde aankoopwaarde ($23 \text{ dollar}$) x Gemiddelde aankoopfrequentie ($5,52$).
* **Voorbeeld:** CLV = $127 \text{ dollar} \times 7,6 \text{ jaar} = 965,2 \text{ dollar} $.
* **Relatie CAC en CLV:** Het is essentieel dat de CLV hoger is dan de CAC ($ \text{CLV} > \text{CAC} $ of $ \frac{\text{CLV}}{\text{CAC}} > 1 $).
* **Voorbeeld:** CLV is 965 dollar, CAC is 475 dollar. $ \frac{965}{475} \approx 2,03 $, wat aangeeft dat de klantwinstgevendheid gezond is.
#### 2.2.2 Operations
* **BoM (Bill of Materials):** Een gedetailleerde lijst van alle componenten die nodig zijn om een product te produceren.
* **Work Centers en Routings:** Beschrijven de productiestappen en de benodigde machines of werkplekken.
* **Manufacturing Order:** Een opdracht om een bepaalde hoeveelheid van een product te produceren, inclusief details over benodigde materialen en productiestappen.
* **Operation Manager KPI's:**
* **Productivity:** Meet de efficiëntie van de output ten opzichte van de input.
$ \text{Productivity} = \frac{\text{Output}}{\text{Input}} $
* **Voorbeeld:** Het frezen van ijzeren platen: 2019: 1,25 platen per uur; 2024: 0,67 platen per uur.
* **Labour Productivity:** GDP gedeeld door het totale aantal gewerkte uren.
* **Throughput:** De hoeveelheid output die een proces in een bepaalde tijdseenheid produceert.
$ \text{Throughput} = \frac{\text{Totale output}}{\text{Effectieve productietijd}} $
* **Voorbeeld:** 9.550 auto-onderdelen geproduceerd in 56,5 effectieve productietijd = 169 onderdelen per uur.
* **Manufacturing Cost per Unit:** De totale kosten (grondstoffen, werkcentra) per geproduceerd eenheid.
* **Overall Equipment Effectiveness (OEE):** Meet de prestaties van productieapparatuur door rekening te houden met beschikbaarheid, prestaties en kwaliteit.
$ \text{OEE} = \text{Availability} \times \text{Performance} \times \text{Quality} $
* **Voorbeeld:** OEE van 83,3% wordt als zeer goed beschouwd.
#### 2.2.3 Purchase & Logistics
* **Purchase Manager KPI's:**
* **Cost Savings:** Gerealiseerde kostenreducties door efficiëntere inkoop.
$ \text{Cost Savings} = \frac{\text{Oude prijs per artikel} - \text{Nieuwe prijs per artikel}}{\text{Oude prijs per artikel}} $
* **Voorbeeld:** Kosten per artikel gedaald van 151,79 dollar naar 140,15 dollar, wat een besparing van ongeveer 8% betekent.
* **Supplier Lead Time:** De tijd tussen het plaatsen van een bestelling en de levering.
$ \text{Gemiddelde Supplier Lead Time} = \frac{\sum \text{Levertijden}}{\text{Aantal orders}} $
* **Voorbeeld:** Rexel heeft een gemiddelde lead time van 1,8 dagen, Cebeo van 2,6 dagen.
* **On-Time Delivery (OTD):** Het percentage van de leveringen dat op tijd plaatsvindt.
$ \text{OTD} = \frac{\text{Aantal on-time leveringen}}{\text{Totaal aantal leveringen}} \times 100\% $
* **Purchase Cycle Time:** De totale tijd die nodig is voor het inkoopproces, van aanvraag tot ontvangst.
* **Inventory/Warehouse/Logistics Manager KPI's:**
* **Inventory Turnover:** Meet hoe vaak de voorraad gedurende een periode wordt verkocht en vervangen. Een hogere turnover is doorgaans wenselijker.
$ \text{Inventory Turnover} = \frac{\text{Cost of Goods Sold (COGS)}}{\text{Gemiddelde voorraadwaarde}} $
* **Voorbeeld:** Een turnover van 4 betekent dat de voorraad 4 keer per jaar wordt verkocht en aangevuld.
* **Backorder Rate:** Het percentage van de orders dat niet direct uit voorraad geleverd kon worden.
$ \text{Backorder Rate} = \frac{\text{Aantal backorders}}{\text{Totaal aantal orders}} \times 100\% $
#### 2.2.4 Finance
* **Financial Manager KPI's:**
* **Working Capital:** Het verschil tussen kortlopende activa en kortlopende passiva, een indicatie van de kortetermijnfinanciële gezondheid.
$ \text{Working Capital} = \text{Vlottende activa} - \text{Kortlopende schulden} $
* **Voorbeeld:** Vlottende activa (cash, debiteuren, voorraden) = 77.800 dollar. Kortlopende schulden (crediteuren, kortlopende leningen) = 23.780 dollar. Working Capital = 54.020 dollar.
* **Current Ratio:** Meet het vermogen om kortlopende schulden te voldoen met kortlopende activa.
$ \text{Current Ratio} = \frac{\text{Vlottende activa}}{\text{Kortlopende schulden}} $
* **Voorbeeld:** 3,27.
* **Quick Ratio:** Vergelijkbaar met de Current Ratio, maar exclusief voorraden, omdat deze minder liquied zijn.
$ \text{Quick Ratio} = \frac{\text{Vlottende activa} - \text{Voorraden}}{\text{Kortlopende schulden}} $
* **Voorbeeld:** 2,16.
* **Debt Ratio:** Meet het aandeel van schulden ten opzichte van de totale activa, een indicator van financiële hefboomwerking.
$ \text{Debt Ratio} = \frac{\text{Totale schulden}}{\text{Totale activa}} \times 100\% $
* **Voorbeeld:** 67%.
* **Gross Profit Margin:** Winst uit verkoop exclusief indirecte kosten.
$ \text{Gross Profit Margin} = \frac{\text{Brutowinst}}{\text{Omzet}} \times 100\% $
* **Voorbeeld:** 48,25%.
* **Net Profit Margin:** De uiteindelijke winst na aftrek van alle kosten, inclusief indirecte kosten.
$ \text{Net Profit Margin} = \frac{\text{Nettowinst}}{\text{Omzet}} \times 100\% $
* **Voorbeeld:** 32,5%.
* **Return on Equity (ROE):** Meet hoe effectief het eigen vermogen wordt benut om winst te genereren.
$ \text{ROE} = \frac{\text{Nettowinst}}{\text{Eigen vermogen}} \times 100\% $
* **Voorbeeld:** 10%.
* **Return on Capital:** Meet de winstgevendheid ten opzichte van het totale geïnvesteerde kapitaal (eigen vermogen + schulden).
$ \text{Return on Capital} = \frac{\text{Nettowinst}}{\text{Totaal geïnvesteerd kapitaal}} \times 100\% $
* **Voorbeeld:** 3,3%.
#### 2.2.5 Human Resources (HR)
* **HR Manager KPI's:**
* **Employee Turnover Rate:** Het percentage van werknemers dat een organisatie verlaat gedurende een specifieke periode.
$ \text{Employee Turnover Rate} = \frac{\text{Aantal vertrokken werknemers}}{\text{Gemiddeld aantal werknemers}} \times 100\% $
* **Voorbeeld:** 19,42%.
* **Time to Hire:** De gemiddelde tijd die nodig is om een vacature in te vullen.
* **Cost to Hire:** De gemiddelde kosten die gemaakt worden om een nieuwe werknemer aan te nemen.
* **Employee Productivity:** De waarde van de output per werknemer of per gewerkt uur.
$ \text{Employee Productivity} = \frac{\text{Totale output}}{\text{Aantal werknemers}} $ of $ \frac{\text{Totale output}}{\text{Totaal aantal gewerkte uren}} $
## 3. Data naar inzicht: Business Intelligence en data-analyse
Het proces van het transformeren van ruwe data naar bruikbare inzichten is cruciaal voor data-gedreven besluitvorming.
### 3.1 Van data naar inzicht en actie
* **Ruwe Data:** De initiële, onbewerkte gegevens.
* **Informatie:** Data waaraan betekenis is gegeven door middel van labels en context.
* **Kennis:** De interpretatie en het begrip van de informatie, inclusief de onderliggende verbanden.
* **Actie:** Beslissingen en handelingen gebaseerd op de verkregen kennis.
### 3.2 Business Intelligence (BI)
BI omvat het verzamelen, integreren, analyseren en presenteren van bedrijfsinformatie om beter geïnformeerde beslissingen te nemen.
* **Doel:** Het leveren van de juiste informatie, op het juiste moment, op de juiste manier, zodat deze gemakkelijk interpreteerbaar is.
* **Tools:** Er zijn diverse BI-tools beschikbaar, die vaak geïntegreerd zijn in ERP-systemen. Voorbeelden zijn Power BI en Qlik.
* **Corporate War Room / Decision Cockpit:** Centrale hubs in grote organisaties waar managers data en dashboards kunnen raadplegen voor real-time besluitvorming.
### 3.3 Big Data
Big Data verwijst naar datasets die zo groot, complex en snel veranderend zijn dat traditionele dataverwerkingssystemen ontoereikend zijn.
* **De 3 V's van Big Data:**
* **Volume:** De enorme hoeveelheid data die wordt gegenereerd. (Bijvoorbeeld 181 zettabytes wereldwijd in 2025).
* **Velocity:** De snelheid waarmee data wordt gegenereerd en verwerkt (real-time of nabij real-time).
* **Variety:** De diversiteit aan datatypen, variërend van gestructureerde data (tabellen) tot ongestructureerde data (tekst, beelden, video).
### 3.4 AI, Machine Learning en Deep Learning
Kunstmatige intelligentie (AI), Machine Learning (ML) en Deep Learning (DL) zijn technologieën die het mogelijk maken om complexe patronen in grote datasets te herkennen en voorspellingen te doen.
* **Essentiële componenten voor AI:** Slimme algoritmen, rekenkracht en grote hoeveelheden data.
* **Neurale Netwerken:** Geïnspireerd door de structuur van het menselijk brein, simuleren neurale netwerken de werking van neuronen om te leren en beslissingen te nemen.
* **Machine Learning:** Algoritmen die systemen in staat stellen te leren van data zonder expliciet geprogrammeerd te zijn.
* **Supervised Learning:** Een type ML waarbij het algoritme wordt getraind met gelabelde data (input-output paren). Feedback wordt gebruikt om de modelparameters aan te passen en de nauwkeurigheid te verbeteren.
* **Deep Learning:** Een geavanceerde vorm van ML die meerdere lagen van neurale netwerken gebruikt, wat leidt tot zeer complexe modellen die vaak verder gaan dan menselijk begrip.
## 4. Data-gedreven besluitvormingstechnieken
Het effectief toepassen van data voor besluitvorming volgt een gestructureerd proces.
### 4.1 Het data-analyseproces
1. **Definieer het probleem:** Stel duidelijke doelstellingen en verwachte resultaten vast.
* **Goed voorbeeld:** "De financiële afdeling wil maandelijks de evolutie van inkomsten versus uitgaven inzichtelijk maken."
* **Slecht voorbeeld:** "Laten we een financieel dashboard opzetten."
2. **Verzamel de data:** Haal data uit interne databases, gebruik connectoren, API's, web scraping, open datasets, etc.
3. **Pre-processing:** Reinig en bereid de data voor analyse voor. Dit omvat:
* Verwijderen van duplicaten.
* Omgaan met ontbrekende waarden (invullen met gemiddelde, mediaan, of weglaten indien acceptabel).
* Standaardiseren van formaten.
* Converteren van categorische variabelen naar numerieke data.
* **Tip:** Dit proces kan tot 80% van de totale analysetijd in beslag nemen.
4. **Analyseer de data:** Ontdek patronen, trends en relaties. Technieken omvatten:
* **Beschrijvende statistieken:** Gemiddelde (mean), mediaan, variantie.
* $ \text{Mean} = \frac{\sum x_i}{n} $
* $ \text{Mediaan} $: de middelste waarde in een gesorteerde dataset.
* $ \text{Variantie} = \frac{\sum (x_i - \bar{x})^2}{n-1} $
* **Correlaties, trends en uitschieters (outliers):** Identificeer verbanden en afwijkingen.
* **Geavanceerdere technieken:** Regressie (voorspellen van een afhankelijke variabele op basis van onafhankelijke variabelen), clustering (groeperen van vergelijkbare datapunten) en classificatie (toewijzen van datapunten aan categorieën).
5. **Visualiseer de data:** Presenteer inzichten grafisch om ze begrijpelijker te maken.
6. **Interpreteer en communiceer de resultaten:** Vertaal technische bevindingen naar zakelijke taal en presenteer ze op een duidelijke, niet-misleidende manier. Gebruik de juiste taal om de mate van zekerheid aan te geven (bv. "suggereert", "duidt erop", "impliceert").
## 5. Zakelijke tools en ERP-systemen
Enterprise Resource Planning (ERP) systemen zijn geïntegreerde softwareoplossingen die alle kernprocessen van een bedrijf beheren en optimaliseren, met dataopslag in één centrale database.
### 5.1 Voordelen van ERP-systemen
* **Datacentralisatie:** Data wordt slechts één keer ingevoerd, wat leidt tot minder fouten en duplicaten.
* **Procesintegratie:** Vloeiende overgangen tussen verschillende bedrijfsprocessen (bv. verkooporder naar productieorder).
* **Verbeterde rapportage:** Eenvoudigere generatie van rapporten en dashboards dankzij de centrale data.
* **Uniformiteit:** Eén centrale bron van waarheid ("single source of truth").
### 5.2 Discussiepunten rondom ERP
* **Niet voor elk bedrijf noodzakelijk:** De behoefte aan ERP hangt af van de omvang, sector en complexiteit van de organisatie.
* **Kosten en implementatie:** ERP-implementaties kunnen kostbaar en tijdrovend zijn.
* **Alternatieven:** Voor sommige bedrijven kan een integratie van verschillende, gespecialiseerde business tools een betere oplossing zijn dan een alomvattend ERP-systeem.
* **Schaalgrootte:** Grote multinationals gebruiken ERP vaak als kern, aangevuld met specifieke software voor bijvoorbeeld Warehouse Management (WMS) of Customer Relationship Management (CRM).
* **API's (Application Programming Interfaces):** Maakt de integratie van verschillende softwaretoepassingen, vaak cloud-gebaseerd, mogelijk.
### 5.3 Ontwikkeling van eigen ERP
Het zelf ontwikkelen van een ERP-systeem ("reinventing the wheel") wordt over het algemeen afgeraden vanwege de enorme kosten, tijdsinvestering en de risico's op mislukking, vergeleken met de aanschaf van bestaande SaaS (Software as a Service) oplossingen.
## 6. Databases en datamanagement
Databases vormen de ruggengraat voor het opslaan en ophalen van data die door softwareapplicaties wordt gebruikt.
### 6.1 Databases en DBMS
* **Database (DB):** Een georganiseerde verzameling van gerelateerde data.
* **Database Management System (DBMS):** Software die de interactie tussen gebruikers (mensen of software) en de database regelt.
### 6.2 Relationele vs. Niet-relationele databases (NoSQL)
* **Relational Database Management Systems (RDBMS):**
* Data is gestructureerd in tabellen met rijen en kolommen.
* Maakt gebruik van **SQL (Structured Query Language)** voor data manipulatie.
* **Primary Key:** Een unieke identificatie voor elke rij in een tabel.
* **Foreign Key:** Een sleutel die verwijst naar de Primary Key van een andere tabel om relaties te leggen.
* Voorbeelden van RDBMS: Microsoft SQL Server, MySQL, Oracle Database.
* **Non-relational Databases (NoSQL):**
* Ontworpen voor grote hoeveelheden ongestructureerde of semi-gestructureerde data.
* Vaak flexibeler dan RDBMS.
* Gebruiken verschillende datamodellen, zoals **Document Stores** (bv. JSON-formaat).
* JSON biedt flexibiliteit door de mogelijkheid om geneste structuren en optionele velden te definiëren.
* Toepassingen: Big Data, realtime webapplicaties, content management.
## 7. Data-gedreven organisaties
Data-gedreven organisaties maken systematisch gebruik van data om alle aspecten van hun bedrijf te verbeteren, van strategische beslissingen tot dagelijkse operationele taken. Dit vereist de juiste tools, processen en een cultuur die data-evaluatie stimuleert.
---
Dit onderwerp introduceert het concept van data-gedreven management, de rol van besluitvorming op basis van data en de vragen die tijdens de cursus behandeld zullen worden, waarbij de nadruk ligt op het belang van data in moderne managementpraktijken.
## 1. Wat is data-gedreven management?
Management draait om het nemen van beslissingen. Succesvolle managers nemen geïnformeerde beslissingen, gebaseerd op data. Dit omvat vragen zoals:
* Moeten we investeren in een nieuw magazijn?
* Hoeveel mensen moeten we laten gaan in een kostenbesparende oefening?
* Waarom dalen de verkopen in Azië en wat kunnen we daaraan doen?
* Wat is de gemiddelde marge op onze laatste tien projecten?
* Hoe verhoudt onze EBITDA zich tot die van onze grootste concurrent?
Data-gedreven management transformeert de manier waarop bedrijven opereren door het gebruik van data.
### 1.1 Casestudies in data-gedreven business
* **Aanbevelingssystemen:** Bepalen welke content gelicentieerd en geproduceerd moet worden, en wanneer deze uitgebracht moet worden (bijvoorbeeld Netflix).
* **Dynamische prijzen in de hotelsector:** Prijzen aanpassen op basis van realtime vraag en aanbod.
* **Klantvraag voorspellen:** Gebruikmaken van historische data en realtime informatieverzameling via verbonden systemen (zoals POS-systemen met sensoren en camera's) om de vraag naar producten te voorspellen (bijvoorbeeld in de retail, zoals Zara).
* **Kledingmodificatie en trendgevoeligheid:** Zara kan ontwerpen binnen vijftien dagen aanpassen om in te spelen op veranderende consumentenvoorkeuren.
* **Sport en data:** Gebruik van data in sport om prestaties te verbeteren en strategieën te ontwikkelen.
### 1.2 Vragen die tijdens de cursus beantwoord worden
* Hoe beïnvloedt data moderne managementbesluitvorming?
* Wat is een data-gedreven bedrijf en wat is evidence-based besluitvorming?
* Welke data wordt gegenereerd in welke bedrijfsprocessen?
* Wat is de rol van bedrijfssoftware en ERP-systemen?
* Wat zijn de Key Performance Indicators (KPI's) in elk proces?
* Hoe kunnen we efficiënte dashboards maken?
De cursus is opgedeeld in twee delen: deel 1 behandelt datatrends en -concepten, en deel 2 focust op één bedrijfsproces en de gerelateerde KPI's, met kleine oefeningen.
## 2. Van data naar inzicht: Business Intelligence en KPI's
De transformatie van ruwe data naar bruikbare inzichten en actie verloopt via de volgende stappen:
* **Ruwe data:** De basisgegevens.
* **Informatie:** Gegevens met betekenis gegeven door labelling.
* **Kennis:** Interpretatie van informatie met toegevoegde context.
* **Actie:** Het nemen van beslissingen op basis van kennis.
### 2.1 Bedrijfsprocessen en Key Performance Indicators (KPI's)
Bedrijven genereren data uit diverse processen, waaronder:
* Inkoop & Logistiek
* Marketing & Sales
* Operations
* Financiën (inkomsten, kosten, winst)
* Human Resources (HR)
### 2.2 Business Intelligence (BI)
Business Intelligence (BI) omvat het verzamelen van data tijdens het zakendoen en het omzetten van deze data in informatie om kennis te vergaren en passende actie te ondernemen. Dit leidt tot geïnformeerde en correcte beslissingen.
#### 2.2.1 De rol van BI in besluitvorming
* **Data-inzicht:** BI-tools helpen bij het analyseren van data uit verschillende bronnen zoals HR, financiën, verkoop, marketing, operations, inkoop, service, risicoanalyse, inventaris, IT en inkoop.
* **Beslissingsondersteuning:** Dit resulteert in een "Corporate War Room" of "Decision Cockpit", waar managers data-gedreven beslissingen kunnen nemen.
* **Noodzaak voor elk bedrijf:** Zelfs kleine bedrijven hebben baat bij een vorm van BI om beslissingen te onderbouwen.
### 2.3 Big Data
Big Data kenmerkt zich door de '3 V's':
* **Volume:** Enorme hoeveelheden data. Dagelijks wordt wereldwijd ongeveer 402,74 miljoen terabytes aan data gecreëerd, met een schatting van 181 zettabytes in 2025.
* **Velocity:** De snelheid waarmee data wordt gecreëerd en verwerkt.
* **Variety:** De diversiteit aan datatypes, waaronder gestructureerde data (in tabellen) en ongestructureerde data (zoals sensor data, social media posts, weersvoorspellingen).
Big data bestaat uit een verzameling van ongestructureerde en soms onvolledige data, zo groot dat conventionele databasesystemen deze niet efficiënt kunnen verwerken.
### 2.4 AI, Machine Learning en Deep Learning
De doorbraak van AI is te danken aan slimme algoritmen, rekenkracht en grote hoeveelheden data.
* **Neurale netwerken:** Simuleren de werking van het menselijk brein met 'neuronen' die informatie verwerken en tot conclusies komen.
* **Machine learning:** Systemen die leren van data en hun prestaties verbeteren naarmate ze meer data ontvangen.
* **Supervised learning:** Het algoritme wordt getraind met gelabelde voorbeelden (input-output paren). Een feedbackloop manipuleert de parameters van het algoritme om betere voorspellingen te doen.
* **Deep learning:** Neurale netwerken met meerdere lagen, waarbij latere lagen voortbouwen op de resultaten van eerdere lagen, wat leidt tot complexe structuren die soms moeilijk menselijk te begrijpen zijn.
## 3. Bedrijfsprocessen en KPI's: Een diepere duik
De cursus behandelt KPI's voor verschillende bedrijfsprocessen:
### 3.1 Marketing & Sales
* **Marketing Funnel:** Leidt tot het genereren van leads en het converteren ervan.
* **Cost per Click (CPC):** De kosten per klik op een advertentie (bv. 0,75 dollars).
* **Click-Through Rate (CTR):** Het percentage mensen dat op een link klikt nadat ze een e-mail hebben geopend (bv. 5,8 procent).
$$ \text{CTR} = \frac{\text{Aantal klikken}}{\text{Aantal geopende e-mails}} \times 100\% $$
* **Conversion Rate:** Het percentage websitebezoekers dat een gewenste actie uitvoert (bv. een product kopen, 4,6 procent).
$$ \text{Conversion Rate} = \frac{\text{Aantal conversies}}{\text{Aantal websitebezoekers}} \times 100\% $$
* **Return on Ads Spend (ROAS):** De omzet gegenereerd uit advertenties gedeeld door de advertentiekosten (bv. 4,83). Een ROAS > 1 is positief.
$$ \text{ROAS} = \frac{\text{Extra omzet dankzij campagne}}{\text{Campagnekosten}} $$
* **Customer Acquisition Cost (CAC):** De totale kosten van sales en marketing gedeeld door het aantal nieuwe klanten. Bijvoorbeeld, 475 dollars per klant.
$$ \text{CAC} = \frac{\text{Totale kosten sales en marketing}}{\text{Aantal nieuwe klanten}} $$
* **Customer Lifetime Value (CLV):** De totale waarde die een klant vertegenwoordigt gedurende de gehele relatie met het bedrijf.
$$ \text{CLV} = \text{Gemiddelde klantwaarde} \times \text{Gemiddelde klantlevensduur} $$
Het is cruciaal dat CLV hoger is dan CAC ($ \text{CLV} / \text{CAC} > 1 $).
### 3.2 Operations
* **Belangrijke KPI's:**
* **Productivity:** Output gedeeld door Input (bv. 1,25 platen per uur).
$$ \text{Productivity} = \frac{\text{Output}}{\text{Input}} $$
* **Throughput:** De hoeveelheid geproduceerde eenheden per tijdseenheid (bv. 169 onderdelen per uur).
* **Manufacturing cost per unit:** Totale productiekosten per eenheid.
* **Overall Equipment Effectiveness (OEE):** Een maatstaf voor de prestatie van productieapparatuur, die beschikbaarheid, prestatie en kwaliteit combineert.
$$ \text{OEE} = \text{Beschikbaarheid} \times \text{Prestatie} \times \text{Kwaliteit} $$
Een OEE van 83,3 procent wordt als zeer goed beschouwd.
### 3.3 Financiën
* **Working Capital:** Het verschil tussen de kortetermijnactiva en kortetermijnpassiva van een bedrijf. Moet positief zijn.
$$ \text{Working Capital} = \text{Vlottende Activa} - \text{Kortlopende Schulden} $$
* **Current Ratio:** Vlottende activa gedeeld door kortlopende schulden (bv. 3,27).
$$ \text{Current Ratio} = \frac{\text{Vlottende Activa}}{\text{Kortlopende Schulden}} $$
* **Quick Ratio:** De current ratio exclusief voorraden (bv. 2,16).
$$ \text{Quick Ratio} = \frac{\text{Vlottende Activa} - \text{Voorraden}}{\text{Kortlopende Schulden}} $$
* **Debt Ratio:** Totale schulden gedeeld door totale activa (bv. 67 procent).
$$ \text{Debt Ratio} = \frac{\text{Totale Schulden}}{\text{Totale Activa}} \times 100\% $$
* **Gross Profit Margin:** Bruto winst gedeeld door omzet (bv. 48,25 procent).
$$ \text{Gross Profit Margin} = \frac{\text{Bruto Winst}}{\text{Omzet}} \times 100\% $$
* **Net Profit Margin:** Netto winst gedeeld door omzet (bv. 32,5 procent).
$$ \text{Net Profit Margin} = \frac{\text{Netto Winst}}{\text{Omzet}} \times 100\% $$
* **Return on Equity (ROE):** Winst gedeeld door eigen vermogen (bv. 10 procent).
$$ \text{ROE} = \frac{\text{Winst}}{\text{Eigen Vermogen}} \times 100\% $$
* **Return on Capital:** Winst gedeeld door het totale geïnvesteerde kapitaal (eigen vermogen + schulden) (bv. 3,3 procent).
$$ \text{Return on Capital} = \frac{\text{Winst}}{\text{Totale Kapitaal}} \times 100\% $$
### 3.4 Human Resources (HR)
* **Employee Turnover Rate:** Het percentage medewerkers dat een bedrijf verlaat gedurende een bepaalde periode (bv. 19,42 procent).
$$ \text{Employee Turnover Rate} = \frac{\text{Aantal vertrokken medewerkers}}{\text{Gemiddeld aantal medewerkers}} \times 100\% $$
* **Time to Hire:** De gemiddelde tijd die nodig is om een vacature te vervullen (bv. 32 dagen).
* **Cost to Hire:** De gemiddelde kosten per ingevulde vacature (bv. 2.800 dollars).
* **Employee Productivity:** Output per werknemer of per gewerkt uur (bv. 53 dollars per uur).
### 3.5 Inkoop & Logistiek
* **Cost Savings:** Gerealiseerde besparingen door onderhandelingen of procesverbeteringen (bv. een besparing van 8 procent).
* **Supplier Lead Time:** De gemiddelde levertijd van een leverancier (bv. 1,8 dagen).
* **On-time Delivery Rate (OTD):** Het percentage leveringen dat op tijd wordt geleverd (bv. 80 procent).
$$ \text{OTD} = \frac{\text{Aantal tijdige leveringen}}{\text{Totaal aantal leveringen}} \times 100\% $$
* **Purchase Cycle Time:** De gemiddelde tijd van bestellen tot ontvangen van materialen (bv. 13 dagen).
* **Inventory Turnover:** De mate waarin voorraad wordt verkocht en vervangen (bv. 4 keer per jaar). Een hogere turnover is meestal wenselijk.
$$ \text{Inventory Turnover} = \frac{\text{Kostprijs verkopen (COGS)}}{\text{Gemiddelde Voorraadwaarde}} $$
* **Backorder Rate:** Het percentage orders dat niet direct kan worden vervuld (bv. 5 procent).
$$ \text{Backorder Rate} = \frac{\text{Aantal backorders}}{\text{Totaal aantal orders}} \times 100\% $$
## 4. Data-gedreven organisaties, bedrijfssoftware en ERP
### 4.1 Enterprise Resource Planning (ERP)
ERP-systemen integreren alle bedrijfsprocessen en data in één centrale database.
* **Voordelen:**
* **Datacentralisatie:** Gegevens worden slechts één keer ingevoerd, wat fouten en duplicaten vermindert.
* **Procesintegratie:** Koppeling van verschillende processen (bv. verkooporder naar productieorder).
* **Stroomlijning van processen:** Efficiëntere bedrijfsvoering.
* **Verbeterde rapportage:** Makkelijker om rapportages te creëren vanuit één databron.
* **"Single source of truth":** Eén betrouwbare bron voor alle bedrijfsdata.
#### 4.1.1 Overwegingen bij ERP-implementatie
* **Niet voor alle bedrijven:** De noodzaak hangt af van de grootte, marktsector en complexiteit van het bedrijf.
* **Kosten en tijd:** Implementatie kan kostbaar en tijdrovend zijn.
* **Overbodige functionaliteit:** Risico op het aanschaffen van een systeem met meer functies dan nodig.
* **Alternatieven:** Voor kleinere bedrijven kan een integratie van verschillende gespecialiseerde tools volstaan.
### 4.2 Business Tools en ERP-integratie
* **Integratie met externe tools:** ERP-systemen kunnen worden geïntegreerd met andere bedrijfssoftware (bijvoorbeeld CRM, WMS, BI-tools, webshops) via API's (Application Programming Interfaces).
* **Cloud-gebaseerde software:** Veel moderne software draait in de cloud en maakt integratie via API's mogelijk.
* **Custom development:** Soms is maatwerk op het ERP-systeem of integraties met andere software nodig.
* **Ontwikkelen van eigen ERP:** Dit is zelden een goede strategie ("Don't reinvent the wheel!") vanwege de enorme kosten, tijd en risico's.
### 4.3 ERP en Business Intelligence
* **Geïntegreerde dashboards:** BI-dashboards kunnen geïntegreerd zijn in het ERP-systeem of worden gebouwd met externe BI-tools die data uit het ERP halen.
* **Flexibele rapportage:** Zowel vaste rapporten als dynamische, op maat gemaakte rapporten (soms met AI-ondersteuning) zijn mogelijk.
## 5. Data-gedreven besluitvormingstechnieken
Het data-analyseproces omvat de volgende stappen:
### 5.1 Het data-analyseproces
1. **Definieer het probleem:** Stel duidelijke objectieven en verwachte uitkomsten vast, gebaseerd op de context en behoeften van eindgebruikers (bv. een financieel dashboard maken om inkomsten en uitgaven te volgen).
2. **Verzamel de data:** Haal data uit interne databases, gebruik bestaande connectoren, API's, web scraping, Excel-sheets of publieke datasets.
3. **Pre-processing:** Reinig de data door te zoeken naar ontbrekende waarden, duplicaten te verwijderen, formaten te standaardiseren en categorische variabelen om te zetten naar numerieke waarden. Dit kan tot 80% van de tijd in beslag nemen.
4. **Analyseer de data:** Identificeer patronen, trends en relaties. Technieken variëren van beschrijvende statistieken (gemiddelde, mediaan, variantie) tot meer geavanceerde methoden zoals correlatiestudies, regressie, clustering en classificatie.
* **Beschrijvende statistieken:**
* **Mean (gemiddelde):** De som van waarden gedeeld door het aantal waarden.
* **Median (mediaan):** De middelste waarde in een gesorteerde reeks.
* **Variance:** Een maat voor de spreiding van de waarden rond het gemiddelde.
* **Correlaties, trends en uitschieters (outliers):** Het onderzoeken van relaties tussen variabelen, de richting van de data en extreme waarden.
* **Regressie:** Modelleren van de relatie tussen een afhankelijke variabele en één of meer onafhankelijke variabelen om voorspellingen te doen (bv. de relatie tussen advertentie-uitgaven en verkoopomzet).
* **Clustering:** Groeperen van datapunten op basis van gelijkenis, om segmenten te identificeren (bv. klantsegmenten).
* **Classificatie:** Toewijzen van datapunten aan vooraf gedefinieerde categorieën (bv. voorspellen of een klant zal wanbetalen).
5. **Visualiseer de data:** Gebruik grafieken en dashboards om inzichten op een begrijpelijke manier over te brengen. "Een beeld zegt meer dan duizend woorden."
6. **Interpreteer en communiceer de resultaten:** Formuleer conclusies en aanbevelingen op een duidelijke, zakelijke manier. Vermijd misleidende visualisaties en gebruik de juiste taal om de impact van de bevindingen te duiden. Vertalen van technische uitspraken naar zakelijke taal is essentieel (bv. "Dit suggereert..." in plaats van "De R² is 0.87").
### 5.2 Databanken en DBMS
* **Database (DB):** Een verzameling gerelateerde data.
* **Database Management System (DBMS):** Softwarelaag tussen de database en de gebruikers.
* **RDBMS (Relational Database Management Systems):** Data wordt opgeslagen in tabellen met rijen en kolommen. Gebruikt SQL (Structured Query Language) voor data-manipulatie.
* **Primary Key:** Unieke identificatie voor elke rij.
* **Foreign Key:** Verwijst naar de primary key van een andere tabel om relaties te leggen.
* **NoSQL Databases Management Systems:** Ontworpen voor grote hoeveelheden ongestructureerde data, vaak gebruikt in Big Data-toepassingen. Document stores (met JSON-formaat) zijn een type NoSQL database dat flexibel is in het opslaan van complexe datastructuren.
Het correct toepassen van data-gedreven management technieken, ondersteund door de juiste tools en processen, is cruciaal voor succes in de moderne bedrijfswereld.
---
# Zakelijke processen en key performance indicators (KPI's)
Dit document biedt een overzicht van zakelijke processen en de bijbehorende Key Performance Indicators (KPI's) binnen verschillende afdelingen van een organisatie, met de nadruk op hoe data gebruikt kan worden voor geïnformeerde besluitvorming.
## 2. Zakelijke processen en key performance indicators (KPI's)
### 2.1 Data-gedreven management: van data naar inzicht en actie
Data-gedreven management draait om het nemen van geïnformeerde beslissingen op basis van data. Dit omvat het gebruik van tools zoals ERP-systemen, Business Intelligence (BI), SQL, NoSQL, AI en Big Data-technologieën.
#### 2.1.1 De rol van Business Intelligence (BI)
Business Intelligence is het proces van het verzamelen, analyseren en interpreteren van data om inzichten te verkrijgen en actie te ondernemen. Dit proces transformeert ruwe data naar informatie, vervolgens naar kennis en uiteindelijk naar bruikbare acties. Een BI-systeem helpt bij het visualiseren van data, bijvoorbeeld via dashboards en 'decision cockpits', om besluitvormers te ondersteunen.
#### 2.1.2 Big Data
Big Data verwijst naar grote hoeveelheden ongestructureerde of semi-gestructureerde data die met conventionele databasesystemen moeilijk te verwerken zijn. De belangrijkste kenmerken van Big Data worden beschreven door de "3 V's":
* **Volume:** Enorme hoeveelheden data.
* **Velocity:** De snelheid waarmee data wordt gegenereerd en verwerkt.
* **Variety:** De diversiteit aan databronnen en -formaten (gestructureerd, ongestructureerd, semi-gestructureerd).
#### 2.1.3 Kunstmatige Intelligentie (AI), Machine Learning en Deep Learning
AI-systemen maken gebruik van slimme algoritmen, rekenkracht en grote hoeveelheden data. Machine learning is een subset van AI waarbij systemen leren van data zonder expliciet geprogrammeerd te zijn. Deep learning, een verder ontwikkelde vorm van machine learning, maakt gebruik van neurale netwerken met meerdere lagen die complexe patronen kunnen herkennen, vaak voorbij menselijke interpreteerbaarheid.
#### 2.1.4 Data-analyseproces
Het data-analyseproces omvat de volgende stappen:
1. **Probleemdefinitie:** Het vaststellen van duidelijke doelstellingen en verwachte uitkomsten.
2. **Dataverzameling:** Het ophalen van data uit diverse bronnen zoals databases, API's, web scraping, of open datasets.
3. **Data-voorbereiding (Pre-processing):** Het opschonen van data, zoals het behandelen van ontbrekende waarden, verwijderen van duplicaten, standaardiseren van formaten en het omzetten van categorische data naar numerieke data. Dit kan tot 80% van de totale analyse-tijd in beslag nemen.
4. **Data-analyse:** Het identificeren van patronen, trends en relaties met behulp van technieken zoals basisstatistieken (gemiddelde, mediaan, variantie), correlaties, regressie, clustering en classificatie.
5. **Data-visualisatie:** Het presenteren van de geanalyseerde data in een begrijpelijke grafische vorm (dashboards, grafieken).
6. **Interpretatie en communicatie:** Het vertalen van technische bevindingen naar bedrijfstaal en het helder communiceren van de resultaten aan belanghebbenden, waarbij misleiding wordt vermeden.
### 2.2 Zakelijke processen en bijbehorende KPI's
Dit gedeelte belicht de belangrijkste KPI's per bedrijfsproces.
#### 2.2.1 Marketing & Sales
* **Marketing KPI's:**
* **Cost per Click (CPC):** De kosten per klik op een advertentie.
`$CPC = \frac{\text{Totale advertentiekosten}}{\text{Aantal klikken}}`
* **Click-Through Rate (CTR):** Het percentage ontvangers van een e-mail dat op een link klikt.
`$CTR = \frac{\text{Aantal klikken op de link}}{\text{Aantal geopende e-mails}} \times 100\%$`
* **Conversiepercentage:** Het percentage websitebezoekers dat de gewenste actie onderneemt.
`$Conversiepercentage = \frac{\text{Aantal voltooide acties}}{\text{Totaal aantal bezoekers}} \times 100\%$`
* **Return on Advertising Spend (ROAS):** De omzet gegenereerd per euro uitgegeven aan reclame.
`$ROAS = \frac{\text{Extra omzet door campagne}}{\text{Campagnekosten}}`
Een ROAS groter dan 1 is gewenst.
* **Sales KPI's:**
* **Customer Acquisition Cost (CAC):** De totale kosten voor sales en marketing gedeeld door het aantal nieuwe klanten.
`$CAC = \frac{\text{Totale kosten sales en marketing}}{\text{Aantal nieuwe klanten}}`
**Voorbeeld:** Totale marketingkosten = 178.560 dollars, totale salariskosten = 68.530 dollars, aantal nieuwe klanten = 520.
`$CAC = \frac{178.560 \text{ dollars} + 68.530 \text{ dollars}}{520} = 475,17 \text{ dollars}`
* **Customer Lifetime Value (CLV):** De totale waarde die een klant gedurende de gehele relatie met het bedrijf genereert.
* *Gemiddelde aankoopwaarde:* Totale omzet klanten over een periode / aantal aankopen.
* *Gemiddelde aankoopfrequentie:* Aantal aankopen / aantal unieke klanten die een transactie doen.
* *Gemiddelde klantwaarde:* Gemiddelde aankoopwaarde x Gemiddelde aankoopfrequentie.
* *Gemiddelde klantlevensduur:* Gemiddelde duur van de klantrelatie.
`$CLV = \text{Gemiddelde klantwaarde} \times \text{Gemiddelde klantlevensduur}`
**Voorbeeld:** Gemiddelde klantwaarde = 127 dollars, gemiddelde klantlevensduur = 7,6 jaar.
`$CLV = 127 \text{ dollars} \times 7,6 \text{ jaar} = 965,2 \text{ dollars}`
* **CAC vs. CLV:** Het is cruciaal dat de CLV hoger is dan de CAC.
`$\frac{CLV}{CAC} > 1$`
**Voorbeeld:** CLV = 965 dollars, CAC = 475 dollars.
`$\frac{965 \text{ dollars}}{475 \text{ dollars}} = 2,03 > 1$`
#### 2.2.2 Operations
* **Productiviteit:** De verhouding tussen output en input.
`$Productiviteit = \frac{\text{Output}}{\text{Input}}`
**Voorbeeld Arbeidsproductiviteit:**
Ierland: BIP = 630 miljard dollars, totale gewerkte uren = 4,5 miljard uur.
Arbeidsproductiviteit Ierland = 630 miljard dollars / 4,5 miljard uur = 140 dollars per uur.
Mexico: BIP = 1.800 miljard dollars, totale gewerkte uren = 40 miljard uur.
Arbeidsproductiviteit Mexico = 1.800 miljard dollars / 40 miljard uur = 45 dollars per uur.
* **Doorvoersnelheid (Throughput):** De hoeveelheid geproduceerde eenheden per tijdseenheid.
`$Doorvoersnelheid = \frac{\text{Totale output}}{\text{Effectieve productietijd}}`
**Voorbeeld:** 9.550 onderdelen geproduceerd in 56,5 effectieve uren.
Doorvoersnelheid = 9.550 onderdelen / 56,5 uur = 169 onderdelen per uur.
* **Productiekosten per eenheid:** De totale kosten voor productie gedeeld door het aantal geproduceerde eenheden.
`$Productiekosten per eenheid = \frac{\text{Totale productiekosten}}{\text{Aantal geproduceerde eenheden}}`
* **Overall Equipment Effectiveness (OEE):** Een maat voor de prestaties van productiemachines, rekening houdend met beschikbaarheid, prestaties en kwaliteit.
* *Beschikbaarheid:* De verhouding tussen de daadwerkelijke productietijd en de geplande productietijd.
`$\text{Beschikbaarheid} = \frac{\text{Geplande productietijd} - \text{Uitvaltijd}}{\text{Geplande productietijd}}`
* *Prestatie:* De verhouding tussen de daadwerkelijke output en de verwachte output in de effectieve productietijd.
`$\text{Prestatie} = \frac{\text{Werkelijke output}}{\text{Verwachte output (in effectieve tijd)}}`
* *Kwaliteit:* De verhouding tussen het aantal goede eenheden en het totale aantal geproduceerde eenheden.
`$\text{Kwaliteit} = \frac{\text{Aantal goede eenheden}}{\text{Totaal aantal geproduceerde eenheden}}`
`$OEE = \text{Beschikbaarheid} \times \text{Prestatie} \times \text{Kwaliteit}`
**Voorbeeld:** Beschikbaarheid = 91,7%, Prestatie = 95,5%, Kwaliteit = 95,2%.
OEE = 0,917 x 0,955 x 0,952 = 0,833 of 83,3%.
#### 2.2.3 Inkoop & Logistiek
* **Kostenbesparingen (Inkoop):** Het verschil in inkoopprijs per eenheid of per artikel over periodes.
`$\text{Kostenbesparing} = \frac{\text{Nieuwe prijs per eenheid} - \text{Oude prijs per eenheid}}{\text{Oude prijs per eenheid}} \times 100\%$`
**Voorbeeld:** Inkoopkosten per artikel 2022 = 151,79 dollars, inkoopkosten per artikel 2023 = 140,15 dollars.
Kostenbesparing = (140,15 - 151,79) / 151,79 = -7,7% (dit is een besparing van 8% op de oorspronkelijke kosten).
* **Levertijd van de leverancier (Supplier Lead Time):** De gemiddelde tijd die een leverancier nodig heeft om een bestelling te leveren.
`$\text{Gemiddelde levertijd leverancier} = \frac{\text{Som van alle levertijden}}{\text{Aantal leveringen}}`
**Voorbeeld Rexel:** (2+3+1+1+2) / 5 = 1,8 dagen.
**Voorbeeld Cebeo:** (2+3+1+3+2+2+2+3) / 7 = 2,6 dagen.
* **Levering op tijd (On-Time Delivery - OTD):** Het percentage leveringen dat binnen de afgesproken termijn wordt geleverd.
`$OTD = \frac{\text{Aantal op tijd geleverde orders}}{\text{Totaal aantal geleverde orders}} \times 100\%$`
* **Factuurgeschillenpercentage (Invoice Dispute Rate):** Het percentage facturen dat wordt betwist.
* **Leveranciersdefectpercentage (Supplier Defect Rate):** Het percentage geleverde goederen dat defect is.
* **Inkoopprocescyclus (Purchase Cycle Time):** De gemiddelde tijd van het plaatsen van een bestelling tot de ontvangst van de goederen.
`$\text{Inkoopprocescyclus} = \text{Datum ontvangst} - \text{Datum bestelling}`
* **Voorraadomzet (Inventory Turnover):** Hoe vaak de voorraad gedurende een periode wordt verkocht en vervangen. Een hogere omzet is meestal gunstiger.
`$\text{Voorraadomzet} = \frac{\text{Omzet van goederen (COGS)}}{\text{Gemiddelde voorraad}}`
**Voorbeeld:** COGS = 500.000 dollars, Gemiddelde voorraad = (Beginvoorraad + Eindvoorraad) / 2 = (100.000 + 150.000) / 2 = 125.000 dollars.
Voorraadomzet = 500.000 dollars / 125.000 dollars = 4.
* **Backorderpercentage:** Het percentage orders dat niet direct uit voorraad kan worden geleverd.
`$\text{Backorderpercentage} = \frac{\text{Aantal backorders}}{\text{Totaal aantal orders}} \times 100\%$`
**Voorbeeld:** Backorders = 25, Totaal aantal orders = 500.
Backorderpercentage = 25 / 500 x 100% = 5%.
#### 2.2.4 Financiën
* **Werkkapitaal:** Het verschil tussen vlottende activa en kortlopende schulden. Een positief werkkapitaal is wenselijk voor de financiële gezondheid op korte termijn.
`$\text{Werkkapitaal} = \text{Vlottende activa} - \text{Kortlopende schulden}`
**Voorbeeld:** Vlottende activa = 35.000 (cash) + 16.300 (debiteuren) + 26.500 (voorraden) = 77.800 dollars.
Kortlopende schulden = 12.780 (crediteuren) + 11.000 (kortlopende leningen) = 23.780 dollars.
Werkkapitaal = 77.800 dollars - 23.780 dollars = 54.020 dollars.
* **Current Ratio (Liquiditeit in de eerste graad):** De verhouding tussen vlottende activa en kortlopende schulden.
`$\text{Current Ratio} = \frac{\text{Vlottende activa}}{\text{Kortlopende schulden}}`
**Voorbeeld:** 77.800 dollars / 23.780 dollars = 3,27.
* **Quick Ratio (Liquiditeit in de tweede graad):** Vergelijkbaar met de Current Ratio, maar exclusief voorraden.
`$\text{Quick Ratio} = \frac{\text{Vlottende activa} - \text{Voorraden}}{\text{Kortlopende schulden}}`
**Voorbeeld:** (77.800 dollars - 26.500 dollars) / 23.780 dollars = 51.300 dollars / 23.780 dollars = 2,16.
* **Schuldgraad (Debt Ratio):** Het percentage van de totale activa dat gefinancierd is met schulden.
`$\text{Schuldgraad} = \frac{\text{Totale schulden}}{\text{Totale activa}} \times 100\%$`
**Voorbeeld:** Totale schulden = 800.000 dollars, Totale activa = 1.200.000 dollars.
Schuldgraad = 800.000 dollars / 1.200.000 dollars x 100% = 66,67%.
* **Bruto- en Nettowinstmarge:**
* **Cost of Goods Sold (COGS):** De directe kosten van de verkochte goederen (materiaal en arbeid).
* **Brutowinst:** Omzet - COGS.
* **Brutowinstmarge:** Brutowinst / Omzet x 100%.
**Voorbeeld:** Omzet = 160.000 dollars, COGS (materiaal, arbeid, afschrijving machine) = 42.000 + 28.300 + 12.500 = 82.800 dollars.
Brutowinst = 160.000 - 82.800 = 77.200 dollars.
Brutowinstmarge = 77.200 dollars / 160.000 dollars x 100% = 48,25%.
* **Nettowinst:** Brutowinst - Bedrijfskosten (overhead, administratie, etc.).
* **Nettowinstmarge:** Nettowinst / Omzet x 100%.
**Voorbeeld:** Nettowinst = 77.200 dollars - 25.000 dollars (overhead) = 52.200 dollars.
Nettowinstmarge = 52.200 dollars / 160.000 dollars x 100% = 32,5%.
* **Rentabiliteit Eigen Vermogen (Return on Equity - ROE):** De winstgevendheid ten opzichte van het geïnvesteerde eigen vermogen.
`$ROE = \frac{\text{Winst}}{\text{Eigen vermogen}} \times 100\%$`
**Voorbeeld:** Winst = 40.000 dollars, Eigen vermogen = 400.000 dollars.
ROE = 40.000 dollars / 400.000 dollars x 100% = 10%.
* **Rentabiliteit Totaal Vermogen (Return on Capital - ROC):** De winstgevendheid ten opzichte van het totale geïnvesteerde vermogen (eigen vermogen + schulden).
`$ROC = \frac{\text{Winst}}{\text{Totaal geïnvesteerd vermogen}} \times 100\%$`
**Voorbeeld:** Winst = 40.000 dollars, Totaal geïnvesteerd vermogen = 1.200.000 dollars.
ROC = 40.000 dollars / 1.200.000 dollars x 100% = 3,33%.
#### 2.2.5 HR
* **Personeelsverloop (Employee Turnover Rate):** Het percentage werknemers dat het bedrijf verlaat in een bepaalde periode.
`$\text{Personeelsverloop} = \frac{\text{Aantal vertrokken werknemers}}{\text{Gemiddeld aantal werknemers}} \times 100\%$`
**Voorbeeld:** Gemiddeld aantal werknemers = (1050 + 1010) / 2 = 1030. Vertrokken werknemers = 200.
Personeelsverloop = 200 / 1030 x 100% = 19,42%.
* **Tijd tot aanstelling (Time to Hire):** De gemiddelde tijd die nodig is om een functie in te vullen.
* **Kosten per aanstelling (Cost to Hire):** De gemiddelde kosten die gemoeid zijn met het aannemen van een nieuwe werknemer.
* **Werknemerproductiviteit:** De output per werknemer of per gewerkt uur.
`$\text{Werknemerproductiviteit} = \frac{\text{Output}}{\text{Aantal werknemers}}` of `$\frac{\text{Output}}{\text{Totaal aantal gewerkte uren}}`
### 2.3 Zakelijke tools en ERP-systemen
* **Enterprise Resource Planning (ERP):** Een geïntegreerd softwaresysteem dat alle kernprocessen van een bedrijf beheert en data centraal opslaat in één database. Dit leidt tot efficiëntie, vermindering van fouten en betere rapportagemogelijkheden.
* **Voordelen ERP:**
* Data-invoer slechts één keer.
* Vermindering van fouten en duplicaten.
* Eenvoudigere proceskoppeling.
* Verbeterde rapportage en Business Intelligence.
* Centrale bron van waarheid.
* **Alternatieven voor ERP:** Voor sommige bedrijven kan een integratie van verschillende gespecialiseerde tools een betere oplossing zijn dan een complex ERP-systeem, vooral voor kleine en middelgrote ondernemingen.
* **API (Application Programming Interface):** Een interface die verschillende softwareapplicaties in staat stelt om met elkaar te communiceren en data uit te wisselen, vaak gebruikt voor cloudgebaseerde diensten.
### 2.4 Databases
* **Database (DB):** Een georganiseerde verzameling van gerelateerde data.
* **Database Management System (DBMS):** Software die dient als interface tussen de database en gebruikers.
* **Relational Database Management Systems (RDBMS):** Data wordt opgeslagen in tabellen met rijen en kolommen. SQL (Structured Query Language) is de standaardtaal voor het manipuleren van data in RDBMS. Primaire sleutels maken rijen uniek, terwijl vreemde sleutels relaties tussen tabellen leggen. Voorbeelden: MySQL, Oracle Database.
* **Non-relational Databases (NoSQL):** Ontworpen voor grote hoeveelheden ongestructureerde data, vaak gebruikt voor Big Data. Ze bieden meer flexibiliteit dan RDBMS. Documentdatabases (bijv. met JSON-formaat) zijn een voorbeeld, waarbij data flexibel in documenten wordt opgeslagen.
### 2.5 Data-gedreven besluitvormingstechnieken
Dit omvat het begrijpen van de data-analysecyclus, het effectief visualiseren van data en het communiceren van resultaten aan belanghebbenden, zodat beslissingen op feiten gebaseerd zijn.
> **Tip:** De effectiviteit van data-gedreven besluitvorming hangt sterk af van de kwaliteit van de data en de vaardigheid om de data correct te interpreteren en te communiceren.
---
Dit deel van de cursus introduceert de belangrijkste bedrijfsfuncties en hun bijbehorende Key Performance Indicators (KPI's) om prestaties te meten en te sturen.
### 2.1 Introductie tot data-gedreven management
Data-gedreven management draait om het nemen van geïnformeerde beslissingen op basis van data. Dit vereist het begrijpen van welke data wordt gegenereerd in verschillende bedrijfsprocessen, de rol van bedrijfssoftware zoals ERP-systemen, en hoe deze data kan worden omgezet in bruikbare inzichten door middel van Business Intelligence (BI) en KPI's.
#### 2.1.1 De rol van data in besluitvorming
Succesvolle managers nemen beslissingen op basis van data. Vragen als "Moeten we investeren in een nieuw magazijn?", "Waarom dalen de verkopen in Azië?" of "Wat is de gemiddelde marge op onze laatste tien projecten?" vereisen een data-gedreven benadering. Dit omvat het gebruik van tools zoals ERP, KPI's, Business Intelligence, SQL, NoSQL en AI.
#### 2.1.2 Business Intelligence (BI)
Business Intelligence transformeert ruwe data naar informatie, kennis en uiteindelijk naar actie. Het proces omvat:
1. **Ruwe data:** De onbewerkte gegevens.
2. **Informatie:** Gegevens met context en betekenis, bijvoorbeeld door labelling.
3. **Kennis:** Interpretatie van informatie met toevoeging van context, leidend tot inzichten.
4. **Actie:** Het nemen van beslissingen gebaseerd op de verworven kennis.
Een "corporate war room" of "decision cockpit" is een centrale plek waar managers toegang hebben tot dashboards en rapporten om data-gedreven beslissingen te nemen. BI is essentieel voor elk bedrijf, ongeacht de grootte, om geïnformeerde keuzes te maken.
#### 2.1.3 Big Data
Big Data kenmerkt zich door de "3 V's":
* **Variëteit:** Diverse soorten data, waaronder ongestructureerde data zoals sensor data, social media posts, etc.
Big Data wordt gedefinieerd als een set van ongestructureerde en soms incomplete data die zo groot is dat verwerking met conventionele databasesystemen niet mogelijk is.
#### 2.1.4 AI, Machine Learning en Deep Learning
AI-systemen vereisen slimme algoritmes, rekenkracht en veel data.
* **Neurale netwerken:** Simuleren de werking van het menselijk brein met lagen van verwerkende eenheden (neuronen).
* **Machine learning:** Systemen die leren van data zonder expliciet geprogrammeerd te zijn.
* **Supervised learning:** Het algoritme wordt getraind met gelabelde input-output paren en leert patronen te herkennen. Feedback wordt gebruikt om de parameters van het algoritme aan te passen en te verbeteren.
* **Deep learning:** Een subset van machine learning die gebruik maakt van neurale netwerken met meerdere lagen. Deze modellen kunnen zeer complex worden en soms moeilijk te interpreteren voor mensen.
### 2.2 Bedrijfsprocessen en gerelateerde KPI's
De cursus behandelt KPI's voor verschillende bedrijfsfuncties: Marketing & Sales, Operations, Inkoop & Logistiek, en Financiën.
**Marketing:**
* **Cost per Click (CPC):** De kosten die betaald worden voor elke klik op een advertentie.
`$CPC = \frac{\text{Totale advertentiekosten}}{\text{Aantal klikken}}$`
* **Click-through Rate (CTR):** Het percentage van ontvangers dat op een link in een e-mail klikt.
`$CTR = \frac{\text{Aantal klikken op link}}{\text{Aantal geopende e-mails}} \times 100\%$`
* **Conversion Rate:** Het percentage websitebezoekers dat de gewenste actie uitvoert (bv. een aankoop).
`$Conversion Rate = \frac{\text{Aantal conversies}}{\text{Totaal aantal bezoekers}} \times 100\%$`
* **Return on Ads Spend (ROAS):** De omzet gegenereerd uit advertenties ten opzichte van de advertentiekosten. Een ROAS groter dan 1 is winstgevend.
`$ROAS = \frac{\text{Extra omzet door campagne}}{\text{Campagnekosten}}$`
**Sales:**
* **Customer Acquisition Cost (CAC):** De totale kosten voor marketing en sales gedeeld door het aantal nieuwe klanten.
`$CAC = \frac{\text{Totale kosten verkoop en marketing}}{\text{Aantal nieuwe klanten verkregen}}$`
* **Customer Lifetime Value (CLV):** De totale verwachte winst uit een klant gedurende de gehele relatie.
* Gemiddelde klantwaarde = Gemiddelde aankoopwaarde $\times$ Gemiddelde aankoopfrequentie
* `$CLV = \text{Gemiddelde klantwaarde} \times \text{Gemiddelde klantlevensduur}$`
Het is cruciaal dat CLV hoger is dan CAC (`$CLV > CAC$`) voor winstgevendheid.
* **Productiviteit:** Output per input.
`$Productiviteit = \frac{\text{Output}}{\text{Input}}$`
* **Arbeidsproductiviteit:** Bruto Binnenlands Product (BBP) per gewerkt uur.
* **Throughput:** Het aantal geproduceerde eenheden per tijdseenheid.
`$Throughput = \frac{\text{Totaal aantal geproduceerde eenheden}}{\text{Effectieve productietijd}}$`
* **Manufacturing Cost per Unit:** De totale productiekosten per geproduceerd artikel.
`$Manufacturing Cost per Unit = \frac{\text{Totale productiekosten}}{\text{Totaal aantal geproduceerde eenheden}}$`
* **Overall Equipment Effectiveness (OEE):** Een maat voor hoe effectief productieapparatuur presteert, berekend als:
`$OEE = \text{Beschikbaarheid} \times \text{Prestatie} \times \text{Kwaliteit}$`
**Inkoop:**
* **Cost Savings:** Percentage reductie in inkoopkosten.
`$\text{Cost Savings} = \frac{\text{Nieuwe kosten per artikel} - \text{Oude kosten per artikel}}{\text{Oude kosten per artikel}} \times 100\%$`
* **Supplier Lead Time:** De gemiddelde tijd tussen het plaatsen van een bestelling en de levering.
* **On-time Delivery (OTD):** Het percentage leveringen dat op tijd wordt voltooid.
`$OTD = \frac{\text{Aantal op tijd geleverde bestellingen}}{\text{Totaal aantal bestellingen}} \times 100\%$`
* **Purchase Cycle Time:** De gemiddelde tijd die verstrijkt tussen het bestellen en ontvangen van goederen.
**Logistiek/Magazijn:**
* **Inventory Turnover:** Hoe vaak de voorraad gedurende een periode wordt verkocht en vervangen. Een hogere turnover is doorgaans wenselijk.
`$Inventory Turnover = \frac{\text{Kosten van verkochte goederen (COGS)}}{\text{Gemiddelde voorraadwaarde}}$`
* **Backorder Rate:** Het percentage orders dat niet direct kan worden geleverd en op een wachtlijst komt.
`$Backorder Rate = \frac{\text{Aantal backorders}}{\text{Totaal aantal orders}} \times 100\%$`
* **Working Capital:** Het verschil tussen vlottende activa en kortlopende schulden, geeft de financiële gezondheid op korte termijn aan. Een positieve waarde is wenselijk.
`$Working Capital = \text{Vlottende activa} - \text{Kortlopende schulden}$`
* **Current Ratio:** Een verhouding van vlottende activa tot kortlopende schulden.
`$Current Ratio = \frac{\text{Vlottende activa}}{\text{Kortlopende schulden}}$`
* **Quick Ratio (Acid-test ratio):** De current ratio exclusief voorraden.
`$Quick Ratio = \frac{\text{Vlottende activa} - \text{Voorraden}}{\text{Kortlopende schulden}}$`
* **Debt Ratio:** De mate van schuldfinanciering ten opzichte van de totale activa.
`$Debt Ratio = \frac{\text{Totale schulden}}{\text{Totale activa}} \times 100\%$`
* **Gross Profit Margin:** De winstmarge na aftrek van de directe productiekosten.
`$Gross Profit Margin = \frac{\text{Bruto winst}}{\text{Omzet}} \times 100\%$`
* **Net Profit Margin:** De winst na aftrek van alle kosten.
`$Net Profit Margin = \frac{\text{Netto winst}}{\text{Omzet}} \times 100\%$`
* **Return on Equity (ROE):** De winstgevendheid ten opzichte van het eigen vermogen.
* **Return on Capital (ROC):** De winstgevendheid ten opzichte van het totale geïnvesteerde kapitaal (eigen vermogen + schulden).
`$ROC = \frac{\text{Winst}}{\text{Totale geïnvesteerd kapitaal}} \times 100\%$`
#### 2.2.5 HR (Human Resources)
* **Employee Turnover Rate:** Het percentage medewerkers dat het bedrijf verlaat binnen een bepaalde periode.
`$Employee Turnover Rate = \frac{\text{Aantal vertrokken medewerkers}}{\text{Gemiddeld aantal medewerkers}} \times 100\%$`
* **Time to Hire:** De gemiddelde tijd die nodig is om een vacature in te vullen.
* **Cost to Hire:** De gemiddelde kosten die gemoeid zijn met het werven van een nieuwe medewerker.
* **Employee Productivity:** De output per medewerker of per gewerkt uur.
### 2.3 Data-gedreven besluitvormingstechnieken
Het data-analyseproces omvat meerdere stappen:
1. **Definieer het probleem:** Stel duidelijke doelstellingen en verwachte uitkomsten vast.
2. **Verzamel data:** Haal data uit interne databases, via API's, web scraping, etc.
3. **Pre-processing:** Opschonen van data door het verwijderen van duplicaten, het omgaan met ontbrekende waarden en het standaardiseren van formaten. Dit kan tot 80% van de tijd in beslag nemen.
4. **Analyseer data:** Identificeer patronen, trends en relaties met technieken zoals basisstatistieken (gemiddelde, mediaan, variantie), correlaties, regressie, clustering en classificatie.
5. **Visualiseer data:** Presenteer de bevindingen grafisch met behulp van dashboards en rapporten.
6. **Interpreteer en communiceer resultaten:** Vertaal technische bevindingen naar begrijpelijke bedrijfstaal, waarbij de juiste taal en nadruk worden gebruikt om conclusies te presenteren zonder te misleiden.
### 2.4 Databases en ERP-systemen
#### 2.4.1 Databases en DBMS
Een database (DB) is een verzameling gerelateerde gegevens. Een Database Management System (DBMS) is de softwarelaag die interactie met de database mogelijk maakt.
* **Relationele Database Management Systems (RDBMS):** Data wordt opgeslagen in tabellen met rijen en kolommen. Elke rij heeft een `Primary key` (unieke identificatie) en relaties tussen tabellen worden gelegd via `Foreign keys`. SQL (Structured Query Language) is de standaardtaal voor RDBMS.
* **Non-relational Databases (NoSQL):** Geschikt voor Big Data en ongestructureerde data. Ze bieden meer flexibiliteit dan traditionele tabellen en maken vaak gebruik van formats zoals JSON (JavaScript Object Notation).
#### 2.4.2 ERP-systemen
Enterprise Resource Planning (ERP) systemen integreren alle kernprocessen van een bedrijf in één software en database.
**Voordelen:**
* Voorkomt dubbele invoer van data, vermindert fouten.
* Maakt het koppelen van processen eenvoudiger (bv. verkooporder naar productieorder).
* Stroomlijnt bedrijfsprocessen.
* Verbetert de rapportage en Business Intelligence mogelijkheden.
* Centrale database ("single source of truth").
**Overwegingen:**
Niet elk bedrijf heeft een complex ERP-systeem nodig; een combinatie van geïntegreerde tools kan volstaan, vooral voor kleine en middelgrote ondernemingen (MKB). De implementatie van een ERP-systeem is kostbaar en tijdrovend.
**Integratie met BI:**
ERP-systemen kunnen ingebouwde BI-functies hebben of geïntegreerd worden met externe BI-tools via API's (Application Programming Interfaces).
#### 2.4.3 Data-analyse Proces
Het data-analyse proces omvat de stappen van probleemdefinitie tot communicatie van resultaten, waarbij aandacht wordt besteed aan dataverzameling, pre-processing, analyse, visualisatie en interpretatie. Goede visualisaties en duidelijke communicatie zijn cruciaal om de inzichten effectief over te brengen.
---
# Data-technologieën: Databases, Big Data en AI
Hieronder volgt een gedetailleerde samenvatting van het onderwerp "Data-technologieën: Databases, Big Data en AI", opgesteld voor studiedoeleinden, met aandacht voor diepgang en duidelijkheid.
## 3. Data-technologieën: databases, big data en AI
Dit onderwerp duikt in de fundamentele technologieën die de basis vormen van data-gedreven management, met inbegrip van verschillende soorten databases, de kenmerken van Big Data en de toepassingen van Kunstmatige Intelligentie.
### 3.1 Databases en databasemanagementsystemen (DBMS)
#### 3.1.1 Introductie tot databases
Een database (DB) is een verzameling van gerelateerde gegevens. Een database management system (DBMS) fungeert als een softwarelaag tussen de database en de gebruikers (personen of software). Deze systemen zijn essentieel voor het opslaan en ophalen van de gegevens die door applicaties worden gebruikt. Voorbeelden van databases zijn studenten-, personeels-, product- of reserveringsdatabases.
#### 3.1.2 Relationele databasesystemen (RDBMS)
Een RDBMS is gebaseerd op het relationele model, waarbij gegevens worden opgeslagen in tabellen (vergelijkbaar met spreadsheets) met rijen en kolommen.
* **Primaire sleutel (Primary key):** Een waarde die een rij uniek identificeert binnen een tabel.
* **Vreemde sleutel (Foreign key):** Een sleutel die verwijst naar de primaire sleutel van een gerelateerde tabel, waarmee verbanden tussen tabellen worden gelegd.
De standaardtaal voor het manipuleren van relationele databases is SQL (Structured Query Language).
**Voorbeeld van SQL-instructies:**
```sql
CREATE TABLE films (
filmid INT IDENTITY NOT NULL PRIMARY KEY,
title NVARCHAR(100) NOT NULL,
year INT,
score DECIMAL(2,1)
);
INSERT INTO films(title, year, score) VALUES ('The Da Vinci Code', 2006, 4.2);
UPDATE films SET score = 4.1 WHERE title = 'The Professor and the Madman';
SELECT city, COUNT(*) AS number
FROM employees
JOIN jobs ON employees.jobname = jobs.jobname
JOIN offices ON employees.officename = offices.officename
WHERE employees.salary > jobs.maximumsalary
GROUP BY city;
```
**Voorbeelden van relationele databasesystemen:**
* Microsoft SQL Server
* MySQL
* Oracle Database
* IBM DB2
In de praktijk wordt SQL-code meestal geschreven binnen de softwareapplicaties die interactie hebben met de database, in plaats van direct via het DBMS.
#### 3.1.3 Niet-relationele databasesystemen (NoSQL)
NoSQL ("Not Only SQL") is een verzamelterm voor databasesystemen die data opslaan op een niet-relationele manier. Ze zijn ontworpen om grote hoeveelheden ongestructureerde data snel en efficiënt op te slaan en te analyseren, wat cruciaal is in de context van Big Data.
* **Document-georiënteerde databases:** Een veelvoorkomend type NoSQL-database dat gebruikmaakt van formaten zoals JSON (JavaScript Object Notation). JSON biedt flexibiliteit doordat gegevensstructuren flexibel kunnen worden opgeslagen en alleen de benodigde ruimte wordt gebruikt.
**Voorbeeld van JSON-data:**
```json
{
"firstName": "John",
"lastName": "Smith",
"isAlive": true,
"age": 25,
"address": {
"streetAddress": "21 2nd Street",
"city": "New York",
"state": "NY",
"postalCode": "10021-3100"
},
"phoneNumbers": [
"type": "home",
"number": "212 555-1234"
"type": "office",
"number": "646 555-4567"
"type": "mobile",
"number": "123 456-7890"
}
],
"children": [],
"spouse": null
In een document-georiënteerde database kan een "collectie" worden vergeleken met een tabel in een RDBMS, en een "document" met een rij.
### 3.2 Big Data
Big Data verwijst naar datasets die zo groot, complex en snel veranderlijk zijn dat ze met traditionele dataverwerkingssystemen niet efficiënt kunnen worden beheerd of geanalyseerd. De drie kenmerkende V's van Big Data zijn:
* **Volume:** De enorme hoeveelheid data die wordt gegenereerd. De totale hoeveelheid data wereldwijd wordt geschat op honderden zettabytes en groeit exponentieel.
* **Velocity:** De snelheid waarmee data wordt gecreëerd en moet worden verwerkt. Dit omvat real-time data, zoals sensor- of social media-gegevens.
* **Variety:** De diverse soorten data, zowel gestructureerd (bv. in databases) als ongestructureerd (bv. tekst, afbeeldingen, video, sensor data, social media posts).
**Kenmerken van Big Data vergeleken met vroeger:**
* **Vroeger:** Netjes gestructureerde data in rijen en kolommen, opgeslagen op eenvoudige servers.
* **Nu:** Grote hoeveelheden data, met variëteit, zonder checks op volledigheid, en afwezigheid van een strikte orde. Dit resulteert in veel ongestructureerde data die conventionele databasesystemen niet aankunnen.
### 3.3 AI, Machine Learning en Deep Learning
Kunstmatige Intelligentie (AI) is een breed veld dat zich richt op het creëren van systemen die taken kunnen uitvoeren die normaal menselijke intelligentie vereisen. Machine Learning (ML) en Deep Learning (DL) zijn subdomeinen van AI.
#### 3.3.1 Essentiële componenten voor AI
Om een AI-systeem te bouwen, zijn drie hoofdelementen cruciaal:
1. **Slimme algoritmen:** Geavanceerde wiskundige modellen en procedures.
2. **Rekenkracht (Computing power):** Krachtige hardware om complexe berekeningen uit te voeren.
3. **Veel data:** Grote hoeveelheden data om de systemen te trainen en te laten leren.
#### 3.3.2 Neurale netwerken
Neurale netwerken zijn geïnspireerd op de structuur en werking van het menselijk brein, dat miljarden neuronen bevat. Ze simuleren de manier waarop biologische neuronen informatie verwerken en doorgeven.
* **Neuronfunctie:** Elk neuron ontvangt inputs, past er een formule op toe, en produceert een output. Dit proces is vergelijkbaar met het menselijk leervermogen, waarbij ervaringen en observaties leiden tot conclusies en reacties die mettertijd verbeteren.
#### 3.3.3 Machine Learning (ML)
Machine Learning stelt systemen in staat om te leren van data zonder expliciet geprogrammeerd te zijn.
* **Leren van data:** ML-algoritmen gebruiken data om modellen te ontwikkelen die voorspellingen kunnen doen of beslissingen kunnen nemen.
* **Supervised Learning:** Bij deze methode worden de algoritmen getraind met gelabelde data (input-output paren). Het systeem leert verbanden te leggen tussen inputs en de verwachte outputs. Feedback (verschil tussen voorspelde en werkelijke output) wordt gebruikt om de parameters van het algoritme aan te passen en de prestaties te verbeteren. Dit proces wordt herhaald met honderden of duizenden voorbeelden.
**Voorbeeld van ML voor het voorspellen van filmopbrengsten:**
Een model kan getraind worden met historische data zoals filmbudget, reclamebudget, populariteit van acteurs, en lanceringsdatum, om de verwachte opbrengst van een nieuwe film te voorspellen. De output van het model wordt vergeleken met de werkelijke opbrengst, en via een feedbacklus worden de algoritmes aangepast voor betere toekomstige voorspellingen.
#### 3.3.4 Deep Learning (DL)
Deep Learning is een subveld van Machine Learning dat gebruikmaakt van neurale netwerken met vele lagen (diepe neurale netwerken).
* **Gelaagde verwerking:** Elke laag in een diep neuraal netwerk bouwt voort op de resultaten van de voorgaande lagen. Dit creëert complexe, onderling verbonden formules en modellen die vaak moeilijk te interpreteren zijn voor mensen.
* **Complexiteit:** De vele lagen zorgen voor een geavanceerdere en gedetailleerdere patroonherkenning, wat leidt tot state-of-the-art prestaties in taken zoals beeld- en spraakherkenning.
### 3.4 Business Intelligence (BI) en Data-gedreven Besluitvorming
Business Intelligence (BI) is het proces van het verzamelen van gegevens tijdens het runnen van een bedrijf en het omzetten van die gegevens in informatie om kennis op te doen en passende actie te ondernemen.
#### 3.4.1 Van ruwe data naar actie
Het BI-proces omvat verschillende stappen:
1. **Ruwe data:** De oorspronkelijke, ongerepte gegevens.
2. **Informatie:** Gegevens met betekenis, label en context.
3. **Kennis:** Interpretatie van informatie en het begrijpen van relaties en trends.
4. **Actie:** Het nemen van geïnformeerde beslissingen op basis van de opgedane kennis.
#### 3.4.2 Het belang van BI
BI stelt organisaties in staat om:
* De juiste cijfers op het juiste moment en op de juiste manier te verkrijgen.
* Gegevens gemakkelijk interpreteerbaar te maken voor geïnformeerde besluitvorming.
* Dashboards en rapporten te creëren die inzicht geven in de bedrijfsprestaties.
#### 3.4.3 BI-tools
Er zijn diverse BI-tools op de markt die helpen bij het visualiseren en analyseren van data. Voorbeelden zijn Microsoft Power BI en Qlik. Vaak zijn deze functionaliteiten ook geïntegreerd in ERP-systemen.
#### 3.4.4 Corporate War Room / Decision Cockpit
In grote multinationals worden soms "corporate war rooms" of "decision cockpits" ingericht. Dit zijn ruimtes waar realtime dashboards en rapporten worden weergegeven, zodat besluitvormers direct inzicht hebben in de actuele bedrijfssituatie en snel kunnen reageren.
### 3.5 ERP-systemen
Enterprise Resource Planning (ERP) software integreert verschillende bedrijfsfuncties en data in één enkel systeem met één centrale database.
#### 3.5.1 Voordelen van ERP
* **Data-integratie:** Gegevens (klanten, leveranciers, artikelen) worden slechts één keer ingevoerd, wat tijd bespaart en de kans op fouten en duplicaten vermindert.
* **Procesintegratie:** Koppeling van verschillende bedrijfsprocessen, bijvoorbeeld van een verkooporder naar een productieorder.
* **Gestroomlijnde bedrijfsprocessen:** Verbetering van de efficiëntie en coördinatie van activiteiten.
* **Rapportagemogelijkheden:** Eenvoudiger creëren van rapporten en dashboards (Business Intelligence) vanuit de centrale database.
* **Single source of truth:** Alle data is op één plek beschikbaar, wat betrouwbaarheid en consistentie garandeert.
#### 3.5.2 Nadelen en alternatieven
Niet alle bedrijven hebben complexe ERP-software nodig. Voor kleinere en middelgrote bedrijven kan een combinatie van geïntegreerde, gespecialiseerde tools soms een betere oplossing zijn. Volledige ERP-implementaties zijn kostbaar, tijdrovend en kunnen leiden tot "overbuying" (te veel functies aanschaffen die niet gebruikt worden).
* **Alternatief:** Integratie van verschillende business tools (bv. CRM, boekhoudsoftware, projectmanagementtools) via API's (Application Programming Interfaces).
#### 3.5.3 ERP en Business Intelligence
ERP-systemen vormen vaak de kern voor Business Intelligence. Ze leveren de data die BI-tools gebruiken om dashboards en rapporten te genereren. Dit kan gebeuren via ingebouwde rapportagemogelijkheden in het ERP of via integratie met externe BI-tools.
### 3.6 Data-analyseproces
Een gestructureerd data-analyseproces is essentieel om van data tot bruikbare inzichten te komen:
1. **Definieer het probleem (Define the problem):** Stel duidelijke doelstellingen en verwachte resultaten vast.
* *Slecht voorbeeld:* "Laten we een financieel dashboard opzetten."
* *Goed voorbeeld:* "De financiële afdeling wil een duidelijk overzicht van de evolutie van inkomsten versus uitgaven op maandelijkse basis."
2. **Verzamel de data (Collecting the data):** Haal gegevens uit interne databases, externe bronnen, API's, web scraping, of datasets.
3. **Voorbereiding (Pre-processing):** Maak de data schoon en klaar voor analyse. Dit omvat:
* Verwijderen van duplicaten.
* Behandelen van ontbrekende waarden (invullen met gemiddelde/mediaan of negeren indien mogelijk).
* Standaardiseren van formaten.
* Converteren van categorische variabelen naar numerieke data.
* *Tip:* Dit kan tot wel 80% van de totale analysetijd in beslag nemen.
4. **Analyseer de data (Analyze data):** Onthul patronen, trends en relaties. Technieken omvatten:
* **Basisstatistieken:** Gemiddelde (mean), mediaan (median), variantie.
* **Correlaties, trends en uitschieters (outliers):** Onderzoeken van verbanden en afwijkingen.
* **Meer geavanceerde technieken:**
* **Regressie:** Voorspellen van een continue variabele op basis van andere variabelen (bv. sales per euro reclame).
* **Clustering:** Groeperen van datapunten met vergelijkbare kenmerken (bv. klantsegmentatie).
* **Classificatie:** Toewijzen van datapunten aan vooraf gedefinieerde categorieën (bv. voorspellen of een klant zal falen met een lening).
* *Tip:* Voor grootschalige datasets worden hier vaak machine learning-algoritmen voor gebruikt.
5. **Visualiseer de data (Visualize data):** Presenteer de inzichten op een begrijpelijke manier, vaak met grafieken en dashboards.
6. **Interpreteer en communiceer de resultaten (Interpreting & communicating the results):** Vertaal de technische bevindingen naar zakelijke taal, vermijd misleiding en begeleid de publieke interpretatie.
* *Voorbeelden van communicatieterminologie:* "Dit suggereert...", "Dit indiceert dat...", "De data impliceert dat...", "Dit zou kunnen betekenen dat...".
Het kiezen van de juiste visualisatie (grafiektype) is cruciaal voor effectieve communicatie.
### 3.7 Belangrijke KPI's per afdeling
Naast de algemene data-analyse en databases, zijn specifieke Key Performance Indicators (KPI's) van belang voor verschillende afdelingen:
#### 3.7.1 Marketing & Sales
* **Marketing:**
* Cost per Click (CPC): Kosten per klik op een advertentie.
* Click-through rate (CTR): Percentage kliks op een link ten opzichte van het aantal opens (bv. e-mails).
* Conversion rate: Percentage bezoekers dat een gewenste actie uitvoert (bv. aankoop).
* Return on Ads Spend (ROAS): Opbrengst gegenereerd uit advertentie-uitgaven.
* **Sales:**
* Totale verkoopcijfers.
* Customer Acquisition Cost (CAC): Kosten om een nieuwe klant te werven.
* Customer Lifetime Value (CLV): Totale winst die een klant gedurende de relatie met het bedrijf genereert.
* *Cruciaal principe:* CLV moet hoger zijn dan CAC ($CLV > CAC$, of $CLV/CAC > 1$).
#### 3.7.2 Operations
* **Productiviteit:** Output gedeeld door Input (bv. geproduceerde eenheden per uur).
* **Doorlooptijd (Throughput):** Hoeveel eenheden er per tijdseenheid worden geproduceerd of verwerkt.
* **Productiekosten per eenheid (Manufacturing cost per unit):** Som van grondstofkosten en werkcenterkosten per eenheid.
* **Overall Equipment Effectiveness (OEE):** Een maatstaf voor de prestatie van productiemachines, berekend als de product van Beschikbaarheid, Prestatie en Kwaliteit.
* $OEE = Beschikbaarheid \times Prestatie \times Kwaliteit$
#### 3.7.3 Purchase & Logistics
* **Kostenbesparingen (Cost savings):** De reductie in inkoopprijzen of kosten.
* **Leverancierslevertijd (Supplier lead time):** De gemiddelde tijd tussen het plaatsen van een bestelling en de levering.
* **Tijdige leveringsgraad (On-time delivery - OTD):** Percentage leveringen dat op tijd wordt voltooid.
* **Voorraadomzet (Inventory turnover):** Hoe vaak de voorraad in een bepaalde periode wordt verkocht en vervangen.
* $Voorraadomzet = Kosten van verkochte goederen (COGS) / Gemiddelde voorraad$
* **Backorder percentage (Backorder rate):** Percentage bestellingen dat niet direct kan worden uitgeleverd wegens voorraadtekort.
#### 3.7.4 Finance
* **Werkkapitaal (Working capital):** Het verschil tussen courante activa en courante passiva ($Courante activa - Courante passiva$).
* **Current ratio:** Verhouding tussen courante activa en courante passiva.
* $Current ratio = Courante activa / Courante passiva$
* **Quick ratio:** Verhouding tussen zeer liquide activa (exclusief voorraden) en courante passiva.
* $Quick ratio = (Courante activa - Voorraden) / Courante passiva$
* **Schuldratio (Debt ratio):** De totale schuld als percentage van de totale activa.
* $Schuldratio = Totale schuld / Totale activa \times 100\%$
* **Bruto en netto winstmarge (Gross and net profit margin):** Winst als percentage van de omzet.
* $Bruto winstmarge = Bruto winst / Omzet \times 100\%$
* $Netto winstmarge = Netto winst / Omzet \times 100\%$
* **Rendement op eigen vermogen (Return on equity - ROE):** Winst als percentage van het geïnvesteerde eigen vermogen.
* $ROE = Winst / Eigen vermogen \times 100\%$
* **Rendement op geïnvesteerd vermogen (Return on capital - ROC):** Winst als percentage van het totale geïnvesteerde vermogen (eigen vermogen + schulden).
* $ROC = Winst / Totaal geïnvesteerd vermogen \times 100\%$
#### 3.7.5 HR (Human Resources)
* **Personeelsverloop (Employee Turnover rate):** Het percentage werknemers dat een organisatie verlaat binnen een bepaalde periode.
* **Doorlooptijd aanwerving (Time to Hire):** De gemiddelde tijd die nodig is om een vacature in te vullen.
* **Kosten aanwerving (Cost to Hire):** De gemiddelde kosten die gepaard gaan met het werven van een nieuwe werknemer.
* **Ziekteverzuimpercentage (Absenteeism Rate):** Het percentage gemiste werkdagen door ziekte.
* **Werknemerstevredenheidsscore (Employee satisfaction score):** Een indicatie van de tevredenheid van werknemers.
* **Werknemersproductiviteit (Employee productivity):** Output (bv. financiële waarde) gedeeld door het aantal werknemers of gewerkte uren.
---
Dit onderwerp behandelt de fundamentele data-technologieën die essentieel zijn voor data-gedreven management, waaronder databases, de principes van Big Data en de toepassingen van Artificiële Intelligentie.
### 3.1 Databases
Een database (DB) is een georganiseerde verzameling van gerelateerde gegevens. Een database management system (DBMS) is de software die fungeert als tussenlaag tussen de gebruikers (personen of software) en de database zelf. Dit stelt gebruikers in staat om gegevens op te slaan, op te vragen en te beheren.
#### 3.1.1 Relationele databases (RDBMS)
Relationele databases zijn gebaseerd op het relationele model, waarbij gegevens worden opgeslagen in tabellen die bestaan uit rijen en kolommen, vergelijkbaar met spreadsheets.
* **Primaire sleutel (Primary key):** Een unieke identificator voor elke rij in een tabel.
* **Vreemde sleutel (Foreign key):** Een veld in een tabel dat verwijst naar de primaire sleutel van een andere tabel, om zo relaties tussen tabellen te leggen.
* **SQL (Structured Query Language):** De standaardtaal voor het manipuleren van relationele databases. Voorbeelden van SQL-instructies zijn `CREATE TABLE` voor het aanmaken van tabellen, `INSERT INTO` voor het toevoegen van gegevens, `UPDATE` voor het wijzigen van gegevens en `SELECT` voor het opvragen van gegevens.
Enkele voorbeelden van relationele databasesystemen zijn Microsoft SQL Server, MySQL, Oracle Database en IBM DB2. In de praktijk wordt SQL-code geschreven binnen softwareapplicaties die communiceren met het DBMS.
#### 3.1.2 Niet-relationele databases (NoSQL)
NoSQL (Not Only SQL) databasesystemen zijn ontworpen om grote hoeveelheden ongestructureerde data efficiënt op te slaan en te analyseren, wat een vereiste is voor Big Data.
* **Onderscheid met SQL:** NoSQL-databases gebruiken niet per se de relationele tabelstructuur. Ze bieden flexibelere modellen.
* **Documentopslag databases:** Een type NoSQL-database die gegevens opslaat in documenten, vaak in JSON-formaat. JSON (JavaScript Object Notation) is een flexibele notatie die complexe datastructuren in één item kan opslaan en alleen de benodigde ruimte gebruikt.
* Een 'collectie' in een documentdatabase kan vergeleken worden met een tabel.
* Een 'document' kan vergeleken worden met een rij in een tabel.
* **Flexibiliteit:** JSON-notatie biedt aanzienlijke flexibiliteit; als bepaalde gegevensvelden ontbreken, wordt er geen ruimte verspild, in tegenstelling tot tabellen waar lege cellen nog steeds opslagruimte innemen.
Big Data verwijst naar datasets die zo groot en complex zijn dat ze niet efficiënt kunnen worden verwerkt met conventionele databasebeheersystemen. De kenmerken van Big Data worden vaak samengevat in de '3 V's':
* **Volume:** De enorme hoeveelheid data die wordt gegenereerd. Dagelijks worden er honderden miljoenen terabytes aan data gecreëerd, met schattingen die aangeven dat het totale datavolume in 2025 181 zettabytes zal bereiken.
* **Velocity:** De snelheid waarmee data wordt gegenereerd en verwerkt. Dit kan in real-time gebeuren, zoals bij sensor- of sociale media data.
* **Variety:** De diversiteit aan datatypes. Dit omvat gestructureerde data (zoals in relationele databases), maar ook semi-gestructureerde en ongestructureerde data (zoals tekst, afbeeldingen, video, sensor data, social media posts).
**Definitie:** Big Data is een verzameling van (vaak) ongestructureerde en soms incomplete data die zo omvangrijk is dat traditionele databasesystemen niet meer toereikend zijn voor verwerking.
Artificiële Intelligentie (AI) is een breed veld gericht op het creëren van systemen die taken kunnen uitvoeren die normaal menselijke intelligentie vereisen. De doorbraak van AI is mede te danken aan drie essentiële componenten:
1. **Slimme algoritmen:** Geavanceerde methoden voor dataverwerking en patroonherkenning.
2. **Rekenkracht:** Moderne computers en hardware bieden de benodigde rekenkracht om complexe algoritmen uit te voeren.
3. **Veel data:** Grote hoeveelheden data zijn cruciaal voor het trainen van AI-systemen.
#### 3.3.1 Neurale Netwerken
Neurale netwerken zijn geïnspireerd op de structuur en werking van het menselijk brein, dat miljarden neuronen bevat. Een neuraal computernetwerk simuleert de functie van deze neuronen. Elk neuraal netwerk kan inputs verwerken en outputs genereren, vergelijkbaar met hoe de hersenen waarnemingen, sensaties en ervaringen omzetten in conclusies, emoties en acties.
#### 3.3.2 Machine Learning (ML)
Machine learning is een subset van AI die computers in staat stelt om te 'leren' van data zonder expliciet geprogrammeerd te worden.
* **Zelflerende systemen:** Machine learning-algoritmen kunnen hun prestaties geleidelijk verbeteren naarmate ze meer data verwerken.
* **Training:** Een ML-model wordt getraind door het te voeden met bekende voorbeelden van inputs en outputs. Dit proces wordt "supervised learning" genoemd.
* **Feedbackloop:** Naarmate het systeem meer data ontvangt, vergelijkt het de voorspelde output met de werkelijke output. Deze feedback wordt gebruikt om de parameters in het algoritme aan te passen en de nauwkeurigheid in de toekomst te verbeteren.
* **Modelopbouw:** Elk neuron in een neuraal netwerk bevat een formule die het systeem zelf ontwikkelt en verfijnt. Gezamenlijk vormen deze formules het model.
> **Tip:** Het trainen van een machine learning model vereist honderden tot duizenden voorbeelden om effectief te zijn.
#### 3.3.3 Deep Learning
Deep learning is een verdere ontwikkeling binnen machine learning, die gebruikmaakt van diepere neurale netwerken met meerdere lagen.
* **Gelaagde structuren:** In tegenstelling tot eenvoudigere neurale netwerken, stoppen deep learning modellen niet na één laag. Elke opeenvolgende laag bouwt voort op de resultaten van de vorige laag, wat resulteert in een complexe reeks onderling verbonden formules.
* **Complexiteit:** Deze gelaagde structuren kunnen vaak zo complex worden dat ze voor mensen moeilijk te doorgronden zijn.
> **Voorbeeld:** Een deep learning model kan worden getraind om patronen in beelden te herkennen, zoals het identificeren van objecten, gezichten of medische afwijkingen, door de hiërarchische representaties die in de verschillende lagen worden geleerd.
---
# Enterprise Resource Planning (ERP) systemen en business tools
Dit onderdeel bespreekt de rol van ERP-systemen en andere business tools in het stroomlijnen van bedrijfsprocessen en het centraliseren van data.
### 4.1 De rol van ERP-systemen
Enterprise Resource Planning (ERP) systemen zijn geïntegreerde softwareoplossingen die alle kernprocessen van een bedrijf beheren en automatiseren. Het principe achter een ERP-systeem is één enkele, centrale database die alle informatie bevat die nodig is voor verschillende afdelingen binnen een organisatie. Dit betekent dat gegevens over bijvoorbeeld klanten, leveranciers, artikelen en werknemers slechts één keer ingevoerd hoeven te worden, wat tijd bespaart en het risico op fouten en duplicaten minimaliseert.
#### 4.1.1 Voordelen van ERP-systemen
* **Gestroomlijnde bedrijfsprocessen:** ERP-systemen koppelen verschillende processen aan elkaar. Een verkooporder kan bijvoorbeeld automatisch worden omgezet in een productieorder, waarbij alle relevante informatie direct wordt overgedragen.
* **Centralisatie van data:** Alle data bevindt zich in één grote, geïntegreerde database. Dit vergemakkelijkt de creatie van rapporten en analyses (Business Intelligence).
* **Eén bron van waarheid:** Doordat alle informatie op één plek staat, ontstaat er één uniforme en betrouwbare bron van data. Dit is ook nuttig wanneer personeel het bedrijf verlaat, aangezien alle informatie behouden blijft.
* **Efficiëntie en foutreductie:** Het eenmalig invoeren van data vermindert de kans op fouten en de noodzaak tot het handmatig corrigeren van duplicaten.
* **Verbeterde rapportage en analyse:** De gecentraliseerde data maakt het eenvoudiger om rapporten te genereren en data-gedreven beslissingen te nemen.
#### 4.1.2 Nadelen en overwegingen bij ERP-implementatie
Niet alle bedrijven hebben een ERP-systeem nodig. De keuze hangt af van factoren zoals de grootte van het bedrijf en de specifieke marktsector waarin het opereert. Voor kleine en middelgrote bedrijven kan een combinatie van geïntegreerde, gespecialiseerde tools een betere oplossing zijn dan een complex ERP-systeem.
* **Kosten en implementatietijd:** De implementatie van een volledig ERP-systeem kan kostbaar en tijdrovend zijn.
* **Risico op 'overbuying':** Bedrijven kunnen een oplossing implementeren die verder gaat dan hun werkelijke behoeften, waardoor ze te veel betalen en veel functies ongebruikt blijven.
* **Complexiteit:** Voor kleinere organisaties kan een uitgebreid ERP-systeem te complex zijn.
* **Verandering is moeilijk:** Werknemers die gewend zijn aan bestaande software, kunnen weerstand bieden tegen de invoering van een nieuw, complex systeem. In dergelijke gevallen kan het beter zijn om bestaande, vertrouwde software te behouden en deze te integreren met add-on oplossingen.
#### 4.1.3 Alternatieven en integratie met andere tools
Een alternatief voor een volledig ERP-systeem is het integreren van verschillende gespecialiseerde business tools. Dit kan bestaan uit een website voor leadgeneratie, CRM-software voor klantrelatiebeheer, boekhoudsoftware voor facturatie en administratie, planningstools, en e-mailmarketingsoftware.
* **API's (Application Programming Interfaces):** Steeds meer software draait in de cloud en kan worden geïntegreerd via API's. Een API maakt het mogelijk voor verschillende softwaretoepassingen om met elkaar te communiceren en data uit te wisselen.
> **Voorbeeld:** Een API kan de klantnaam, projectnummer en aankoopprijs uit een ERP-systeem doorgeven aan een ander systeem voor projectbeheer.
* **De keuze van de juiste tool:** Het is cruciaal om de juiste software voor een specifiek proces te kiezen. Het gebruik van verkeerde software kan leiden tot inefficiënties en problemen. Er zijn duizenden business tools beschikbaar op de markt die gespecialiseerd zijn voor verschillende niches en bedrijfsformaten.
#### 4.1.4 Zelf ontwikkelen versus commerciële software
Het zelf ontwikkelen van een ERP-systeem wordt over het algemeen afgeraden. Dit proces is extreem tijdrovend, kostbaar en brengt aanzienlijke risico's met zich mee (het 'reinvent the wheel'-principe). Commerciële ERP-oplossingen en SaaS (Software as a Service) bieden vaak een meer kosteneffectieve en efficiënte oplossing.
### 4.2 De relatie tussen ERP en Business Intelligence (BI)
ERP-systemen vormen de ruggengraat voor data en Business Intelligence binnen een organisatie. Ze verzamelen en centraliseren alle transactiedata, zoals verkooptransacties, boekhoudkundige gegevens, projectplanningen en logistieke registraties. Dit vormt de basis voor het genereren van inzichten.
* **Geïntegreerde dashboards:** Veel ERP-systemen bieden geïntegreerde dashboards die standaardrapportages kunnen weergeven.
* **Externe BI-tools:** Voor complexere analyses en meer dynamische rapportages kunnen externe BI-tools worden geïntegreerd met het ERP-systeem. Deze tools kunnen gebruikmaken van de data uit het ERP om aangepaste dashboards en diepgaande analyses te creëren. Voorbeelden hiervan zijn Power BI, Qlik, en Google Looker Studio.
* **Data pipelines:** Dit zijn processen die data uit verschillende bronnen (waaronder ERP) verzamelen, transformeren en laden in een datawarehouse of analysedatabase, zodat deze beschikbaar is voor BI-doeleinden.
### 4.3 Belangrijke KPI's in relatie tot ERP en business tools
ERP-systemen en business tools faciliteren het meten en monitoren van Key Performance Indicators (KPI's) binnen verschillende bedrijfsprocessen.
#### 4.3.1 KPI's voor Marketing en Sales
* **Cost per Click (CPC):** De kosten die betaald worden per klik op een online advertentie. De prijs wordt bepaald door een veilingalgoritme.
* **Click-through Rate (CTR):** Het percentage van de ontvangers van een e-mail dat op een link klikt. Gecalkuleerd als: `(aantal klikken / aantal geopende e-mails) * 100%`.
* **Conversion Rate:** Het percentage websitebezoekers dat een gewenste actie onderneemt (bv. een product kopen). Gecalkuleerd als: `(aantal conversies / totaal aantal bezoekers) * 100%`.
* **Return on Ads Spend (ROAS):** De omzet gegenereerd door advertenties gedeeld door de kosten van die advertenties. Een ROAS groter dan 1 is positief. Gecalkuleerd als: `(extra omzet door campagne / kosten campagne)`.
* **Customer Acquisition Cost (CAC):** De totale kosten van verkoop en marketing gedeeld door het aantal nieuw verworven klanten.
* **Customer Lifetime Value (CLV):** De verwachte totale winst die een klant gedurende de gehele relatie met het bedrijf zal opleveren. Een belangrijke vuistregel is dat CLV > CAC moet zijn.
#### 4.3.2 KPI's voor Operations
* **Productiviteit:** De verhouding tussen output en input. Bijvoorbeeld: `aantal geproduceerde eenheden / aantal gewerkte uren`.
* **Doorlooptijd (Throughput):** De hoeveelheid geproduceerde eenheden per tijdseenheid (bijvoorbeeld per uur) tijdens de effectieve productietijd.
* **Productiekosten per eenheid:** De totale productiekosten gedeeld door het aantal geproduceerde eenheden. Dit omvat grondstofkosten en werkcenterkosten.
* **Overall Equipment Effectiveness (OEE):** Een maatstaf voor de effectiviteit van productieapparatuur, die rekening houdt met beschikbaarheid, prestaties en kwaliteit. Gecalkuleerd als: `Beschikbaarheid * Prestatie * Kwaliteit`.
#### 4.3.3 KPI's voor Purchase & Logistics
* **Kostenbesparingen (Cost Savings):** De reductie in inkoopkosten, vaak uitgedrukt als een percentage. Gecalkuleerd als: `(Nieuwe kosten per eenheid - Oude kosten per eenheid) / Oude kosten per eenheid`.
* **Leveranciersdoorlooptijd (Supplier Lead Time):** De gemiddelde tijd die een leverancier nodig heeft om een bestelling te leveren.
* **Levering-op-tijd percentage (On-Time Delivery Rate - OTD):** Het percentage leveringen van een leverancier dat binnen de afgesproken termijn wordt geleverd. Gecalkuleerd als: `(aantal op tijd geleverde orders / totaal aantal orders) * 100%`.
* **Voorraadomloopsnelheid (Inventory Turnover):** Hoe vaak de voorraad in een bepaalde periode wordt verkocht en vervangen. Gecalkuleerd als: `Kostprijs van de omzet (COGS) / Gemiddelde voorraadwaarde`. Een hogere omloopsnelheid is meestal wenselijk.
* **Backorderpercentage (Backorder Rate):** Het percentage orders dat niet direct uit voorraad kan worden geleverd. Gecalkuleerd als: `(aantal backorders / totaal aantal orders) * 100%`.
#### 4.3.4 KPI's voor Finance
* **Werkkapitaal (Working Capital):** Het verschil tussen de vlottende activa (zoals cash, debiteuren, voorraden) en de kortlopende schulden (zoals crediteuren, kortlopende leningen). Gecalkuleerd als: `Vlottende Activa - Kortlopende Schulden`. Een positief werkkapitaal is doorgaans gewenst.
* **Current Ratio:** De verhouding tussen vlottende activa en kortlopende schulden. Gecalkuleerd als: `Vlottende Activa / Kortlopende Schulden`. Een ratio boven de 1 geeft aan dat een bedrijf aan zijn kortetermijnverplichtingen kan voldoen.
* **Quick Ratio:** Vergelijkbaar met de current ratio, maar exclusief voorraden. Gecalkuleerd als: `(Vlottende Activa - Voorraden) / Kortlopende Schulden`.
* **Schuldratio (Debt Ratio):** Hoeveel schuld een bedrijf heeft in verhouding tot de totale activa. Gecalkuleerd als: `Totale Schulden / Totale Activa * 100%`.
* **Bruto en nettowinstmarge (Gross and Net Profit Margin):** De winst (respectievelijk voor en na aftrek van operationele kosten) als percentage van de omzet.
* **Rendement op Eigen Vermogen (Return on Equity - ROE):** De winst als percentage van het eigen vermogen dat door de eigenaren is geïnvesteerd. Gecalkuleerd als: `Winst / Eigen Vermogen * 100%`.
* **Rendement op geïnvesteerd vermogen (Return on Capital - ROC):** De winst als percentage van het totale in een bedrijf geïnvesteerde kapitaal (eigen vermogen plus schulden). Gecalkuleerd als: `Winst / Totaal Geïnvesteerd Vermogen * 100%`.
#### 4.3.5 KPI's voor HR
* **Verlooppercentage werknemers (Employee Turnover Rate):** Het percentage werknemers dat het bedrijf verlaat gedurende een bepaalde periode. Gecalkuleerd als: `(aantal vertrokken werknemers / gemiddeld aantal werknemers) * 100%`.
* **Gemiddelde tijd tot aanstelling (Time to Hire):** De gemiddelde duur vanaf het moment dat een vacature wordt geopend tot het moment dat een kandidaat wordt aangenomen.
* **Gemiddelde aanstellingskosten (Cost to Hire):** De totale kosten gemoeid met het werven van personeel, gedeeld door het aantal aangenomen werknemers.
* **Werknemersproductiviteit:** De output (bijvoorbeeld omzet of geproduceerde waarde) gedeeld door de input (bijvoorbeeld aantal werknemers of gewerkte uren).
### 4.4 Databases en Business Tools
Data wordt opgeslagen in databases. Een database is een gestructureerde verzameling van gerelateerde data. Een Database Management System (DBMS) is de softwarelaag die de interactie tussen gebruikers (mensen of software) en de database regelt.
#### 4.4.1 Relationele Databases (RDBMS)
Relationele databases slaan data op in tabellen met rijen en kolommen, vergelijkbaar met spreadsheets.
* **Primaire Sleutel (Primary Key):** Een waarde die elke rij uniek identificeert binnen een tabel.
* **Vreemde Sleutel (Foreign Key):** Een sleutel in een tabel die verwijst naar de primaire sleutel in een andere tabel, om zo relaties tussen tabellen te leggen.
* **SQL (Structured Query Language):** De standaardtaal voor het manipuleren van data in relationele databases (aanmaken, invoegen, bijwerken, selecteren).
#### 4.4.2 Niet-relationele Databases (NoSQL)
NoSQL-databases (Not Only SQL) zijn ontworpen om grote hoeveelheden ongestructureerde en semi-gestructureerde data efficiënt op te slaan en te verwerken. Ze zijn geschikt voor de 3 V's van Big Data: Volume, Velocity en Variety.
* **Document Stores:** Een type NoSQL-database dat data opslaat in flexibele documenten, vaak in JSON-formaat. Een document kan complexe datastructuren bevatten, wat flexibiliteit biedt ten opzichte van rigide tabelstructuren.
> **Voorbeeld met JSON:** Een JSON-document kan eenvoudig adressen en telefoonnummers bevatten, inclusief verschillende typen nummers (thuis, kantoor, mobiel), wat in een traditionele tabel minder gestroomlijnd kan zijn.
* **Voordelen:** NoSQL-databases zijn vaak sneller en schaalbaarder voor specifieke taken, met name voor Big Data-toepassingen.
### 4.5 Data-analyseproces
Het omzetten van ruwe data naar bruikbare inzichten volgt een gestructureerd proces:
1. **Definieer het probleem:** Stel duidelijke doelen en verwachte uitkomsten op basis van de behoeften van eindgebruikers.
2. **Verzamel de data:** Haal data op uit interne databases, externe connectoren, API's, web scraping, spreadsheets of openbare datasets.
3. **Voorbewerken (Pre-processing):** Reinig de data door ontbrekende waarden aan te vullen, duplicaten te verwijderen, formaten te standaardiseren en categorische variabelen om te zetten naar numerieke data. Dit kan tot 80% van de tijd in beslag nemen.
4. **Analyseer de data:** Ontdek patronen, trends en relaties. Dit kan variëren van basisstatistieken (gemiddelde, mediaan, variantie) tot complexere methoden zoals regressie, clustering en classificatie (machine learning).
5. **Visualiseer de data:** Gebruik grafieken en dashboards om de resultaten inzichtelijk te maken. Een visualisatie kan meer zeggen dan duizend woorden.
6. **Interpreteer en communiceer de resultaten:** Vertaal technische bevindingen naar begrijpelijke bedrijfstaal, met de juiste nuance en context. Communicatie is essentieel om de inzichten effectief te laten landen en te leiden tot actie.
---
Dit onderdeel bespreekt de rol van Enterprise Resource Planning (ERP)-systemen en andere business tools in het stroomlijnen van bedrijfsprocessen, het centraliseren van data en het faciliteren van geïnformeerde besluitvorming.
Enterprise Resource Planning (ERP)-systemen zijn integrale softwareoplossingen die ontworpen zijn om de belangrijkste bedrijfsprocessen van een organisatie te beheren en te integreren, zoals financiën, inkoop, productie, verkoop en human resources. Het doel is om een centraal, uniform systeem te creëren dat een "enkele bron van waarheid" biedt voor alle bedrijfsdata.
### 4.1 De rol van ERP-systemen en business tools
* **Centralisatie van data:** ERP-systemen bundelen data uit verschillende afdelingen en functies in één centrale database. Dit elimineert data-silo's, vermindert duplicatie en zorgt voor consistentie.
* **Stroomlijnen van bedrijfsprocessen:** Door processen te integreren en te automatiseren, helpt ERP bedrijven om efficiënter te opereren. Een verkooporder kan bijvoorbeeld automatisch een productieorder genereren, waarbij alle benodigde informatie wordt overgedragen.
* **Verbeterde besluitvorming:** Met gecentraliseerde en gestroomlijnde data kunnen managers beter geïnformeerde beslissingen nemen. Business Intelligence (BI)-tools en dashboards, vaak geïntegreerd in of gekoppeld aan ERP-systemen, bieden inzichten op basis van deze data.
* **Ondersteuning voor Business Intelligence (BI):** Een van de belangrijkste voordelen van een ERP-systeem is het faciliteren van BI. Doordat alle data op één plek is opgeslagen, is het eenvoudiger om rapporten te genereren en analyses uit te voeren.
* **Gebruikersinterfaces:** Bovenop de database bieden ERP-systemen gebruiksvriendelijke schermen voor input en output, waardoor interactie met de data toegankelijk wordt.
### 4.2 Voordelen van ERP-implementatie
* **Efficiëntie en tijdsbesparing:** Gegevens hoeven slechts één keer te worden ingevoerd, wat leidt tot minder handmatig werk en een lagere kans op fouten en duplicaten.
* **Verbeterde proceskoppeling:** Processen kunnen gemakkelijker aan elkaar worden gekoppeld, wat zorgt voor een naadloze workflow.
* **Eén bron van waarheid:** Gecentraliseerde data minimaliseert inconsistenties en biedt een betrouwbaar overzicht.
* **Toegankelijkheid van rapportages:** Het genereren van rapporten en het uitvoeren van analyses wordt vereenvoudigd door de gecentraliseerde datastructuur.
* **Continuïteit:** Door data centraal op te slaan, blijft informatie beschikbaar, zelfs wanneer medewerkers het bedrijf verlaten.
### 4.3 Nadelen en discussiepunten rondom ERP
* **Complexiteit en kosten:** De implementatie van een volwaardig ERP-systeem kan kostbaar en tijdrovend zijn.
* **Risico op overbodige functionaliteit:** Bedrijven kunnen oplossingen implementeren die hun werkelijke behoeften overstijgen, wat leidt tot ongebruikte functies en hogere kosten.
* **Niet voor elk bedrijf noodzakelijk:** Vooral voor kleine en middelgrote bedrijven kan een combinatie van geïntegreerde, gespecialiseerde tools een betere oplossing zijn dan een complex ERP-systeem.
* **Veranderingsweerstand:** Het implementeren van een nieuw ERP-systeem vereist vaak aanzienlijke veranderingen in bestaande workflows en kan leiden tot weerstand bij werknemers.
### 4.4 Alternatieven voor ERP-implementatie: Integratie van business tools
In plaats van een omvangrijk ERP-systeem, kiezen sommige bedrijven ervoor om verschillende gespecialiseerde business tools te integreren. Dit kan een flexibelere en kosteneffectievere aanpak zijn, vooral voor kleinere bedrijven.
* **Voorbeelden van geïntegreerde tools:**
* Website met leadgeneratie
* Verkoop & CRM (Customer Relationship Management)
* Facturatie
* Planning
* Boekhouding
* HR-software
* E-mailmarketing
* **API's (Application Programming Interfaces):** Deze interfaces maken het mogelijk voor verschillende softwareapplicaties om met elkaar te communiceren en data uit te wisselen, zelfs als ze cloud-gebaseerd zijn. Dit is cruciaal voor het integreren van diverse business tools.
### 4.5 De rol van ERP in Business Intelligence (BI)
ERP-systemen vormen de ruggengraat voor veel BI-toepassingen. De gestructureerde data die in het ERP is opgeslagen, is essentieel voor het creëren van:
* **Vaste rapporten:** Standaard rapporten die regelmatig worden gegenereerd binnen het ERP-systeem.
* **Dynamische rapporten:** Meer flexibele rapporten die specifieke queries toestaan.
* **Dashboards:** Visuele weergaven van belangrijke KPI's en data, die direct uit het ERP kunnen worden gehaald of via externe BI-tools kunnen worden geïntegreerd.
#### 4.5.1 Integratieopties voor ERP en BI
Er zijn verschillende manieren waarop ERP en BI met elkaar kunnen worden verbonden:
* **Geïntegreerde BI in ERP:** Sommige ERP-systemen bieden ingebouwde BI-functionaliteiten.
* **Externe BI-tools:** Bedrijven kunnen gespecialiseerde BI-tools gebruiken die vervolgens worden geïntegreerd met het ERP-systeem. Dit biedt vaak meer geavanceerde analyse- en visualisatiemogelijkheden.
* **Voorbeelden van BI-tools en hun integratie:**
* Teamleader (vaste rapporten)
* Robaws (integratie met Google Looker Studio)
* Odoo (dynamische rapportage, ook met AI-ondersteuning)
### 4.6 Factoren voor de keuze van ERP of Business Tools
Bij het kiezen van de juiste softwareoplossing zijn diverse factoren belangrijk:
* **Grootte van het bedrijf:** Grote multinationals hebben vaak baat bij een uitgebreid ERP, terwijl kleinere bedrijven beter af kunnen zijn met een combinatie van gespecialiseerde tools.
* **Marktsector:** De specifieke behoeften van een bepaalde sector kunnen de keuze van de software beïnvloeden.
* **Niche vs. Generalistisch:** Sommige tools zijn specifiek voor een nichemarkt, terwijl andere algemeen toepasbaar zijn.
* **Kosten en implementatietijd:** De financiële investering en de benodigde tijd voor implementatie zijn cruciale overwegingen.
* **Gebruiksgemak en acceptatie:** De mate waarin werknemers de software kunnen en willen gebruiken, is essentieel voor succes.
* **Schaalbaarheid:** De software moet meegroeien met de organisatie.
### 4.7 Het ontwikkelen van ERP-systemen inhouse
Het ontwikkelen van een eigen ERP-systeem vanaf nul wordt over het algemeen afgeraden. Dit is een extreem kostbare, tijdrovende en risicovolle onderneming. Het is vaak efficiënter en effectiever om bestaande, bewezen oplossingen te gebruiken of aan te passen. De focus zou moeten liggen op het slim gebruiken van de data die uit het ERP of andere systemen komt ("If you can get it in, you can get it out").
### 4.8 Voorbeelden van ERP-software
De markt voor ERP-systemen is divers en populairiteit kan per regio verschillen. Bekende merken zijn onder andere:
* SAP
* Oracle
* Microsoft Dynamics
* Odoo
* Teamleader
* Robaws
> **Tip:** Het selecteren van de juiste software is cruciaal. Een verkeerde keuze kan leiden tot aanzienlijke operationele problemen en inefficiënties, vergelijkbaar met het dragen van schoenen die twee maten te klein zijn.
>
> **Voorbeeld:** Een kleine webshop kan beter starten met een combinatie van een e-commerce platform, een boekhoudprogramma en een CRM-tool die via API's met elkaar integreren, dan met een volledig geïntegreerd, complex ERP-systeem dat meer functionaliteit biedt dan nodig is.
---
# Data-analyseproces en communicatie van resultaten
Het datagegevensanalyseproces is een gestructureerde aanpak om inzichten uit data te verkrijgen, beginnend bij het definiëren van het probleem en eindigend met de effectieve communicatie van bevindingen aan belanghebbenden.
## 5. Het data-analyseproces en communicatie van resultaten
Het data-analyseproces omvat verschillende cruciale stappen om van ruwe data tot bruikbare inzichten te komen. Dit proces is essentieel voor data-gedreven management, waarbij beslissingen worden genomen op basis van feiten en cijfers in plaats van op intuïtie alleen.
### 5.1 De fasen van het data-analyseproces
Het data-analyseproces kan worden onderverdeeld in de volgende kernfasen:
#### 5.1.1 Probleemdefinitie
Dit is de initiële en meest fundamentele stap. Het gaat om het helder formuleren van de doelstellingen en de verwachte uitkomsten van de analyse, afgestemd op de behoeften van de eindgebruikers. Een goed gedefinieerd probleem zorgt ervoor dat de analyse gefocust blijft en relevant is.
* **Voorbeeld:** In plaats van algemeen te zeggen "We willen een financieel dashboard," zou een specifieke probleemdefinitie kunnen zijn: "Het financiële departement wenst een duidelijk overzicht van de evolutie van inkomsten versus uitgaven op maandelijkse basis om kostenbesparende maatregelen te evalueren."
#### 5.1.2 Dataverzameling
Na het definiëren van het probleem is de volgende stap het verzamelen van de benodigde data. Deze data kan afkomstig zijn uit diverse bronnen:
* **Interne databases:** Gegevens opgeslagen binnen de organisatie (bijv. ERP-systemen).
* **Voorgebouwde connectoren:** Gestandaardiseerde koppelingen die veel rapportagetools bieden om data uit specifieke systemen te halen.
* **Custom integraties via API's:** Maatwerk koppelingen voor specifieke data-uitwisseling tussen systemen.
* **Web scraping:** Het automatisch extraheren van data van websites.
* **Excel-sheets:** Veelgebruikt voor kleinere datasets of specifieke analyses.
* **Publiek beschikbare datasets:** Open data-initiatieven, zoals Kaggle of overheidsdatabases.
#### 5.1.3 Pre-processing van data
Voordat data geanalyseerd kan worden, moet deze vaak worden schoongemaakt en voorbereid. Dit is een tijdrovende, maar cruciale stap die tot 80% van de totale analysetijd kan innemen. Belangrijke pre-processing taken omvatten:
* **Opschonen van data:**
* **Missing values:** Identificeren en omgaan met ontbrekende gegevens. Dit kan door het vinden van de ontbrekende data en deze aan te vullen, of, indien dit te kostbaar of tijdrovend is, door te kiezen voor het invullen met het gemiddelde of de mediaan.
* **Verwijderen van duplicaten:** Zorgen dat elke dataset-record uniek is.
* **Standaardiseren van formaten:** Zorgen voor consistentie in datum-, tijds- en nummerformaten.
* **Converteren van categorische variabelen:** Variabelen die niet-numerieke waarden vertegenwoordigen (bijv. "rood", "blauw") moeten vaak worden omgezet naar numerieke representaties (bijv. 1, 2) om door computers te kunnen worden verwerkt.
#### 5.1.4 Data-analyse
Dit is de kernfase waarin betekenisvolle patronen, trends en relaties in de data worden ontdekt. De specifieke technieken zijn afhankelijk van het analysedoel en variëren van eenvoudige statistieken tot geavanceerde machine learning methoden.
* **Beschrijvende statistieken:**
* **Gemiddelde (Mean):** De som van alle waarden gedeeld door het aantal waarden.
`\text{Gemiddelde} = \frac{\sum_{i=1}^{n} x_i}{n}`
* **Mediaan (Median):** De middelste waarde in een gesorteerde reeks getallen.
* **Variantie (Variance):** Een maat voor hoe verspreid de waarden zijn ten opzichte van het gemiddelde.
`\text{Variantie} = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n}`
waarbij $x_i$ een individuele waarde is, $\bar{x}$ het gemiddelde, en $n$ het aantal waarden.
* **Correlaties, trends en uitschieters (outliers):**
* **Correlatie:** Onderzoekt de mate waarin twee variabelen samenhangen (bijv. stijgt de omzet wanneer de advertentie-uitgaven toenemen?).
* **Trends:** Identificeert de algemene richting van de data over tijd (bijv. een gestage stijging of daling).
* **Uitschieters:** Waarden die significant afwijken van de rest van de data. Deze kunnen soms worden verwijderd of aangepast om de resultaten niet te vertekenen.
* **Geavanceerde technieken:**
* **Regressie:** Modellen die de relatie tussen een afhankelijke variabele en één of meer onafhankelijke variabelen voorspellen (bijv. "voor elke extra euro aan reclame, stijgt de omzet met €4,63").
* **Clustering:** Algoritmen die datapunten groeperen op basis van hun gelijkenissen, waardoor natuurlijke segmenten in de data worden ontdekt (bijv. klantsegmenten).
* **Classificatie:** Algoritmen die leren om datapunten toe te wijzen aan vooraf gedefinieerde categorieën (bijv. voorspellen of een klant waarschijnlijk zal wanbetalen op een lening).
#### 5.1.5 Datavisualisatie
Visualisatie is cruciaal omdat een beeld vaak meer zegt dan duizend woorden. Het presenteert de bevindingen uit de analyse op een begrijpelijke en toegankelijke manier.
* **Doel:** Complexe data en inzichten toegankelijk maken voor een breder publiek.
* **Belang:** Verbetert de interpretatie en helpt bij het snel identificeren van patronen en trends.
#### 5.1.6 Interpretatie en communicatie van resultaten
Dit is de laatste fase waarin de bevindingen worden vertaald naar bruikbare inzichten en worden gecommuniceerd aan de relevante belanghebbenden.
* **Communicatiestrategie:**
* **Gebruik van duidelijke taal:** Vermijd jargon en technische termen waar mogelijk. Vertaal technische interpretaties naar bedrijfstaal.
* **Context bieden:** Zorg ervoor dat de ontvangers de betekenis van de resultaten in de context van hun werk begrijpen.
* **Nadruk leggen op bruikbaarheid:** Communiceer hoe de inzichten kunnen leiden tot betere besluitvorming en actie.
* **Vermijd misleiding:**
* Zorg ervoor dat visualisaties niet misleidend zijn (bijv. door onjuiste schalen of grafiektypen te gebruiken).
* Gebruik de juiste grafiektypes die passen bij het type data en de boodschap die overgebracht moet worden.
* **Taalgebruik en nuance:**
* **"Dit suggereert..."**: Geeft een mogelijke oorzaak of trend aan.
* **"Dit geeft aan dat..."**: Sterker bewijs, meer vertrouwen in de conclusie.
* **"De data impliceert dat..."**: Wijst indirect naar wat de cijfers suggereren.
* **"Dit zou kunnen betekenen dat..."**: Voorzichtige interpretatie, nuttig wanneer correlatie niet gelijk staat aan causaliteit.
### 5.2 Belang van Business Intelligence en ERP
* **Business Intelligence (BI):** BI-systemen verzamelen, analyseren en presenteren ruwe data om deze om te zetten in bruikbare informatie, kennis en uiteindelijk actie. Ze helpen organisaties om "de juiste cijfers op het juiste moment op de juiste manier" te krijgen voor geïnformeerde besluitvorming.
* **Enterprise Resource Planning (ERP) systemen:** ERP-systemen integreren alle kernprocessen van een organisatie (zoals financiën, HR, inkoop, productie, verkoop) in één systeem met één database. Dit zorgt voor gegevensconsistentie, stroomlijnt processen en faciliteert rapportage en analyse.
> **Tip:** Een krachtige combinatie is het integreren van een ERP-systeem met BI-tools. Dit stelt organisaties in staat om de gestructureerde data uit het ERP effectief te analyseren en te visualiseren.
### 5.3 Data-analyse tools en technieken
* **SQL (Structured Query Language):** De standaardtaal voor het manipuleren van relationele databases. Het wordt gebruikt om data op te vragen, in te voegen, bij te werken en te verwijderen.
* **NoSQL-databases:** Ontworpen voor grote hoeveelheden ongestructureerde of semi-gestructureerde data, wat essentieel is in het tijdperk van Big Data. Ze bieden flexibiliteit, met name document-opslagdatabases die gebruik maken van formaten zoals JSON.
* **AI, Machine Learning en Deep Learning:** Deze technologieën stellen systemen in staat om te leren van data en voorspellingen te doen.
* **Machine Learning:** Algoritmen die leren van data zonder expliciet geprogrammeerd te zijn voor elke taak.
* **Deep Learning:** Een subset van machine learning die gebruik maakt van neurale netwerken met meerdere lagen om complexe patronen te herkennen.
> **Tip:** Het begrijpen van de data-analyseprocesfasen helpt bij het systematisch aanpakken van complexe data-uitdagingen, van probleemdefinitie tot het delen van inzichten.
---
Het data-analyseproces omvat een gestructureerde reeks stappen om van ruwe data tot bruikbare inzichten te komen en deze effectief te communiceren aan belanghebbenden.
## 5. Data-analyseproces en communicatie van resultaten
Het data-analyseproces is een systematische aanpak die wordt gebruikt om betekenisvolle patronen, trends en inzichten uit data te extraheren, wat leidt tot beter geïnformeerde besluitvorming.
### 5.1 Het data-analyseproces
Het proces bestaat uit verschillende kernfasen die elkaar logisch opvolgen:
Dit is de initiële en cruciale stap waarbij de doelstellingen en verwachte uitkomsten van de analyse duidelijk worden vastgesteld, gebaseerd op de context en de behoeften van de eindgebruikers. Een goed gedefinieerd probleem zorgt voor focus en relevantie.
> **Tip:** Vermijd vage probleemdefinities zoals "het opzetten van een financieel dashboard". Een betere definitie is: "het verkrijgen van een duidelijk overzicht van de evolutie van inkomsten ten opzichte van uitgaven op maandelijkse basis voor het financiële departement."
Nadat het probleem is gedefinieerd, wordt de benodigde data verzameld. Dit kan uit verschillende bronnen komen:
* **Interne databases:** Systemen zoals ERP- en CRM-systemen.
* **Vooraf gebouwde connectoren:** Standaardkoppelingen in BI-tools.
* **Custom integraties via API's:** Programmatische koppelingen met andere systemen.
* **Web scraping:** Het extraheren van data van websites.
* **Excel-bestanden:** Handmatig ingevoerde of geëxporteerde data.
* **Publiek beschikbare datasets:** Open data van overheidsinstanties of platforms zoals Kaggle.
Dit is een tijdrovende maar essentiële fase waarin de verzamelde data wordt schoongemaakt en voorbereid voor analyse. Veelvoorkomende taken zijn:
* **Identificeren en behandelen van ontbrekende waarden:** Ontbrekende data kan resultaten vertekenen. Mogelijkheden zijn het opzoeken en invullen van de data, of het invullen met het gemiddelde of de mediaan.
* **Verwijderen van duplicaten:** Dubbele records kunnen de analyse verstoren.
* **Standaardiseren van formaten:** Zorgen voor consistentie in datatypes en notaties.
* **Converteren van categorische variabelen naar numerieke vormen:** Computeranalyse vereist vaak numerieke input.
* **Normaliseren van data:** Het aanpassen van de schaal van variabelen voor vergelijkbaarheid.
> **Tip:** De pre-processing fase kan tot wel 80% van de totale tijd van een data-analyseproject in beslag nemen. Onderschat het belang ervan niet.
In deze centrale fase worden patronen, trends en relaties in de data onthuld. De gebruikte technieken variëren afhankelijk van het doel:
* **Beschrijvende statistieken:** Het samenvatten van data.
* **Gemiddelde (Mean):** De som van waarden gedeeld door het aantal waarden.
Voorbeeld: Gegeven de getallen 8, 12, 10, 10, 15, is het gemiddelde $ \frac{8+12+10+10+15}{5} = 11 $.
* **Mediaan (Median):** De middelste waarde in een gesorteerde dataset.
Voorbeeld: Gesorteerde lijst [8, 10, 10, 12, 15]. De mediaan is 10.
* **Variantie (Variance):** Een maat voor de spreiding van waarden rond het gemiddelde.
Voorbeeld: Voor de getallen 8, 12, 10, 10, 15 met een gemiddelde van 11:
1. Verschillen van het gemiddelde: $8-11=-3$, $12-11=1$, $10-11=-1$, $10-11=-1$, $15-11=4$.
2. Kwadrateren van de verschillen: $ (-3)^2=9 $, $ (1)^2=1 $, $ (-1)^2=1 $, $ (-1)^2=1 $, $ (4)^2=16 $.
3. Gemiddelde van de gekwadrateerde verschillen: $ \frac{9+1+1+1+16}{5} = \frac{28}{5} = 5.6 $. De variantie is 5.6.
* **Correlaties, trends en uitschieters (outliers):** Het identificeren van relaties tussen variabelen en het herkennen van patronen die afwijken van het gemiddelde.
* **Correlatie:** Een positieve correlatie suggereert dat wanneer de ene variabele toeneemt, de andere ook neigt toe te nemen (bijvoorbeeld: hogere advertentie-uitgaven leiden tot hogere verkopen).
* **Trends:** Een gestage stijging of daling van data over tijd.
* **Uitschieters:** Extreem hoge of lage waarden die de resultaten kunnen vertekenen en die soms verwijderd of aangepast moeten worden.
* **Meer geavanceerde technieken:**
* **Regressie:** Het modelleren van de relatie tussen een afhankelijke variabele en een of meer onafhankelijke variabelen om voorspellingen te doen.
Voorbeeld: "Voor elke extra dollar die aan reclame wordt besteed, nemen de verkopen gemiddeld met 4,63 dollar toe, exclusief initiële verkopen zonder reclame."
* **Clustering:** Het groeperen van datapunten met vergelijkbare kenmerken. Dit helpt bij het identificeren van klantsegmenten of patronen.
Voorbeeld: Klanten kunnen worden gegroepeerd in segmenten (bijvoorbeeld: potentieel voor promoties, loyaliteitsprogramma's, VIP-behandeling) om gerichte acties te ondernemen.
* **Classificatie:** Het toewijzen van datapunten aan vooraf gedefinieerde categorieën op basis van hun kenmerken.
Voorbeeld: Een bank kan classificatiemodellen gebruiken om te voorspellen of een klant waarschijnlijk zal wanbetalen op een lening.
> **Tip:** Voor het toepassen van geavanceerde technieken op grote datasets zijn machine learning-algoritmen en gespecialiseerde software nodig.
#### 5.1.5 Visualisatie van data
Data visualiseren maakt complexe informatie toegankelijk en begrijpelijk. Een afbeelding kan meer zeggen dan duizend woorden, waardoor inzichten sneller worden overgebracht.
> **Tip:** Kies de juiste grafiek voor de data en het verhaal dat je wilt vertellen. Een 3D-taartdiagram wordt vaak als minder leesbaar beschouwd dan een eenvoudig staafdiagram.
Dit is de fase waarin de bevindingen worden vertaald naar bruikbare inzichten en worden gecommuniceerd aan de relevante belanghebbenden.
* **Manieren van presenteren:** Dashboards en rapporten moeten zo worden ontworpen dat ze de gebruiker leiden en helpen bij het interpreteren van de data.
* **Taalgebruik:** Het is essentieel om de juiste taal en nadruk te gebruiken bij het communiceren van resultaten. Dit betekent het vertalen van technische bevindingen naar zakelijke taal.
> **Voorbeeld:**
> * Technische bewering: "De regressielijn heeft een $R^2$ van 0,87."
> * Zakelijke vertaling: "Dit suggereert een sterke relatie en hoge voorspellingskracht."
> * Technische bewering: "De data impliceert dat..."
> * Zakelijke vertaling: "Dit wijst indirect op wat de cijfers suggereren."
> * Gebruik van nuances zoals "Dit suggereert...", "Dit indiceert dat...", "De data impliceert dat...", "Dit zou kunnen betekenen dat..." helpt om de mate van zekerheid correct over te brengen en onderscheid te maken tussen correlatie en causaliteit.
### 5.2 Belang van Business Intelligence en hulpmiddelen
Business Intelligence (BI) is het proces van het verzamelen, organiseren en interpreteren van bedrijfsdata om kennis te genereren en geïnformeerde beslissingen te nemen.
* **Van ruwe data naar actie:**
* **Ruwe data:** Onbewerkte gegevens.
* **Informatie:** Data waaraan betekenis is gegeven (bijvoorbeeld labels, eenheden).
* **Kennis:** Interpretatie van informatie, context toevoegen.
* **Actie:** Beslissingen nemen op basis van de gegenereerde kennis.
* **BI-hulpmiddelen:** Software die helpt bij het verzamelen, analyseren en visualiseren van data. Voorbeelden zijn Power BI, Qlik en Tableau. Deze tools integreren vaak met databases en ERP-systemen.
* **"Corporate War Room" / "Decision Cockpit":** Een centrale plek waar realtime data en dashboards worden weergegeven, zodat managementteams snel geïnformeerde beslissingen kunnen nemen.
#### 5.2.1 Big Data
De opkomst van Big Data wordt gekenmerkt door de volgende "V's":
* **Volume:** Grote hoeveelheden data. De hoeveelheid data die dagelijks wereldwijd wordt gecreëerd, is enorm en blijft groeien.
* **Velocity:** De snelheid waarmee data wordt gegenereerd en verwerkt.
* **Variety:** De diversiteit aan datatypes, waaronder gestructureerde, semi-gestructureerde en ongestructureerde data (zoals sensordata, social media-posts, weerberichten).
> **Definitie:** Big Data is een verzameling van ongestructureerde en soms incomplete data die zo omvangrijk is dat conventionele databasesystemen deze niet efficiënt kunnen verwerken.
#### 5.2.2 AI, Machine Learning en Deep Learning
* **AI (Artificiële Intelligentie):** Het creëren van systemen die taken kunnen uitvoeren die normaal menselijke intelligentie vereisen.
* **Machine Learning (ML):** Algoritmen die systemen in staat stellen te leren van data zonder expliciet geprogrammeerd te zijn.
* **Supervised Learning:** Algoritmen worden getraind met gelabelde data (input-output paren). Feedback is cruciaal om de prestaties te verbeteren.
* **Neural Networks:** Geïnspireerd door de structuur van het menselijk brein (neuronen), worden deze netwerken gebruikt om complexe patronen te herkennen.
* **Deep Learning:** Een subveld van ML dat gebruikmaakt van diepe neurale netwerken met meerdere lagen, waardoor nog complexere patronen en abstracties kunnen worden geleerd. Deze modellen kunnen vaak moeilijk te interpreteren zijn voor mensen.
### 5.3 Rol van ERP-systemen en business tools
* **ERP (Enterprise Resource Planning):** Geïntegreerde softwareoplossingen die verschillende bedrijfsfuncties (zoals financiën, inkoop, verkoop, operations, HR) beheren vanuit één database. Dit elimineert dubbele invoer, vermindert fouten en stroomlijnt processen.
* **Voordelen van ERP:**
* Centrale dataopslag (één bron van waarheid).
* Efficiëntere rapportage en Business Intelligence.
* Verbeterde procesintegratie.
* Risicobeperking bij personeelsverloop.
* **Alternatieven voor ERP:** Voor sommige bedrijven, met name kleinere, kan een combinatie van geïntegreerde, gespecialiseerde tools (bijvoorbeeld een CRM, boekhoudpakket, marketing automation tool) een betere oplossing zijn dan een complex ERP-systeem.
* **API's (Application Programming Interfaces):** Hiermee kunnen verschillende softwaretoepassingen met elkaar communiceren en data uitwisselen, wat integratie van tools vergemakkelijkt, ook in cloud-gebaseerde omgevingen.
> **Tip:** De keuze voor een ERP-systeem of een combinatie van tools moet gebaseerd zijn op de specifieke behoeften, markttak en omvang van het bedrijf. Het zelf ontwikkelen van een ERP-systeem is vaak kostbaar en risicovol ("Don't reinvent the wheel!").
### 5.4 Communicatie van resultaten aan belanghebbenden
Effectieve communicatie is essentieel om de waarde van data-analyse te realiseren. Dit omvat:
* **Duidelijke en interpreteerbare dashboards:** Presenteer data op een manier die gemakkelijk te begrijpen is voor niet-technische gebruikers.
* **Gebruik van de juiste taal:** Vertaal technische analyses naar zakelijke implicaties en aanbevelingen.
* **Nadruk op inzichten:** Focus op wat de data betekent en welke acties hieruit voortvloeien, in plaats van alleen de technische details te presenteren.
* **Context en nuances:** Geef aan wat de beperkingen zijn van de analyse en wees voorzichtig met causale claims wanneer alleen correlaties zijn aangetoond.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Data-gedreven management | Management waarbij beslissingen worden genomen op basis van analyse van verzamelde data in plaats van op intuïtie of ervaring. Dit leidt tot meer geïnformeerde en effectieve strategische keuzes. |
| Business Intelligence (BI) | Een verzameling van processen, technologieën en tools die gebruikt worden om ruwe data te verzamelen, te analyseren en om te zetten in bruikbare informatie voor het nemen van zakelijke beslissingen. |
| Key Performance Indicator (KPI) | Een meetbare waarde die aangeeft hoe effectief een bedrijf of een specifiek proces presteert ten opzichte van de gestelde doelen. KPI's helpen bij het monitoren van voortgang en het identificeren van verbeterpunten. |
| ERP-systeem (Enterprise Resource Planning) | Een geïntegreerd softwaresysteem dat organisaties helpt bij het beheren van hun kernbedrijfsprocessen, zoals financiën, inkoop, productie, verkoop en human resources, vanuit één centraal systeem. |
| Big Data | Een omvangrijke en complexe dataset die te groot, te snel of te gevarieerd is om te worden verwerkt met traditionele dataverwerkingssoftware. Het wordt gekenmerkt door de '3 V's': Volume, Velocity en Variety. |
| Machine Learning (ML) | Een tak van kunstmatige intelligentie die systemen in staat stelt om te leren van data zonder expliciet geprogrammeerd te zijn. Algoritmes passen zich aan op basis van de input die ze ontvangen om voorspellingen te doen of beslissingen te nemen. |
| SQL (Structured Query Language) | Een standaard programmeertaal die wordt gebruikt voor het beheren en manipuleren van relationele databases. Hiermee kunnen gebruikers data opvragen, invoegen, bijwerken en verwijderen. |
| NoSQL databases | Een klasse van databasesystemen die afwijken van het traditionele relationele model. Ze zijn ontworpen om grote hoeveelheden ongestructureerde of semi-gestructureerde data efficiënt op te slaan en te verwerken, vaak gebruikt voor Big Data-toepassingen. |
| Data-analyseproces | De gestructureerde reeks stappen die wordt gevolgd om data te verzamelen, voor te bewerken, te analyseren, te visualiseren en de resultaten te interpreteren en te communiceren, met als doel inzichten te verkrijgen en problemen op te lossen. |
| Dashboard | Een visuele interface die een overzicht biedt van de belangrijkste KPI's en statistieken van een organisatie of proces. Dashboards maken het eenvoudig om de prestaties in één oogopslag te beoordelen en trends te identificeren. |
| Werkkapitaal | Het verschil tussen de vlottende activa (zoals cash, debiteuren en voorraden) en de kortlopende schulden van een bedrijf. Een positief werkkapitaal duidt op een gezonde financiële situatie op korte termijn. |
| Bruto winstmarge | De winst die overblijft nadat de directe kosten van verkochte goederen (COGS) van de omzet zijn afgetrokken, uitgedrukt als een percentage van de omzet. Het geeft de winstgevendheid van de kernactiviteiten weer. |
| Nettowinstmarge | De winst die overblijft nadat alle kosten, inclusief indirecte kosten zoals overhead en belastingen, van de omzet zijn afgetrokken, uitgedrukt als een percentage van de omzet. Het vertegenwoordigt de uiteindelijke winstgevendheid van het bedrijf. |
| API (Application Programming Interface) | Een set definities en protocollen die softwaretoepassingen in staat stelt met elkaar te communiceren. API's faciliteren de integratie tussen verschillende systemen, zoals een ERP-systeem en een CRM-tool. |
| Klantlevenswaardepercentage (CLV) | Een voorspelling van de totale winst die een bedrijf verwacht te behalen uit een klant gedurende de gehele relatie. Het helpt bij het waarderen van klanten en het sturen van marketing- en retentie-inspanningen. |
| Klantacquisitiekosten (CAC) | De totale kosten die gemaakt worden om een nieuwe klant te werven, gedeeld door het aantal nieuwe klanten dat in een bepaalde periode is verkregen. Het is een cruciale maatstaf voor de efficiëntie van marketing- en verkoopactiviteiten. |
Cover
Data Driven alle Powerpoints.pptx
Summary
# Introductie tot datagedreven management
Dit onderwerp introduceert het concept van datagedreven management, benadrukt het belang van besluitvorming op basis van data en schetst de leerdoelen van de cursus.
## 1.1 Wat is datagedreven management?
Datagedreven management draait om het nemen van geïnformeerde beslissingen, ondersteund door data, om de prestaties van een organisatie te verbeteren en strategische doelen te bereiken. Succesvolle managers gebruiken data om inzicht te krijgen in complexe zakelijke vraagstukken en proactief te handelen.
### 1.1.1 Het belang van data in managementbeslissingen
In de huidige zakelijke omgeving is de mogelijkheid om data te gebruiken voor besluitvorming cruciaal. Dit omvat het analyseren van informatie uit diverse bronnen zoals ERP-systemen, KPI's, Business Intelligence-tools, en technologieën als SQL, NoSQL, AI en Big Data. Het doel is om een 'evidence-based' of datagedreven organisatie te creëren.
### 1.1.2 Kernvragen binnen datagedreven management
Tijdens deze cursus worden onder andere de volgende vragen beantwoord:
* Hoe beïnvloedt data moderne managementbesluitvorming?
* Wat kenmerkt een datagedreven bedrijf en evidence-based besluitvorming?
* Welke data wordt gegenereerd in verschillende bedrijfsprocessen?
* Welke rol spelen bedrijfstools en ERP-systemen?
* Wat zijn de Key Performance Indicators (KPI's) voor elk proces?
* Hoe creëren we efficiënte dashboards?
### 1.1.3 Voorbeelden van datagedreven toepassingen
Data transformeert de manier waarop bedrijven opereren. Enkele voorbeelden zijn:
* **Aanbevelingssystemen (Recommendation engines):** Netflix gebruikt data om content te licenseren, te produceren en aan te bevelen.
* **Dynamische prijsstelling:** Hotels passen prijzen aan op basis van real-time vraag en aanbod.
* **Gepersonaliseerde marketing:** Bedrijven analyseren consumentengedrag om gerichte aanbiedingen te doen.
* **Voorraadbeheer en productieoptimalisatie:** Zara gebruikt data van verkooppunten om designs razendsnel aan te passen en productie te optimaliseren.
* **Sportanalyse:** Data wordt gebruikt om prestaties van atleten te verbeteren en strategieën te ontwikkelen.
## 1.2 De rol van data in bedrijfsprocessen en KPI's
Elk bedrijfsproces genereert data die waardevol is voor het meten van prestaties en het nemen van beslissingen. Key Performance Indicators (KPI's) helpen om deze data te kwantificeren en te interpreteren.
### 1.2.1 Marketing & Sales
* **Marketing Funnel:** Richt zich op het genereren van leads en het converteren ervan.
* **Cost per Click (CPC):** De kosten die betaald worden telkens wanneer er op een advertentie wordt geklikt. De prijs is afhankelijk van een veilingalgoritme en factoren zoals de kwaliteit van de advertentie en de bestemmingspagina.
> **Voorbeeld:** Een CPC van 0,75 euro.
* **Click-through Rate (CTR):** Het percentage personen dat op een link klikt nadat ze een e-mail hebben geopend.
> **Formule:** $CTR = \frac{\text{Aantal klikken op link}}{\text{Aantal geopende e-mails}} \times 100\%$
> **Voorbeeld:** 7.500 geopende e-mails, 435 klikken resulteert in een CTR van $ \frac{435}{7500} \times 100\% = 5,8\% $.
* **Conversion Rate:** Het percentage websitebezoekers dat een gewenste actie uitvoert (bijv. een aankoop).
> **Formule:** $Conversion\ Rate = \frac{\text{Aantal voltooide acties}}{\text{Totaal aantal bezoekers}} \times 100\%$
> **Voorbeeld:** 135.000 bezoekers en 6.200 bestellingen resulteren in een Conversion Rate van $ \frac{6200}{135000} \times 100\% = 4,6\% $.
* **Return on Ads Spend (ROAS):** De opbrengst die wordt gegenereerd voor elke euro die aan advertenties wordt uitgegeven. Een ROAS groter dan 1 is positief.
> **Formule:** $ROAS = \frac{\text{Extra omzet door campagne}}{\text{Kosten van campagne}}$
> **Voorbeeld:** Een campagne van 6.000 euro genereert 29.000 euro extra omzet, wat resulteert in een ROAS van $ \frac{29000}{6000} = 4,83 $.
* **Sales Manager KPI's:**
* **Customer Acquisition Cost (CAC):** De totale kosten voor verkoop en marketing gedeeld door het aantal nieuwe klanten.
> **Formule:** $CAC = \frac{\text{Totale kosten verkoop en marketing}}{\text{Aantal nieuwe klanten}}$
> **Voorbeeld:** Totale kosten marketing (178.560 euro) + verkoop (68.530 euro) gedeeld door 520 nieuwe klanten = 475,17 euro.
* **Customer Lifetime Value (CLV):** De totale waarde die een klant gedurende de gehele relatie met het bedrijf genereert.
> **Berekening:** Eerst wordt de gemiddelde klantwaarde berekend (gemiddelde aankoopwaarde x gemiddelde aankoopfrequentie). Vervolgens wordt dit vermenigvuldigd met de gemiddelde klantlevensduur.
> **Voorbeeld:** Gemiddelde klantwaarde van 127 euro en een levensduur van 7,6 jaar resulteert in een CLV van $127 \times 7,6 = 965,2$ euro.
* **CAC versus CLV:** Het is essentieel dat de CLV hoger is dan de CAC.
> **Voorwaarde:** $CLV > CAC$ of $ \frac{CLV}{CAC} > 1 $
> **Voorbeeld:** CLV van 965 euro en CAC van 475 euro geeft $ \frac{965}{475} = 2,03 > 1 $.
### 1.2.2 Operations
* **Belangrijke elementen in ERP voor operations:** Bill of Material (BoM), werkcentra, routing, en productieorders.
* **Operation Manager KPI's:**
* **Productiviteit:** De verhouding tussen output en input.
> **Formule:** $Productiviteit = \frac{\text{Output}}{\text{Input}}$
> **Voorbeeld:** De productiviteit van een freesmachine is gedaald van 1,25 platen per uur naar 0,67 platen per uur door gebrek aan onderhoud.
> **Arbeidsproductiviteit:** Productiviteit wordt ook berekend als BBP per gewerkt uur.
> **Voorbeeld:** Ierland met 140 dollar per uur versus Mexico met 45 dollar per uur.
* **Throughput:** De hoeveelheid geproduceerde eenheden per tijdseenheid.
> **Formule:** $Throughput = \frac{\text{Totaal geproduceerd}}{\text{Effectieve productietijd}}$
> **Voorbeeld:** 9.550 auto-onderdelen geproduceerd in 56,5 effectieve uren resulteert in een throughput van 169 onderdelen per uur.
* **Manufacturing Cost per Unit:** De totale productiekosten per geproduceerde eenheid.
> **Formule:** $Manufacturing\ cost\ per\ unit = \frac{\text{Totale productiekosten}}{\text{Aantal geproduceerde eenheden}}$
> **Voorbeeld:** De productiekosten per ijsje zijn 1,58 euro.
* **Overall Equipment Effectiveness (OEE):** Een maatstaf voor de prestaties van productieapparatuur, gebaseerd op beschikbaarheid, prestatie en kwaliteit.
> **Formule:** $OEE = Beschikbaarheid \times Prestatie \times Kwaliteit$
> **Voorbeeld:** Een OEE van 83,3% wordt behaald met 91,7% beschikbaarheid, 95,5% prestatie en 95,2% kwaliteit.
### 1.2.3 Finance
* **Financieel Manager KPI's:**
* **Working Capital:** Het verschil tussen kortlopende activa en kortlopende passiva, een indicator voor de korte termijn financiële gezondheid. Een positieve waarde is wenselijk.
> **Formule:** $Working\ Capital = \text{Vlottende Activa} - \text{Kortlopende Passiva}$
> **Voorbeeld:** Vlottende activa van 77.800 euro en kortlopende passiva van 23.780 euro resulteert in een working capital van 54.020 euro.
* **Current Ratio:** De verhouding tussen vlottende activa en kortlopende passiva.
> **Formule:** $Current\ Ratio = \frac{\text{Vlottende Activa}}{\text{Kortlopende Passiva}}$
> **Voorbeeld:** 3,27.
* **Quick Ratio:** De current ratio exclusief voorraden.
> **Formule:** $Quick\ Ratio = \frac{\text{Vlottende Activa} - \text{Voorraden}}{\text{Kortlopende Passiva}}$
> **Voorbeeld:** 2,16.
* **Debt Ratio:** De verhouding tussen totale schulden en totale activa.
> **Formule:** $Debt\ Ratio = \frac{\text{Totale Schulden}}{\text{Totale Activa}} \times 100\%$
> **Voorbeeld:** 67% bij 800.000 euro schulden en 1.200.000 euro activa.
* **Gross Profit Margin:** De brutowinst als percentage van de omzet.
> **Formule:** $Gross\ Profit\ Margin = \frac{\text{Brutowinst}}{\text{Omzet}} \times 100\%$
> **Voorbeeld:** 48,25%.
* **Net Profit Margin:** De nettowinst als percentage van de omzet.
> **Formule:** $Net\ Profit\ Margin = \frac{\text{Nettowinst}}{\text{Omzet}} \times 100\%$
> **Voorbeeld:** 32,5%.
* **Return on Equity (ROE):** De winst als percentage van het geïnvesteerde eigen vermogen.
> **Formule:** $ROE = \frac{\text{Winst}}{\text{Eigen Vermogen}} \times 100\%$
> **Voorbeeld:** 10% bij 40.000 euro winst en 400.000 euro eigen vermogen.
* **Return on Capital:** De winst als percentage van het totale geïnvesteerde kapitaal (eigen vermogen + schulden).
> **Formule:** $Return\ on\ Capital = \frac{\text{Winst}}{\text{Totale Kapitaal}} \times 100\%$
> **Voorbeeld:** 3,3% bij 40.000 euro winst en 1.200.000 euro totaal kapitaal.
### 1.2.4 Purchase & Logistics
* **Purchase Manager KPI's:**
* **Cost Savings:** Gerealiseerde kostenreductie in de inkoop.
> **Berekening:** Vergelijking van inkoopkosten per artikel over verschillende periodes.
> **Voorbeeld:** Een besparing van 8% door verbeterde onderhandelingen en factuurcontrole.
* **Supplier Lead Time:** De gemiddelde levertijd van een leverancier.
> **Berekening:** Gemiddelde van de leverdagen over meerdere orders.
> **Voorbeeld:** Rexel met een gemiddelde lead time van 1,8 dagen versus Cebeo met 2,6 dagen.
* **On-time Delivery (OTD):** Het percentage leveringen dat op tijd plaatsvindt.
> **Formule:** $OTD = \frac{\text{Aantal op tijd geleverde orders}}{\text{Totaal aantal geleverde orders}} \times 100\%$
> **Voorbeeld:** 80%.
* **Purchase Cycle Time:** De tijd tussen het plaatsen van een bestelling en de ontvangst van de goederen.
> **Berekening:** Datum van ontvangst minus datum van bestelling.
> **Voorbeeld:** Gemiddeld 12,86 dagen.
* **Invoice Dispute Rate:** Het percentage facturen waarover discussie is.
* **Supplier Defect Rate:** Het percentage geleverde producten dat defect is.
* **Inventory/Warehouse/Logistics Manager KPI's:**
* **Inventory Turnover:** Hoe vaak de voorraad in een bepaalde periode wordt verkocht en vervangen. Een hogere turnover is meestal wenselijk.
> **Formule:** $Inventory\ Turnover = \frac{\text{Kosten van verkochte goederen (COGS)}}{\text{Gemiddelde voorraadwaarde}}$
> **Voorbeeld:** 4, wat betekent dat de voorraad ongeveer 4 keer per jaar wordt verkocht.
* **Backorder Rate:** Het percentage orders dat niet direct geleverd kan worden door voorraadtekorten.
> **Formule:** $Backorder\ Rate = \frac{\text{Aantal backorders}}{\text{Totaal aantal orders}} \times 100\%$
> **Voorbeeld:** 5%.
### 1.2.5 HR
* **HR Manager KPI's:**
* **Employee Turnover Rate:** Het percentage werknemers dat het bedrijf verlaat in een bepaalde periode.
> **Formule:** $Employee\ Turnover\ Rate = \frac{\text{Aantal vertrokken werknemers}}{\text{Gemiddeld aantal werknemers}} \times 100\%$
> **Voorbeeld:** 19,42%.
* **Time to Hire:** De gemiddelde tijd die nodig is om een vacature in te vullen.
> **Berekening:** Gemiddelde van de dagen per ingevulde positie.
> **Voorbeeld:** 32 dagen.
* **Cost to Hire:** De gemiddelde kosten per ingevulde vacature.
> **Berekening:** Totale kosten gedeeld door het aantal ingevulde posities.
> **Voorbeeld:** 2.800 euro.
* **Employee Productivity:** De output per werknemer of per gewerkt uur.
> **Formule:** $Employee\ Productivity = \frac{\text{Output}}{\text{Input}}$
> **Voorbeeld:** 53 euro per uur of 2.666 euro per werknemer per week.
## 1.3 Data, Business Intelligence en Big Data
### 1.3.1 Van data naar inzicht en actie
Het proces van datagedreven besluitvorming omvat meerdere stappen:
1. **Rauwe data:** De oorspronkelijke gegevens.
2. **Informatie:** Gegevens krijgen betekenis door labelling en context.
3. **Kennis:** Interpretatie van informatie en het leggen van verbanden.
4. **Actie:** Op basis van kennis de juiste stappen ondernemen.
> **Tip:** Dit proces kan gevisualiseerd worden als een trechter die ruwe data transformeert naar bruikbare inzichten.
### 1.3.2 Business Intelligence (BI)
Business Intelligence omvat de processen en tools die data verzamelen, organiseren, analyseren en presenteren om betere zakelijke beslissingen mogelijk te maken. Het doel is om de juiste informatie, op het juiste moment en op de juiste manier beschikbaar te stellen.
* **Kerncomponenten van een BI-systeem:** Databases, rapportages, dashboards, analyses.
* **Tools:** Er zijn diverse BI-tools beschikbaar, zoals Power BI, Qlik, Tableau, en geïntegreerde oplossingen binnen ERP-systemen.
* **Corporate War Room/Decision Cockpit:** Centraal punt waar diverse data en analyses samenkomen om realtime besluitvorming te ondersteunen.
### 1.3.3 Big Data
Big Data verwijst naar datasets die zo groot, complex en snel veranderend zijn dat ze niet met traditionele dataverwerkingssystemen kunnen worden beheerd. De "3 V's" kenmerken Big Data:
* **Volume:** Enorme hoeveelheden data.
> **Voorbeeld:** De wereldwijde data-creatie wordt geschat op 181 zettabytes per jaar in 2025.
* **Velocity:** De snelheid waarmee data wordt gegenereerd en moet worden verwerkt.
* **Variety:** De diversiteit aan datatypes, inclusief ongestructureerde data zoals tekst, afbeeldingen en video's, naast gestructureerde data in tabellen.
> **Tip:** De aard van data is veranderd van voornamelijk gestructureerde data in tabellen naar een mix van gestructureerde, semi-gestructureerde en ongestructureerde data.
### 1.3.4 AI, Machine Learning en Deep Learning
Kunstmatige Intelligentie (AI) en Machine Learning (ML) zijn essentieel voor het analyseren van Big Data.
* **Essentiële componenten voor AI-systemen:** Slimme algoritmen, rekenkracht, en veel data.
* **Neurale netwerken:** Geïnspireerd door de structuur en werking van het menselijk brein, simuleren deze netwerken neuronen om complexe patronen te leren.
* **Machine Learning:** Systemen die leren van data zonder expliciet geprogrammeerd te worden.
* **Supervised Learning:** Algoritmes worden getraind met gelabelde data (input-output paren). Feedback wordt gebruikt om de prestaties te verbeteren.
> **Tip:** Hoe meer data een machine learning model krijgt, hoe beter het wordt.
* **Deep Learning:** Een geavanceerdere vorm van ML die gebruik maakt van meerdere lagen neurale netwerken, waardoor complexe abstracties kunnen worden geleerd, vaak voorbij menselijke interpretatie.
## 1.4 Datagedreven besluitvormingstechnieken
De analyse van data vereist een gestructureerd proces.
### 1.4.1 Het data-analyseproces
Het data-analyseproces bestaat uit de volgende stappen:
1. **Definieer het probleem:** Stel duidelijke doelstellingen en verwachte uitkomsten vast.
> **Goed voorbeeld:** "De financiële afdeling wil een duidelijk overzicht van de maandelijkse evolutie van inkomsten versus uitgaven."
2. **Verzamel de data:** Haal data uit interne databases, via connectoren, API's, web scraping, of publieke datasets.
3. **Voorbereiding (Pre-processing):** Reinig de data door duplicaten te verwijderen, ontbrekende waarden aan te vullen (bijv. met gemiddelde of mediaan), en formaten te standaardiseren. Categorische data moet mogelijk worden omgezet naar numerieke data.
> **Tip:** De voorbereiding van data kan tot 80% van de totale analyse tijd in beslag nemen.
4. **Analyseer de data:** Ontdek patronen, trends en relaties met behulp van statistische technieken.
* **Basale statistieken:** Gemiddelde (mean), mediaan (median), variantie (variance).
> **Formule voor variantie:** $Variance = \frac{\sum (x_i - \bar{x})^2}{n}$ (waarbij $x_i$ de individuele datapunten zijn, $\bar{x}$ het gemiddelde, en $n$ het aantal datapunten).
* **Correlaties, trends, outliers:** Identificeer verbanden tussen variabelen en afwijkingen.
* **Geavanceerde methoden:** Regressie (voorspellen van een afhankelijke variabele), clustering (groeperen van vergelijkbare datapunten), en classificatie (toewijzen van datapunten aan categorieën).
5. **Visualiseer de data:** Presenteer de bevindingen grafisch met behulp van dashboards en rapporten.
6. **Interpreteer en communiceer de resultaten:** Vertaal technische bevindingen naar begrijpelijke zakelijke inzichten en neem de juiste beslissingen.
> **Tip:** Gebruik duidelijke taal en kies de juiste visualisatievorm voor de boodschap. Vermijd misleiding en geef context bij grafieken.
### 1.4.2 Databases en DBMS
* **Database (DB):** Een georganiseerde verzameling gerelateerde data.
* **Database Management System (DBMS):** Software die als interface dient tussen de database en gebruikers (personen of applicaties).
#### 1.4.2.1 Relational Database Management Systems (RDBMS)
* **Structuur:** Data wordt opgeslagen in tabellen met rijen en kolommen, vergelijkbaar met spreadsheets.
* **Primary Key:** Een unieke identificatie voor elke rij in een tabel.
* **Foreign Key:** Verwijst naar de Primary Key van een andere tabel om relaties te leggen.
* **SQL (Structured Query Language):** De standaardtaal voor het manipuleren van relationele databases (CREATE, INSERT, UPDATE, SELECT).
* **Voorbeelden:** Microsoft SQL Server, MySQL, Oracle Database, IBM DB2.
#### 1.4.2.2 Non-relational Databases (NoSQL)
* **Toepassing:** Vaak gebruikt voor Big Data vanwege de flexibiliteit bij het opslaan van ongestructureerde en semi-gestructureerde data.
* **Flexibiliteit:** Data is niet strikt gestructureerd in tabellen.
* **Document Stores:** Een type NoSQL database dat documenten opslaat (vaak in JSON-formaat), wat flexibele datastructuren toelaat.
> **JSON (JavaScript Object Notation):** Een lichtgewicht data-uitwisselingsformaat dat structuur en flexibiliteit biedt.
> **Tip:** NoSQL databases worden ook wel "Not Only SQL" genoemd, wat hun flexibiliteit benadrukt.
## 1.5 Bedrijfstools, ERP en Datagedreven Organisaties
### 1.5.1 ERP (Enterprise Resource Planning)
* **Definitie:** Een geïntegreerd softwaresysteem dat bedrijfsprocessen beheert en data centraliseert in één database.
* **Voordelen:**
* **Data-integratie:** Gegevens worden slechts één keer ingevoerd, wat fouten en duplicaten vermindert.
* **Procesoptimalisatie:** Stroomlijnt en koppelt verschillende bedrijfsprocessen (bv. van verkooporder naar productieorder).
* **Verbeterde rapportage:** Makkelijker om rapporten en analyses te genereren vanuit één centrale databron.
* **Single Source of Truth:** Zorgt voor consistentie en beschikbaarheid van data.
* **Overwegingen bij ERP-implementatie:**
* Niet elk bedrijf heeft een complex ERP-systeem nodig; de omvang, marktsector en specifieke behoeften spelen een rol.
* Voor kleine en middelgrote bedrijven kan een combinatie van geïntegreerde, gespecialiseerde tools een alternatief zijn.
* Implementatie is kostbaar en tijdrovend; risico op 'overbuying' (te veel functies die niet gebruikt worden).
### 1.5.2 Business Tools en Integratie
* **Alternatieven voor ERP:** Een combinatie van gespecialiseerde tools (bv. CRM, boekhoudsoftware, planningstools) kan geïntegreerd worden.
* **API (Application Programming Interface):** Maakt de integratie tussen verschillende softwaretoepassingen mogelijk, vaak via cloud-gebaseerde oplossingen.
> **Voorbeeld:** Een API kan klantnamen en projectnummers uit verschillende systemen synchroniseren.
* **Custom Development vs. SaaS:** Het zelf ontwikkelen van een ERP-systeem is zelden kosteneffectief of duurzaam vergeleken met Software-as-a-Service (SaaS) oplossingen.
### 1.5.3 ERP en Business Intelligence
* **Synergie:** ERP-systemen vormen vaak de basis voor BI-activiteiten door de centrale opslag van bedrijfskritische data.
* **Opties voor BI-integratie:**
* **Vaste rapporten en dashboards binnen het ERP-systeem.**
* **Dynamische rapportages, soms met AI-ondersteuning.**
* **Integratie met externe, gespecialiseerde BI-tools** voor geavanceerdere analyses en visualisaties.
> **Tip:** "Als je het erin kunt stoppen, kun je het eruit halen" - een principe dat de relatie tussen ERP en data-uitvoer benadrukt.
## 1.6 Test jezelf
Dit gedeelte bevat vragen ter controle van de opgedane kennis over de behandelde onderwerpen.
---
# Data-analyse proces en technieken
Dit gedeelte behandelt de stappen van het data-analyseproces, van het definiëren van een probleem tot het visualiseren en communiceren van resultaten, inclusief statistische en machine learning technieken.
### 2.1 Het data-analyseproces
Het data-analyseproces is een gestructureerde aanpak om inzichten te verkrijgen uit data, leidend tot geïnformeerde beslissingen. De kernfasen zijn:
#### 2.1.1 Probleemdefinitie
* **Doel:** Duidelijke doelstellingen en verwachte resultaten vaststellen op basis van de context en de behoeften van de eindgebruikers.
* **Voorbeeld:** In plaats van "Laten we een financieel dashboard opzetten", een specifiekere formulering zoals "We hebben de financiële afdeling bevraagd en zij wensen een duidelijk maandelijks overzicht van de evolutie van de inkomsten ten opzichte van de uitgaven."
#### 2.1.2 Dataverzameling
* **Doel:** Data verzamelen vanuit diverse bronnen.
* **Methoden:**
* Interne databases
* Vooraf gebouwde connectoren
* Aangepaste integraties via API's
* Web scraping
* Excel-sheets
* Publiek beschikbare datasets (open data)
* Kaggle
#### 2.1.3 Data pre-processing (opschonen)
* **Doel:** De data voorbereiden voor analyse door deze schoon en gestandaardiseerd te maken. Dit is vaak de meest tijdrovende fase, soms tot 80% van de totale tijd.
* **Stappen:**
* **Dubbele data verwijderen:** Identificeren en verwijderen van redundante records.
* **Missing data aanpakken:**
* Proberen de ontbrekende waarden te achterhalen.
* Indien niet mogelijk (te kostbaar of tijdrovend), de data invullen met het gemiddelde (mean) of de mediaan.
* **Formatten standaardiseren:** Zorgen voor consistente dataformaten.
* **Categorische variabelen omzetten naar numerieke data:** Dit is vaak nodig omdat computers categorische data (tekst) minder direct kunnen verwerken dan numerieke data.
#### 2.1.4 Data-analyse
* **Doel:** Betekenisvolle patronen, trends en relaties in de data ontdekken. De gebruikte technieken hangen af van het analysedoel.
* **Technieken:**
* **Beschrijvende statistiek:**
* **Gemiddelde (Mean):** De som van alle waarden gedeeld door het aantal waarden.
$ \text{Mean} = \frac{\sum_{i=1}^{n} x_i}{n} $
* **Mediaan (Median):** De middelste waarde in een gesorteerde dataset.
* **Variantie (Variance):** Een maat voor de spreiding van de data rondom het gemiddelde.
$ \text{Variance} = \frac{\sum_{i=1}^{n} (x_i - \text{Mean})^2}{n} $
* **Correlaties, trends en uitschieters (outliers):**
* **Correlatie:** Een statistische maat die de sterkte en richting van de lineaire relatie tussen twee variabelen aangeeft. Een positieve correlatie betekent dat als de ene variabele toeneemt, de andere ook neigt toe te nemen.
* **Trends:** Een algemene richting of beweging in de data over tijd.
* **Uitschieters (Outliers):** Datapunten die significant afwijken van de andere observaties. Deze kunnen worden verwijderd of vervangen door een gemiddelde om de analyse niet te veel te beïnvloeden.
* **Geavanceerde technieken (Machine Learning):**
* **Regressie:** Een techniek om de relatie tussen een afhankelijke variabele en een of meer onafhankelijke variabelen te modelleren. Het doel is om voorspellingen te doen.
* *Voorbeeld:* Voor elke extra euro die aan advertenties wordt uitgegeven, nemen de verkopen gemiddeld met €4,63 toe.
* **Clustering:** Een techniek om datapunten te groeperen op basis van hun gelijkenis, zonder vooraf gedefinieerde groepen.
* *Voorbeeld:* Klanten indelen in verschillende segmenten (bv. voor promoties, loyaliteitsprogramma's, VIP-behandeling) op basis van hun aankoopgedrag.
* **Classificatie:** Een techniek om datapunten toe te wijzen aan vooraf gedefinieerde categorieën.
* *Voorbeeld:* Voorspellen of een klant waarschijnlijk een lening zal terugbetalen of niet, op basis van historische data.
* **Tip:** Voor de toepassing van deze geavanceerde technieken op grote datasets zijn machine learning-algoritmen en gespecialiseerde software nodig.
#### 2.1.5 Data-visualisatie
* **Doel:** De geanalyseerde data op een begrijpelijke en visueel aantrekkelijke manier presenteren.
* **Principe:** "Een beeld zegt meer dan duizend woorden." Effectieve visualisaties helpen om patronen en inzichten snel te communiceren.
* **Belangrijk:** De keuze van de juiste grafiek voor de juiste situatie is cruciaal.
#### 2.1.6 Interpretatie en communicatie van resultaten
* **Doel:** De bevindingen uit de analyse vertalen naar bruikbare inzichten en deze effectief communiceren aan belanghebbenden.
* **Communicatie:**
* **Gebruik duidelijke taal:** Vermijd jargon en technische termen waar mogelijk.
* **Vermijd misleiding:** Zorg ervoor dat visualisaties niet de werkelijkheid vertekenen.
* **Begeleid het publiek:** Help hen bij het lezen en begrijpen van de grafieken.
* **Kies de juiste woordkeuze:**
* "Dit suggereert..." (wijst op een mogelijke oorzaak of trend)
* "Dit indiceert dat..." (sterker bewijs, meer vertrouwen in de conclusie)
* "De data impliceert dat..." (wat de cijfers indirect aangeven)
* "Dit zou kunnen betekenen dat..." (voorzichtige interpretatie, nuttig als correlatie ≠ causaliteit)
* **Voorbeeld:** Vertalen van een technische observatie ("De regressielijn heeft een R² van 0,87!") naar een zakelijke taal ("Dit suggereert dat 87% van de variatie in verkopen verklaard kan worden door onze marketinginspanningen.").
### 2.2 Data-analyse technieken
Dit gedeelte beschrijft diverse technieken die gebruikt kunnen worden binnen de analysefase van het data-analyseproces.
#### 2.2.1 Basis statistische metingen
* **Gemiddelde (Mean):** De som van alle waarden gedeeld door het aantal waarden.
$ \text{Mean} = \frac{\sum_{i=1}^{n} x_i}{n} $
* **Mediaan (Median):** De middelste waarde in een gesorteerde dataset.
* **Variantie (Variance):** Een maat voor de spreiding van de data rondom het gemiddelde.
$ \text{Variance} = \frac{\sum_{i=1}^{n} (x_i - \text{Mean})^2}{n} $
#### 2.2.2 Correlatie, trends en uitschieters
* **Correlatie:** Meet de sterkte en richting van de lineaire relatie tussen twee variabelen.
* **Trends:** Identificeren van algemene bewegingen of patronen in de data over tijd.
* **Uitschieters (Outliers):** Punten die significant afwijken van de algemene datadistributie. Deze kunnen de analyse vertekenen en worden vaak apart behandeld.
#### 2.2.3 Geavanceerde technieken (Machine Learning)
* **Regressie:** Modelleren van de relatie tussen variabelen om voorspellingen te doen.
* *Voorbeeld:* Het voorspellen van verkoopprestaties op basis van advertentie-uitgaven.
* **Clustering:** Groeperen van vergelijkbare datapunten zonder vooraf gedefinieerde groepen.
* *Voorbeeld:* Klantsegmentatie op basis van aankoopgedrag.
* **Classificatie:** Toewijzen van datapunten aan bestaande categorieën.
* *Voorbeeld:* Voorspellen van het risico op wanbetaling van een lening.
### 2.3 Rol van databases en BI-tools
#### 2.3.1 Databases
* **Database (DB):** Een georganiseerde verzameling van gerelateerde data.
* **Database Management System (DBMS):** Software die fungeert als interface tussen de gebruiker (persoon of software) en de database.
#### 2.3.2 Relationele databases (RDBMS)
* **Structuur:** Data wordt opgeslagen in tabellen met rijen en kolommen, vergelijkbaar met spreadsheets.
* **Primaire sleutel (Primary Key):** Een kolom met unieke waarden die elke rij identificeert.
* **Vreemde sleutel (Foreign Key):** Een kolom in de ene tabel die verwijst naar de primaire sleutel in een andere tabel, om relaties tussen tabellen te leggen.
* **SQL (Structured Query Language):** De standaardtaal voor het manipuleren van relationele databases (bv. `CREATE TABLE`, `INSERT`, `UPDATE`, `SELECT`).
* **Voorbeelden:** Microsoft SQL Server, MySQL, Oracle Database, IBM DB2.
#### 2.3.3 Niet-relationele databases (NoSQL)
* **Toepassing:** Vaak gebruikt voor Big Data vanwege de flexibiliteit met grote volumes aan ongestructureerde data.
* **Kenmerken:** Niet gebaseerd op het relationele model, ontworpen voor schaalbaarheid en snelheid.
* **Types:** Document stores (werken met formaten zoals JSON), key-value stores, wide-column stores, graph databases.
* **JSON (JavaScript Object Notation):** Een flexibel data-uitwisselingsformaat dat complexe datastructuren kan opslaan.
* *Voorbeeld van flexibiliteit:* In JSON kunnen optionele velden worden weggelaten, wat opslagruimte bespaart vergeleken met tabellen waar lege cellen nog steeds ruimte innemen.
#### 2.3.4 Big Data
* **Definitie:** Grote hoeveelheden ongestructureerde en soms incomplete data die niet efficiënt verwerkt kunnen worden met conventionele databasesystemen.
* **De 3 V's:**
* **Volume:** De enorme hoeveelheid data die wordt gegenereerd.
* **Velocity:** De snelheid waarmee data wordt gecreëerd en verwerkt.
* **Variety:** De diversiteit aan dataformaten (gestructureerd, ongestructureerd, semi-gestructureerd).
#### 2.3.5 Business Intelligence (BI)
* **Doel:** Data omzetten van ruwe data naar informatie, kennis en uiteindelijk actie, om geïnformeerde beslissingen te nemen.
* **Proces:**
1. **Ruwe data:** De bron data.
2. **Informatie:** Data met betekenis en labels.
3. **Kennis:** Interpretatie van informatie met context.
4. **Actie:** Beslissingen nemen op basis van kennis.
* **Tools:** BI-tools helpen bij het verzamelen, organiseren, analyseren en visualiseren van data (bv. Power BI, Qlik).
* **Corporate War Room/Decision Cockpit:** Centraal punt in grote organisaties waar managers toegang hebben tot realtime data en dashboards voor besluitvorming.
#### 2.3.6 Artificial Intelligence (AI), Machine Learning en Deep Learning
* **Vereisten voor AI:**
* Slimme algoritmen
* Rekenkracht (computing power)
* Grote hoeveelheden data
* **Neurale netwerken:** Gesimuleerde computernetwerken die de werking van biologische neuronen nabootsen. Ze zijn in staat om te "leren" van data.
* **Machine Learning (ML):** Systemen die leren van data om hun prestaties te verbeteren zonder expliciet geprogrammeerd te worden.
* **Supervised learning:** Het algoritme wordt getraind op gelabelde datasets (input-output paren). Feedback wordt gebruikt om de parameters van het algoritme te optimaliseren.
* **Deep Learning:** Een subset van machine learning die gebruik maakt van meerdere lagen van neurale netwerken (diepe neurale netwerken) om complexe patronen te leren, vaak buiten menselijk begrip.
### 2.4 Bedrijfsinstrumenten en ERP
#### 2.4.1 Enterprise Resource Planning (ERP)
* **Definitie:** Een softwarepakket dat alle kernprocessen van een bedrijf integreert in één systeem met één centrale database.
* **Voordelen:**
* Gegevens worden slechts één keer ingevoerd, wat tijd bespaart en risico's op fouten vermindert.
* Eenvoudige koppeling van processen (bv. verkooporder naar productieorder).
* Gestroomlijnde bedrijfsprocessen.
* Verbeterde rapportagemogelijkheden voor Business Intelligence.
* Eén waarheid (single source of truth).
* **Nadelen/Overwegingen:**
* Niet alle bedrijven hebben een volledig ERP-systeem nodig.
* Implementatie is kostbaar en tijdrovend.
* Risico op "overkopen" van functionaliteiten die niet gebruikt worden.
* Verandering kan weerstand oproepen bij medewerkers.
#### 2.4.2 Alternatieven voor ERP
* **Integratie van verschillende bedrijfstools:** Voor sommige bedrijven kan een combinatie van gespecialiseerde, geïntegreerde tools een betere oplossing zijn dan een allesomvattend ERP-systeem.
* **Voorbeelden van tools:** CRM-systemen, boekhoudsoftware, planningssoftware, e-mailmarketingtools.
#### 2.4.3 API (Application Programming Interface)
* **Doel:** Stelt verschillende softwareapplicaties in staat om met elkaar te communiceren en data uit te wisselen.
* **Toepassing:** Cruciaal voor het integreren van cloudgebaseerde software en het koppelen van ERP-systemen met andere tools (bv. CRM, BI, webshops).
### 2.5 Key Performance Indicators (KPI's) per afdeling
KPI's zijn meetbare waarden die aangeven hoe effectief een bedrijf of een afdeling presteert ten opzichte van strategische doelstellingen.
#### 2.5.1 Marketing & Sales
* **Cost per Click (CPC):** De kosten per keer dat op een advertentie wordt geklikt.
$ \text{CPC} = \frac{\text{Totale advertentie kosten}}{\text{Aantal klikken}} $
* **Click-through Rate (CTR):** Het percentage ontvangers van een e-mail dat op een link klikt.
$ \text{CTR} = \frac{\text{Aantal klikken}}{\text{Aantal geopende e-mails}} \times 100\% $
* **Conversieratio (Conversion Rate):** Het percentage websitebezoekers dat een gewenste actie uitvoert (bv. aankoop).
$ \text{Conversieratio} = \frac{\text{Aantal conversies}}{\text{Totaal aantal bezoekers}} \times 100\% $
* **Return on Ads Spend (ROAS):** De omzet die wordt gegenereerd per euro uitgegeven aan advertenties. Moet groter zijn dan 1 om winstgevend te zijn.
$ \text{ROAS} = \frac{\text{Extra omzet door campagne}}{\text{Campagnekosten}} $
* **Customer Acquisition Cost (CAC):** De totale kosten voor verkoop en marketing gedeeld door het aantal nieuw verkregen klanten.
$ \text{CAC} = \frac{\text{Totale kosten sales en marketing}}{\text{Aantal nieuwe klanten}} $
* **Customer Lifetime Value (CLV):** De totale verwachte winst die een klant genereert gedurende de gehele relatie met het bedrijf. Het is cruciaal dat CLV hoger is dan CAC ($ \text{CLV} > \text{CAC} $).
#### 2.5.2 Operations
* **Productiviteit (Productivity):** Output gedeeld door input.
$ \text{Productiviteit} = \frac{\text{Output}}{\text{Input}} $
* *Voorbeeld:* Aantal geproduceerde eenheden per uur of GDP per gewerkt uur.
* **Doorvoer (Throughput):** De hoeveelheid output geproduceerd over een bepaalde tijdseenheid, rekening houdend met operationele tijd.
$ \text{Doorvoer} = \frac{\text{Totaal geproduceerde eenheden}}{\text{Effectieve productietijd}} $
* **Productiekosten per eenheid (Manufacturing Cost per Unit):** Totale kosten (grondstoffen + arbeidsuren + machinekosten) gedeeld door het aantal geproduceerde eenheden.
* **Overall Equipment Effectiveness (OEE):** Een maatstaf voor de efficiëntie van productieapparatuur, berekend als het product van Beschikbaarheid, Prestatie en Kwaliteit.
$ \text{OEE} = \text{Beschikbaarheid} \times \text{Prestatie} \times \text{Kwaliteit} $
#### 2.5.3 Purchase & Logistics
* **Kostenbesparing (Cost Savings):** Gerealiseerde reductie in inkoopprijs of efficiëntieverbeteringen.
$ \text{Kostenbesparing} = \frac{\text{Nieuwe kosten per eenheid} - \text{Oude kosten per eenheid}}{\text{Oude kosten per eenheid}} \times 100\% $
* **Leverancierslevertijd (Supplier Lead Time):** De gemiddelde tijd die een leverancier nodig heeft om een bestelling te leveren.
$ \text{Leverancierslevertijd} = \frac{\sum \text{Levertijden}}{\text{Aantal bestellingen}} $
* **Tijdigheidspercentage levering (On-time Delivery - OTD):** Het percentage leveringen dat binnen de afgesproken termijn wordt voltooid.
$ \text{OTD} = \frac{\text{Aantal tijdig geleverde bestellingen}}{\text{Totaal aantal bestellingen}} \times 100\% $
* **Voorraadomloopsnelheid (Inventory Turnover):** Hoe vaak de voorraad gedurende een periode wordt verkocht en vervangen. Een hogere omloopsnelheid is over het algemeen wenselijk.
$ \text{Voorraadomloopsnelheid} = \frac{\text{Kosten van verkochte goederen (COGS)}}{\text{Gemiddelde voorraadwaarde}} $
* **Backorderpercentage (Backorder Rate):** Het percentage orders dat niet direct uit voorraad geleverd kan worden.
$ \text{Backorderpercentage} = \frac{\text{Aantal backorders}}{\text{Totaal aantal orders}} \times 100\% $
#### 2.5.4 Finance
* **Werkkapitaal (Working Capital):** Het verschil tussen vlottende activa en kortlopende schulden. Een positief werkkapitaal is essentieel voor kortetermijnfinanciële gezondheid.
$ \text{Werkkapitaal} = \text{Vlottende activa} - \text{Kortlopende schulden} $
* **Current Ratio:** Verhouding tussen vlottende activa en kortlopende schulden, een maatstaf voor de liquiditeit.
$ \text{Current Ratio} = \frac{\text{Vlottende activa}}{\text{Kortlopende schulden}} $
* **Quick Ratio (Acid-test Ratio):** Vergelijkbaar met de Current Ratio, maar exclusief voorraden. Geeft een beeld van de onmiddellijke liquiditeit.
$ \text{Quick Ratio} = \frac{\text{Vlottende activa} - \text{Voorraden}}{\text{Kortlopende schulden}} $
* **Schuldratio (Debt Ratio):** Geeft aan welk deel van de activa wordt gefinancierd met schulden.
$ \text{Schuldratio} = \frac{\text{Totale schulden}}{\text{Totale activa}} \times 100\% $
* **Brutowinstmarge (Gross Profit Margin):** Het percentage van de omzet dat overblijft na aftrek van de kosten van verkochte goederen.
$ \text{Brutowinstmarge} = \frac{\text{Brutowinst}}{\text{Omzet}} \times 100\% $
* **Nettowinstmarge (Net Profit Margin):** Het percentage van de omzet dat overblijft na aftrek van alle kosten.
$ \text{Nettowinstmarge} = \frac{\text{Nettowinst}}{\text{Omzet}} \times 100\% $
* **Rentabiliteit eigen vermogen (Return on Equity - ROE):** Hoeveel winst er wordt gegenereerd ten opzichte van het geïnvesteerde eigen vermogen.
$ \text{ROE} = \frac{\text{Nettowinst}}{\text{Eigen vermogen}} \times 100\% $
* **Rentabiliteit totaal geïnvesteerd vermogen (Return on Capital - ROC):** Hoeveel winst er wordt gegenereerd ten opzichte van het totale geïnvesteerde vermogen (eigen vermogen + schulden).
$ \text{ROC} = \frac{\text{Nettowinst}}{\text{Totaal geïnvesteerd vermogen}} \times 100\% $
#### 2.5.5 Human Resources (HR)
* **Medewerkerverloop (Employee Turnover Rate):** Het percentage medewerkers dat een organisatie verlaat binnen een bepaalde periode.
$ \text{Medewerkerverloop} = \frac{\text{Aantal vertrokken medewerkers}}{\text{Gemiddeld aantal medewerkers}} \times 100\% $
* **Doorlooptijd voor aanstelling (Time to Hire):** De gemiddelde tijd die nodig is om een vacature te vervullen.
* **Kosten per aanstelling (Cost to Hire):** De gemiddelde kosten die gepaard gaan met het werven van een nieuwe medewerker.
* **Werknemersproductiviteit (Employee Productivity):** De output van werknemers per eenheid van input (bv. per uur of per medewerker).
$ \text{Werknemersproductiviteit} = \frac{\text{Output}}{\text{Input}} $
---
# Business Intelligence, Big Data en AI
Dit studieonderwerp duikt in de fundamenten van Business Intelligence, de kenmerken en implicaties van Big Data, en de rol van kunstmatige intelligentie, machine learning en deep learning in het moderne zakelijke landschap.
## 3. Business intelligence, big data en ai
### 3.1 Van data naar inzicht en actie: Business Intelligence (BI)
Business Intelligence (BI) is het proces van het verzamelen, verwerken en analyseren van bedrijfsgegevens om inzichten te verkrijgen die leiden tot betere, geïnformeerde beslissingen. Het transformeert ruwe data naar bruikbare informatie, kennis en uiteindelijk tot concrete actie.
**De kern van BI bestaat uit de volgende stappen:**
* **Ruwe data (RAW DATA):** Dit zijn de onbewerkte gegevens die worden gegenereerd tijdens bedrijfsactiviteiten.
* **Informatie (INFORMATION):** Data krijgt betekenis door deze te labelen of te groeperen. Bijvoorbeeld, gespecificeerde verkoopcijfers voor een bepaalde periode.
* **Kennis (KNOWLEDGE):** Informatie wordt geïnterpreteerd en voorzien van context. Dit omvat het begrijpen van trends, patronen en oorzakelijke verbanden. Bijvoorbeeld, een significante daling in de verkoopcijfers kan worden verklaard door externe factoren zoals een oorlog.
* **Actie (ACTION):** Op basis van de verkregen kennis worden beslissingen genomen en acties ondernomen om bedrijfsdoelstellingen te bereiken. Bijvoorbeeld, het sluiten van winkels om kosten te besparen na een significante omzetdaling.
**De rol van BI in het bedrijfsleven:**
BI helpt bedrijven bij het beantwoorden van cruciale vragen en het nemen van strategische beslissingen. Dit omvat het monitoren van prestaties via Key Performance Indicators (KPI's), het identificeren van kansen en bedreigingen, en het optimaliseren van bedrijfsprocessen. BI-tools zijn essentieel voor het creëren van dashboards en rapporten die een 'beslissingscockpit' vormen, waardoor managers snel en effectief kunnen reageren op veranderende omstandigheden.
> **Tip:** Elke organisatie, ongeacht de omvang, kan profiteren van een vorm van business intelligence om gegevensgestuurde beslissingen te nemen.
**BI-tools:**
Er zijn talloze BI-tools op de markt, die over het algemeen vergelijkbare functionaliteiten bieden. Deze tools integreren vaak met bestaande bedrijfssystemen zoals ERP (Enterprise Resource Planning) of bieden mogelijkheden voor het creëren van aangepaste dashboards en rapporten.
### 3.2 Big Data: Volume, Variëteit en Snelheid
Big Data verwijst naar datasets die zo groot, complex en snel veranderlijk zijn dat traditionele dataverwerkingssystemen er moeite mee hebben. De belangrijkste kenmerken van Big Data worden vaak samengevat in de '3 V's':
* **Volume:** De enorme hoeveelheid data die wordt gegenereerd. Wereldwijd wordt dagelijks een astronomisch aantal terabytes aan data gecreëerd, met een verwachte groei tot honderden zettabytes in de nabije toekomst.
* **Variëteit (VARIETY):** Data komt uit diverse bronnen en in verschillende formaten. Dit omvat gestructureerde data (zoals in databases en spreadsheets), semi-gestructureerde data (zoals XML of JSON) en ongestructureerde data (zoals tekst, afbeeldingen, video's, social media posts, sensordata).
* **Snelheid (VELOCITY):** De snelheid waarmee data wordt gegenereerd en verwerkt. Real-time dataverwerking is vaak cruciaal, vooral bij toepassingen zoals financiële transacties of IoT-sensoren.
**Kenmerken van Big Data:**
In tegenstelling tot traditionele bedrijfsdatabases, die vaak netjes gestructureerde data in rijen en kolommen bevatten, kenmerkt Big Data zich door:
* **Grote hoeveelheden data:** Significante schaal.
* **Geen controle op volledigheid:** Data kan ontbrekende componenten bevatten.
* **Afwezigheid van orde:** Vaak ongestructureerd of semi-gestructureerd.
* **Veranderlijkheid:** De hoeveelheid data kan op elk moment aanzienlijk variëren.
Dit leidt tot een overwicht aan ongestructureerde data, wat traditionele database-systemen buiten spel zet.
### 3.3 Kunstmatige Intelligentie, Machine Learning en Deep Learning
Kunstmatige Intelligentie (AI) omvat systemen die taken kunnen uitvoeren die normaal menselijke intelligentie vereisen. De recente doorbraken in AI zijn te danken aan drie essentiële pijlers:
* **Slimme algoritmen:** Geavanceerde methoden voor dataverwerking en patroonherkenning.
* **Rekenkundige kracht (Computing power):** De toegenomen verwerkingscapaciteit van computers, met name gespecialiseerde chips.
* **Veel data:** De beschikbaarheid van grote datasets om algoritmen te trainen.
#### 3.3.1 Neurale Netwerken en Machine Learning
**Neurale netwerken** zijn computerarchitecturen die de structuur en functie van biologische neurale netwerken in het menselijk brein nabootsen. Ze zijn opgebouwd uit onderling verbonden 'neuronen' die informatie verwerken.
**Machine learning (ML)** is een tak van AI die systemen in staat stelt te leren van data zonder expliciet geprogrammeerd te zijn. Een kernconcept is het 'zelflerende systeem'.
**Hoe neurale netwerken werken:**
Elke 'neuron' in een neuraal netwerk voert een berekening uit op basis van zijn inputs en past deze aan. Een reeks inputs leidt tot een output, die vervolgens wordt geëvalueerd. Via een feedbacklus worden de reacties verbeterd, wat leidt tot 'leren'.
**Machine learning aanpak:**
* **Input:** Data die aan het systeem wordt gevoerd.
* **Output:** Het resultaat of de voorspelling van het systeem.
* **Feedback:** Vergelijking van de output met de verwachte output, wat leidt tot aanpassingen in het algoritme.
**Supervised Learning:**
Dit is een veelgebruikte vorm van machine learning waarbij het algoritme wordt getraind op gelabelde voorbeelden (input-output paren). Het systeem leert patronen uit deze voorbeelden om voorspellingen te doen op nieuwe, ongeziene data. De kwaliteit van de trainingdata en het leerproces bepalen de nauwkeurigheid van het model.
> **Tip:** Hoe meer relevante data aan het systeem wordt gevoed, hoe beter het algoritme en het uiteindelijke model worden.
**Voorbeeld van supervised learning:**
Een film-inkomsten voorspellingsmodel kan getraind worden met historische data, waarbij inputs zoals filmbudget, advertentiebudget, populariteit van acteurs en lanceringsdatum worden gekoppeld aan de daadwerkelijke inkomsten. Het model leert de relaties tussen deze factoren en kan zo de inkomsten van nieuwe films voorspellen.
#### 3.3.2 Deep Learning
**Deep learning** is een subveld van machine learning dat gebruik maakt van diepe neurale netwerken met meerdere lagen. Elke laag bouwt voort op de resultaten van de voorgaande lagen, wat resulteert in een complexe reeks van onderling verbonden formules.
**Kenmerken van Deep Learning:**
* **Meerdere lagen:** De informatie wordt in stappen verwerkt door verschillende 'diepe' lagen.
* **Complexe formules:** De berekeningen binnen de neuronen vormen een complex netwerk dat vaak moeilijk te doorgronden is voor mensen.
* **Automatische feature-extractie:** Deep learning-modellen kunnen zelfstandig relevante kenmerken uit de data extraheren, zonder dat deze expliciet gespecificeerd hoeven te worden.
Vanwege de complexiteit van de modellen, kunnen de interne werking en de redenen achter specifieke voorspellingen soms ongrijpbaar zijn, zelfs voor de ontwikkelaars.
### 3.4 Data-gedreven organisaties, business tools en ERP
Een **Enterprise Resource Planning (ERP)** systeem is een geïntegreerd softwarepakket dat bedrijfsprocessen beheert en automatiseert, gebruikmakend van een centrale database.
**Voordelen van ERP-systemen:**
* **Uniforme data:** Gegevens worden slechts één keer ingevoerd, wat tijd bespaart en het risico op fouten en duplicaten vermindert.
* **Procesintegratie:** Processen zoals verkooporders en productieorders kunnen naadloos aan elkaar worden gekoppeld.
* **Gestroomlijnde processen:** Automatisering van repetitieve taken.
* **Verbeterde rapportage (BI):** Data uit de centrale database maakt het eenvoudiger om BI-rapporten te genereren.
* **Centraal punt van waarheid:** Zorgt voor consistentie en beschikbaarheid van informatie, ongeacht personeelsverloop.
**ERP vs. geïntegreerde business tools:**
Niet elk bedrijf heeft een complex ERP-systeem nodig. Voor kleinere en middelgrote bedrijven kan een combinatie van geïntegreerde, gespecialiseerde business tools een betere oplossing zijn. Dit biedt flexibiliteit en voorkomt de kosten en complexiteit van een volledige ERP-implementatie.
**Integratie met API's:**
Moderne software, met name cloudgebaseerde oplossingen, kan vaak via **API's (Application Programming Interfaces)** met elkaar worden geïntegreerd. Dit stelt verschillende tools in staat om gegevens uit te wisselen en samen te werken.
> **Tip:** Kies software die past bij de specifieke behoeften van uw bedrijf. Het implementeren van de verkeerde software kan leiden tot inefficiëntie en frustratie.
**ERP en Business Intelligence:**
ERP-systemen vormen vaak de ruggengraat voor data en business intelligence. Ze leveren de data die nodig is voor BI-dashboards en rapportages. Dit kan direct binnen het ERP-systeem gebeuren met vaste of dynamische rapporten, of door externe BI-tools te integreren die de data uit het ERP halen.
### 3.5 De Data-analyseproces
Een gestructureerde aanpak is cruciaal voor effectieve data-analyse:
1. **Definieer het probleem (Define the problem):** Stel duidelijke doelen en verwachte resultaten vast, gebaseerd op de behoeften van eindgebruikers.
* **Slecht voorbeeld:** "Laten we een financieel dashboard opzetten."
* **Goed voorbeeld:** "We hebben de financiële afdeling bevraagd en zij willen een duidelijk overzicht van de evolutie van inkomsten ten opzichte van uitgaven op maandelijkse basis."
2. **Verzamel de data (Collecting the data):** Haal data op uit verschillende bronnen zoals interne databases, externe connectors, API's, web scraping, Excel-bestanden, of openbare datasets.
3. **Voorbereiding van de data (Pre-processing):** Dit is een cruciale stap die tot 80% van de tijd kan innemen. Het omvat:
* Opschonen van data: verwijderen van duplicaten, behandelen van ontbrekende waarden (door deze aan te vullen met het gemiddelde, de mediaan, of door ze te verwijderen indien mogelijk).
* Standaardiseren van formaten.
* Converteren van categorische variabelen naar numerieke data voor computers.
4. **Analyseer de data (Analyze the data):** Ontdek patronen, trends en relaties in de data met behulp van technieken zoals:
* **Basisstatistieken:** Gemiddelde (mean), mediaan (median), variantie (variance).
* **Correlaties en trends:** Identificeren van verbanden tussen variabelen en het volgen van ontwikkelingen over tijd.
* **Outliers:** Opsporen van extreme waarden die de analyse kunnen vertekenen.
* **Geavanceerde methoden:**
* **Regressie:** Voorspellen van een afhankelijke variabele op basis van één of meer onafhankelijke variabelen. Bijvoorbeeld, de relatie tussen advertentie-uitgaven en verkoopopbrengsten.
* **Clustering:** Groeperen van data-punten op basis van hun gelijkenissen. Dit kan helpen bij klantsegmentatie.
* **Classificatie:** Toewijzen van data-punten aan vooraf gedefinieerde categorieën. Bijvoorbeeld, het voorspellen of een klant waarschijnlijk zal wanbetalen.
5. **Visualiseer de data (Visualize the data):** Presenteer de inzichten op een begrijpelijke en visueel aantrekkelijke manier met behulp van grafieken en diagrammen. Een beeld zegt meer dan duizend woorden.
6. **Interpreteer en communiceer de resultaten (Interpreting & communicating the results):**
* **Communicatie:** Presenteer dashboards en rapporten helder en beknopt. Vermijd misleidende visualisaties.
* **Taalgebruik:** Vertaal technische bevindingen naar bedrijfstaal om de resultaten effectief over te brengen. Gebruik voorzichtig taalgebruik zoals "dit suggereert" of "dit duidt erop" om de mate van zekerheid aan te geven. Gebruik geen jargon zoals "R-kwadraat van 0,87" zonder context.
> **Tip:** Bij het communiceren van resultaten is het belangrijk om onderscheid te maken tussen correlatie en causaliteit. Een sterke correlatie betekent niet automatisch dat de ene variabele de andere veroorzaakt.
### 3.6 Databases en Datamanagement
Databases vormen de fundering voor het opslaan en ophalen van data binnen softwaretoepassingen. Een **Database Management Systeem (DBMS)** is de softwarelaag die communiceert tussen de gebruiker (persoon of software) en de daadwerkelijke database.
#### 3.6.1 Relational Database Management Systems (RDBMS)
RDBMS is gebaseerd op het **relationele model**, waarbij data wordt opgeslagen in tabellen (vergelijkbaar met spreadsheets) met rijen en kolommen.
* **Primaire sleutel (Primary Key):** Een unieke waarde die elke rij in een tabel identificeert (bv. `filmid`).
* **Vreemde sleutel (Foreign Key):** Een sleutel die verwijst naar de primaire sleutel van een andere tabel, om relaties tussen tabellen te leggen.
* **SQL (Structured Query Language):** De standaardtaal voor het manipuleren van data in relationele databases (aanmaken, invoegen, updaten, selecteren van data).
**Voorbeelden van RDBMS:** Microsoft SQL Server, MySQL, Oracle Database, IBM DB2.
In de praktijk wordt SQL-code meestal geschreven binnen softwaretoepassingen die vervolgens met de database communiceren, in plaats van direct in het DBMS te werken.
#### 3.6.2 Non-relational Databases (NoSQL)
NoSQL, wat staat voor "Not Only SQL", is een verzamelnaam voor databases die geen relationele tabellen gebruiken. Ze zijn ontworpen om grote hoeveelheden ongestructureerde data efficiënt op te slaan en te analyseren, wat aansluit bij de kenmerken van Big Data.
**Document Stores:** Een veelvoorkomend type NoSQL-database dat werkt met documenten in formaten zoals JSON. JSON biedt flexibiliteit door complexe data-structuren toe te staan binnen één item en alleen de benodigde ruimte te gebruiken. Een collectie in een document store is vergelijkbaar met een tabel in een RDBMS, en een document met een rij.
**Voordelen van NoSQL:**
* **Flexibiliteit:** Geschikt voor ongestructureerde en semi-gestructureerde data.
* **Schaalbaarheid:** Goed aangepast aan de groeiende volumes van Big Data.
* **Snelheid:** Ontworpen voor snelle data-invoer en -ophaling.
NoSQL-databases worden vaak gebruikt in toepassingen die grote, diverse datasets vereisen, zoals social media platforms, e-commerce sites en IoT-toepassingen.
---
# Databases en dataopslag
Dit gedeelte behandelt de fundamentele concepten van databases en database management systemen, inclusief relationele (RDBMS) en niet-relationele (NoSQL) databases, en hun toepassingen.
## 4. Databases en dataopslag
### 4.1 Introductie tot databases en DBMS
Een database (DB) is een verzameling van gerelateerde gegevens. Een database management system (DBMS) is een softwarelaag die fungeert als tussenpersoon tussen de gebruiker (een persoon of software) en de database zelf. Dit systeem beheert de opslag, organisatie en ophalen van gegevens. Softwaretoepassingen interageren doorgaans niet rechtstreeks met de database, maar gebruiken de DBMS om met de gegevens te communiceren via gestructureerde querytalen.
> **Tip:** Denk aan een DBMS als de bibliothecaris die helpt bij het vinden van specifieke boeken (gegevens) in de bibliotheek (database).
### 4.2 Soorten database management systemen
Er zijn twee hoofdtypen database management systemen: relationele databasesystemen (RDBMS) en niet-relationele databasesystemen (NoSQL).
#### 4.2.1 Relationele database management systemen (RDBMS)
RDBMS zijn gebaseerd op het relationele model, waarbij gegevens worden opgeslagen in tabellen bestaande uit rijen en kolommen, vergelijkbaar met spreadsheets.
* **Tabellen:** Gestructureerde verzamelingen van gegevens.
* **Rijen (records):** Vertegenwoordigen een enkele invoer of entiteit.
* **Kolommen (velden):** Vertegenwoordigen specifieke attributen van de entiteit.
* **Primaire sleutel (Primary Key):** Een kolom (of set kolommen) waarvan de waarde elke rij in een tabel uniek identificeert. Deze sleutel mag geen NULL-waarden bevatten.
* **Vreemde sleutel (Foreign Key):** Een kolom (of set kolommen) in een tabel die verwijst naar de primaire sleutel van een andere tabel. Dit creëert een relatie tussen de tabellen.
De standaardtaal voor het manipuleren van gegevens in RDBMS is **SQL (Structured Query Language)**. Met SQL kunnen gebruikers gegevens opvragen, invoegen, bijwerken en verwijderen.
**Voorbeelden van RDBMS:**
* Microsoft SQL Server
* MySQL
* Oracle Database
* IBM DB2
#### 4.2.2 Niet-relationele databases (NoSQL)
NoSQL (Not Only SQL) is een verzamelterm voor databasesystemen die geen relationele tabellen gebruiken voor dataopslag. Deze systemen zijn ontworpen om te schalen naar grote hoeveelheden ongestructureerde of semi-gestructureerde gegevens, wat vaak wordt gezien in de context van Big Data.
* **Big Data en NoSQL:** De drie V's van Big Data (Volume, Velocity, Variety) maken conventionele databasesystemen vaak ongeschikt voor verwerking. NoSQL-databases bieden een oplossing voor deze uitdagingen.
* **Documentopslagdatabases:** Een veelvoorkomend type NoSQL-database dat werkt met documenten, vaak in JSON-formaat. JSON (JavaScript Object Notation) is flexibel en maakt de opslag van complexe datastructuren mogelijk.
> **Voorbeeld van JSON-flexibiliteit:**
> ```json
> {
> "firstName": "John",
> "lastName": "Smith",
> "isAlive": true,
> "age": 25,
> "address": {
> "streetAddress": "21 2nd Street",
> "city": "New York",
> "state": "NY",
> "postalCode": "10021-3100"
> },
> "phoneNumbers": [
> { "type": "home", "number": "212 555-1234" },
> { "type": "office", "number": "646 555-4567" }
> ],
> "children": [],
> "spouse": null
> }
> ```
In tegenstelling tot tabellen waar lege velden ruimte innemen, gebruikt JSON alleen de benodigde ruimte. Dit maakt het efficiënter voor gegevens met variërende structuren.
* **NoSQL vs. SQL:** NoSQL-databases bieden een alternatief voor de strikte structuur van SQL-databases, waardoor ze sneller en flexibeler kunnen omgaan met diverse en omvangrijke datasets.
### 4.3 Databases in de software architectuur
Een database is een essentieel onderdeel van de architectuur van de meeste softwaretoepassingen. Het dient als de permanente opslagplaats voor gegevens die door de applicatie worden gebruikt en gegenereerd. Zonder een database zouden gegevens verloren gaan zodra de applicatie wordt afgesloten.
* **Locatie:** De database is een fundamenteel component op de achtergrond, dat gegevens persistent opslaat en beheert.
* **Interactie:** Softwarelagen bouwen voort op de DBMS om gegevens efficiënt te kunnen lezen, schrijven en manipuleren.
> **Tip:** Begrijpen hoe gegevens worden opgeslagen en opgehaald, is cruciaal voor het ontwerpen van efficiënte en schaalbare softwaretoepassingen.
---
# ERP-systemen en bedrijfsapplicaties
Dit document behandelt de rol van ERP-systemen en bedrijfsapplicaties in moderne organisaties, met een focus op hun voordelen, nadelen, integratie en alternatieven.
## 5. ERP-systemen en bedrijfsapplicaties
Enterprise Resource Planning (ERP)-systemen vormen het centrale zenuwstelsel van veel organisaties door bedrijfsprocessen te integreren en data in één centrale database te beheren. Dit leidt tot efficiëntieverbeteringen, minder fouten en betere besluitvorming door middel van Business Intelligence (BI). Echter, de implementatie is kostbaar en niet elk bedrijf heeft een complex ERP-systeem nodig. Alternatieven zoals het integreren van losse bedrijfsapplicaties via API's kunnen soms beter passen.
### 5.1 Wat is een ERP-systeem?
Een ERP-systeem is een geïntegreerde softwareoplossing die verschillende bedrijfsprocessen beheert en data opslaat in één centrale database. Dit principe van 'één software & één database' zorgt ervoor dat informatie slechts één keer ingevoerd hoeft te worden, wat tijd bespaart en het risico op fouten en duplicaten vermindert. Processen kunnen eenvoudig aan elkaar gekoppeld worden, zoals het automatisch doorzetten van een verkooporder naar een productieorder.
#### 5.1.1 Voordelen van ERP-systemen
* **Geïntegreerde processen:** Verkooporders kunnen automatisch worden omgezet naar productieorders, met alle informatie die hierbij hoort.
* **Databeheer:** Alle data wordt in één grote database opgeslagen, wat het genereren van rapporten en het toepassen van Business Intelligence (BI) vergemakkelijkt.
* **Efficiëntie en foutenreductie:** Door data slechts één keer in te voeren, worden tijd bespaard en fouten en duplicaten geminimaliseerd.
* **Centrale databron:** Zorgt voor één enkel waarheidsgetrouw beeld van de organisatie, wat essentieel is voor efficiënte besluitvorming.
* **Toegankelijkheid:** Als een medewerker vertrekt, blijft alle informatie behouden en toegankelijk.
#### 5.1.2 Discussiepunten rondom ERP-systemen
* **Noodzaak:** Niet elk bedrijf heeft ERP-software nodig. De omvang, sector en specifieke behoeften van een bedrijf spelen een cruciale rol.
* **Toereikendheid:** Voor grote en complexe bedrijven vormt ERP de kern, maar vaak is aanvullende software nodig voor specifieke functionaliteiten die niet standaard in ERP zijn inbegrepen.
* **Ontwikkeling in-house:** Het zelf ontwikkelen van een ERP-systeem is een kostbare en tijdrovende onderneming met aanzienlijke risico's. Het "heruitvinden van het wiel" wordt sterk afgeraden.
* **Kosten en complexiteit:** Implementatie is kostbaar en tijdrovend. Er is een risico op 'overkopen', waarbij functionaliteiten worden aangeschaft die niet worden gebruikt.
#### 5.1.3 Alternatieven en integratie met andere bedrijfsapplicaties
Voor middelgrote en kleine bedrijven kan een combinatie van geïntegreerde, gespecialiseerde tools een betere oplossing zijn dan een complex ERP-systeem. Het integreren van losse, efficiënte applicaties kan flexibeler zijn.
* **Integratie van tools:** Een website met leadgeneratie kan bijvoorbeeld geïntegreerd worden met CRM-, facturatie- en planningssoftware.
* **API's (Application Programming Interfaces):** API's maken het mogelijk voor verschillende softwaretoepassingen om met elkaar te communiceren. Dit is essentieel voor cloudgebaseerde software en integraties tussen systemen zoals ERP, WMS, CRM, BI en webshops. Een API definieert hoe twee systemen met elkaar kunnen interageren, zoals het uitwisselen van klantnamen of projectnummers.
> **Tip:** Kies de software die het beste past bij de specifieke behoeften van je bedrijf. Het gebruik van verkeerde software is vergelijkbaar met schoenen die twee maten te klein zijn: het knelt en belemmert de voortgang.
### 5.2 De relatie tussen ERP en Business Intelligence (BI)
ERP-systemen zijn een belangrijke bron van data voor Business Intelligence. De data uit de centrale ERP-database kan worden gebruikt voor het creëren van rapporten en dashboards.
* **Geïntegreerde BI in ERP:** Veel ERP-systemen bieden ingebouwde BI-functionaliteiten, zoals vaste of dynamische rapporten.
* **Externe BI-tools:** Voor meer geavanceerde analyses en dashboards kunnen externe BI-tools worden geïntegreerd met het ERP-systeem. Deze integratie kan gebeuren via API's.
> **Tip:** Een ERP-systeem is niet altijd voldoende op zichzelf. Voor geavanceerde functionaliteiten of specifieke sectoreisen is vaak aanvullende software of maatwerkontwikkeling nodig, met name door de integratie via API's.
### 5.3 Databases en Data-integratie
Data-integratie is cruciaal voor het effectief gebruiken van ERP-systemen en bedrijfsapplicaties.
#### 5.3.1 Databases
* **Database (DB):** Een verzameling van gerelateerde gegevens.
* **Database Management System (DBMS):** Een softwarelaag die de interactie tussen gebruikers (personen of software) en de database regelt.
#### 5.3.2 Relational vs. Non-relational Databases (SQL vs. NoSQL)
* **Relationele Databases (RDBMS):**
* Data wordt opgeslagen in tabellen met rijen en kolommen.
* Elke rij heeft een `Primary Key` die de rij uniek identificeert.
* `Foreign Keys` worden gebruikt om relaties tussen tabellen te leggen.
* De standaardtaal voor manipulatie is SQL (Structured Query Language).
* Voorbeelden: Microsoft SQL Server, MySQL, Oracle Database, IBM DB2.
* **Non-relationele Databases (NoSQL):**
* Ontworpen voor grote hoeveelheden ongestructureerde of semi-gestructureerde data.
* Bekende types zijn document stores, key-value stores, column-family stores en graph databases.
* Document stores werken met formaten zoals JSON, wat flexibiliteit biedt voor complexe datastructuren.
* NoSQL staat voor "Not Only SQL" en biedt systemen die grote hoeveelheden data snel en efficiënt kunnen opslaan en analyseren.
> **Tip:** NoSQL-databases zijn vaak beter geschikt voor de drie V's van Big Data: Volume, Velocity en Variety.
#### 5.3.3 Data-analyseproces
Het proces van data-analyse, essentieel voor het verkrijgen van inzichten uit ERP-data en andere bedrijfsapplicaties, omvat de volgende stappen:
1. **Definieer het probleem:** Stel duidelijke doelstellingen en verwachte uitkomsten vast.
2. **Verzamel data:** Haal data uit interne databases, via API's, web scraping, spreadsheets, etc.
3. **Pre-process data:** Reinig de data door duplicaten te verwijderen, ontbrekende waarden aan te vullen, formaten te standaardiseren en categorische data om te zetten naar numerieke data. Dit kan tot 80% van de totale tijd in beslag nemen.
4. **Analyseer data:** Ontdek patronen, trends en relaties met behulp van statistische methoden (gemiddelde, mediaan, variantie), correlaties, regressie, clustering of classificatie.
5. **Visualiseer data:** Maak de bevindingen inzichtelijk met behulp van grafieken en dashboards.
6. **Interpreteer en communiceer resultaten:** Vertaal technische bevindingen naar begrijpelijke business taal en zorg voor heldere presentatie.
> **Tip:** Zorg ervoor dat je de data correct interpreteert en communiceert. Vermijd misleidende visualisaties en gebruik taal die aansluit bij het publiek. Correlatie is niet altijd causaliteit.
### 5.4 ERP-implementatie: Een strategische keuze
De keuze voor een ERP-systeem of een set van geïntegreerde applicaties moet zorgvuldig worden overwogen, rekening houdend met factoren zoals de grootte van het bedrijf, de marktsector, de bereidheid tot verandering en de kosten.
* **Niche vs. General & Size:** Kleine bedrijven kunnen beter af zijn met gespecialiseerde "niche" tools, terwijl grote bedrijven vaak een "general" ERP-systeem als kern nodig hebben, aangevuld met gespecialiseerde modules of externe integraties.
* **Kosten en Risico's:** Volledige ERP-implementaties zijn duur en tijdrovend. Het kiezen van de juiste oplossing, die aansluit bij de daadwerkelijke behoeften, is cruciaal om overbodige kosten te vermijden.
Door de integratie van ERP-systemen met diverse bedrijfsapplicaties en het strategisch toepassen van data-analyse, kunnen organisaties hun efficiëntie maximaliseren en datagedreven beslissingen nemen.
---
# Key Performance Indicators (KPI's) per bedrijfsfunctie
Dit gedeelte behandelt de specifieke Key Performance Indicators (KPI's) die worden gebruikt om de prestaties binnen verschillende bedrijfsfuncties te meten, waaronder Marketing & Sales, Operations, Purchase & Logistics, Finance en HR.
### 6.1 Marketing & Sales KPI's
De Marketing & Sales functie richt zich op het genereren van leads, het kwalificeren ervan en het uiteindelijk converteren naar betalende klanten.
#### 6.1.1 Marketing KPI's
* **Cost per Click (CPC)**: De kosten die worden gemaakt telkens wanneer iemand op een advertentie klikt. De prijs is afhankelijk van een veilingalgoritme dat rekening houdt met concurrentie op zoekwoorden, de kwaliteit van de advertentie en de landingspagina.
* Formule: De kosten per klik. (Specifieke formule is niet gegeven, maar het concept is dat elke klik een prijs heeft.)
* Voorbeeld: Een CPC van 0,75 euro.
* **Click-through Rate (CTR)**: Het percentage van de personen die een e-mail openen en vervolgens op een knop in de e-mail klikken.
* Formule: $\text{CTR} = \frac{\text{Aantal klikken}}{\text{Aantal geopende e-mails}} \times 100\%$
* Voorbeeld: 7.500 geopende e-mails en 435 klikken resulteert in een CTR van $435 / 7500 \times 100\% = 5,8\%$.
* **Conversion Rate (CR)**: Het percentage van de websitebezoekers dat de gewenste actie onderneemt, zoals het plaatsen van een bestelling.
* Formule: $\text{CR} = \frac{\text{Aantal gewenste acties}}{\text{Aantal websitebezoekers}} \times 100\%$
* Voorbeeld: 135.000 bezoekers per maand en 6.200 bestellingen resulteert in een conversieratio van $6.200 / 135.000 \times 100\% = 4,6\%$.
* **Return on Ads Spend (ROAS)**: De omzet gegenereerd uit een advertentiecampagne gedeeld door de kosten van die campagne. Een ROAS groter dan 1 duidt op winstgevendheid.
* Formule: $\text{ROAS} = \frac{\text{Extra omzet door campagne}}{\text{Kosten van campagne}}$
* Voorbeeld: Een campagne kost 6.000 euro en genereert 29.000 euro extra omzet, wat resulteert in een ROAS van $29.000 / 6.000 = 4,83$.
#### 6.1.2 Sales KPI's
* **Customer Acquisition Cost (CAC)**: De totale kosten van verkoop en marketing gedeeld door het aantal nieuwe klanten dat in een bepaalde periode is verworven.
* Formule: $\text{CAC} = \frac{\text{Totale kosten verkoop en marketing}}{\text{Aantal nieuwe klanten verkregen}}$
* Voorbeeld: Totale marketingkosten in 2023 waren 178.560 euro, totale verkoopkosten waren 68.530 euro en 520 nieuwe klanten werden verkregen. De CAC is $(178.560 + 68.530) / 520 = 475,17$ euro.
* **Customer Lifetime Value (CLV)**: De totale winst die een bedrijf verwacht te genereren uit een klant gedurende de hele relatie.
* Berekening omvat:
* Gemiddelde aankoopwaarde: Totale omzet van klanten over een jaar / Aantal aankopen.
* Gemiddelde aankoopfrequentie: Aantal aankopen / Aantal unieke klanten die een transactie doen.
* Gemiddelde klantwaarde: Gemiddelde aankoopwaarde $\times$ Gemiddelde aankoopfrequentie.
* Gemiddelde klantlevensduur: De gemiddelde periode dat een klant actief blijft.
* Formule: $\text{CLV} = \text{Gemiddelde klantwaarde} \times \text{Gemiddelde klantlevensduur}$
* Voorbeeld: Een gemiddelde klantwaarde van 127 euro en een gemiddelde klantlevensduur van 7,6 jaar resulteert in een CLV van $127 \times 7,6 = 965,2$ euro.
* **Relatie tussen CAC en CLV**: Het is cruciaal dat de CLV hoger is dan de CAC.
* Voorwaarde: $\text{CLV} > \text{CAC}$ of $\frac{\text{CLV}}{\text{CAC}} > 1$
* Voorbeeld: Met een CAC van 475 euro en een CLV van 965 euro is de verhouding $965 / 475 = 2,03$, wat aangeeft dat de klantwaarde significant hoger is dan de acquisitiekosten.
### 6.2 Operations KPI's
Operations management richt zich op de efficiëntie en effectiviteit van productie- en dienstverleningsprocessen.
* **Productiviteit**: De verhouding tussen output en input.
* Formule: $\text{Productiviteit} = \frac{\text{Output}}{\text{Input}}$
* Voorbeeld 1 (Milling): In 2019 konden 5 platen in 4 uur worden gefreesd (productiviteit = 1,25 platen/uur), terwijl in 2024 slechts 4 platen in 6 uur kunnen worden gefreesd (productiviteit = 0,67 platen/uur).
* Voorbeeld 2 (Arbeidsproductiviteit): Ierland's arbeidsproductiviteit is $140$ dollar per uur (GDP / Totaal gewerkte uren), terwijl Mexico $45$ dollar per uur heeft.
* **Throughput**: De totale hoeveelheid output geproduceerd over een bepaalde periode.
* Formule: $\text{Throughput} = \frac{\text{Totale Output}}{\text{Effectieve Productietijd}}$
* Voorbeeld: 9.550 auto-onderdelen geproduceerd in 56,5 effectieve productieuren resulteert in een throughput van $9.550 / 56,5 = 169$ onderdelen per uur.
* **Manufacturing Cost per Unit**: De totale productiekosten per geproduceerd item.
* Formule: $\text{Manufacturing Cost per Unit} = \text{Kosten grondstoffen per eenheid} + \text{Kosten werkcentra per eenheid}$
* Voorbeeld: De productiekosten per eenheid van een ijsje zijn 1,58 euro.
* **Overall Equipment Effectiveness (OEE)**: Een maatstaf voor de prestaties van productieapparatuur, die rekening houdt met beschikbaarheid, prestatie en kwaliteit.
* Formule: $\text{OEE} = \text{Beschikbaarheid} \times \text{Prestatie} \times \text{Kwaliteit}$
* Berekening componenten:
* Beschikbaarheid: $\frac{\text{Geplande productietijd} - \text{Stilstandtijd}}{\text{Geplande productietijd}}$
* Prestatie: $\frac{\text{Werkelijke output}}{\text{Potentiële output (gebaseerd op ideale cyclustijd)}}$
* Kwaliteit: $\frac{\text{Aantal goede eenheden}}{\text{Werkelijke output}}$
* Voorbeeld: Beschikbaarheid van 91,7%, Prestatie van 95,5% en Kwaliteit van 95,2% resulteert in een OEE van $0,917 \times 0,955 \times 0,952 = 0,833$ of 83,3%.
### 6.3 Purchase & Logistics KPI's
Deze functie richt zich op inkoop, voorraadbeheer en distributie.
#### 6.3.1 Purchase KPI's
* **Cost Savings**: Besparingen gerealiseerd door de inkoopafdeling door onderhandelingen en factuurcontrole.
* Berekening: Wordt vaak berekend als de procentuele reductie in inkoopkosten per artikel.
* Voorbeeld: Inkoopkosten per artikel in 2022 waren 151,79 euro, en in 2023 daalden ze naar 140,15 euro. Dit resulteert in een besparing van $(140,15 - 151,79) / 151,79 = -0,077$ of -8%.
* **Supplier Lead Time**: De gemiddelde tijd tussen het plaatsen van een bestelling bij een leverancier en de levering ervan.
* Formule: Gemiddelde levertijd van alle orders van een leverancier.
* Voorbeeld: Voor leverancier Rexel is de gemiddelde levertijd $(2+3+1+1+2)/5 = 1,8$ dagen. Voor Cebeo is dit $(2+3+1+3+2+2+2+3)/7 = 2,6$ dagen.
* **On-Time Delivery (OTD)**: Het percentage leveringen van een leverancier dat op tijd wordt voltooid.
* Formule: $\text{OTD} = \frac{\text{Aantal tijdig geleverde orders van leverancier}}{\text{Totaal aantal leveringen van leverancier}} \times 100\%$
* Voorbeeld: 40 tijdig geleverde orders op een totaal van 50 leveringen resulteert in een OTD van $40/50 \times 100\% = 80\%$.
* **Purchase Cycle Time**: De gemiddelde tijd die verstrijkt tussen het plaatsen van een bestelling en de ontvangst van de goederen.
* Formule: Gemiddelde van (Datum Ontvangst - Datum Bestelling) over alle orders.
* Voorbeeld: Een bestelling geplaatst op 1 oktober en ontvangen op 15 oktober resulteert in een purchase cycle time van 14 dagen. Een jaarlijkse gemiddelde van deze cyclus tijden kan berekend worden.
#### 6.3.2 Logistics & Inventory KPI's
* **Inventory Turnover**: Hoe vaak een bedrijf zijn voorraad verkoopt en vervangt binnen een bepaalde periode. Een hogere omzet duidt op efficiënt voorraadbeheer.
* Formule: $\text{Inventory Turnover} = \frac{\text{Kostprijs van de omzet (COGS)}}{\text{Gemiddelde voorraadwaarde}}$
* Gemiddelde voorraadwaarde: $(\text{Beginvoorraad} + \text{Eindvoorraad}) / 2$
* Voorbeeld: COGS van 500.000 euro en een gemiddelde voorraadwaarde van 125.000 euro resulteert in een inventory turnover van $500.000 / 125.000 = 4$.
* **Backorder Rate**: Het percentage van de orders dat niet onmiddellijk kan worden geleverd vanwege een tekort aan voorraad.
* Formule: $\text{Backorder Rate} = \frac{\text{Aantal backorders}}{\text{Totaal aantal orders}} \times 100\%$
* Voorbeeld: 25 backorders op een totaal van 500 orders resulteert in een backorder rate van $25 / 500 \times 100\% = 5\%$.
### 6.4 Finance KPI's
Financiële KPI's meten de financiële gezondheid, efficiëntie en winstgevendheid van een bedrijf.
* **Working Capital**: Het verschil tussen de vlottende activa van een bedrijf (zoals contanten, debiteuren en voorraden) en de kortlopende schulden (zoals crediteuren en kortlopende leningen). Het meet de kortetermijn financiële gezondheid. Een positieve waarde is wenselijk.
* Formule: $\text{Working Capital} = \text{Vlottende Activa} - \text{Kortlopende Schulden}$
* Voorbeeld: Vlottende activa van (35.000 + 16.300 + 26.500) euro en kortlopende schulden van (12.780 + 11.000) euro resulteren in een working capital van $77.800 - 23.780 = 54.020$ euro.
* **Current Ratio**: De verhouding tussen vlottende activa en kortlopende schulden, een specifieke maatstaf voor het working capital.
* Formule: $\text{Current Ratio} = \frac{\text{Vlottende Activa}}{\text{Kortlopende Schulden}}$
* Voorbeeld: Met vlottende activa van 77.800 euro en kortlopende schulden van 23.780 euro is de current ratio $77.800 / 23.780 = 3,27$.
* **Quick Ratio**: Vergelijkbaar met de current ratio, maar exclusief voorraden uit de vlottende activa. Dit geeft een nog strengere maatstaf voor de liquiditeit op korte termijn.
* Formule: $\text{Quick Ratio} = \frac{\text{Vlottende Activa} - \text{Voorraden}}{\text{Kortlopende Schulden}}$
* Voorbeeld: Met vlottende activa van 77.800 euro, voorraden van 26.500 euro en kortlopende schulden van 23.780 euro is de quick ratio $(77.800 - 26.500) / 23.780 = 51.300 / 23.780 = 2,16$.
* **Debt Ratio**: De verhouding tussen de totale schulden en de totale activa van een bedrijf, uitgedrukt in een percentage.
* Formule: $\text{Debt Ratio} = \frac{\text{Totale Schulden}}{\text{Totale Activa}} \times 100\%$
* Voorbeeld: Totale schulden van 800.000 euro en totale activa van 1.200.000 euro resulteren in een debt ratio van $800.000 / 1.200.000 \times 100\% = 67\%$.
* **Gross Profit Margin**: De winst die overblijft na aftrek van de directe kosten van verkochte goederen (COGS) van de omzet, uitgedrukt als percentage van de omzet.
* Formule: $\text{Gross Profit Margin} = \frac{\text{Brutowinst}}{\text{Omzet}} \times 100\%$
* Brutowinst: $\text{Omzet} - \text{COGS}$ (COGS omvat directe kosten zoals grondstoffen en arbeid voor productie, exclusief indirecte kosten).
* Voorbeeld: Omzet van 160.000 euro, directe productiekosten (inclusief grondstoffen, arbeid, afschrijving machines) van 42.000 + 28.300 + 12.500 = 82.800 euro. Brutowinst is $160.000 - 82.800 = 77.200$ euro. Bruto winstmarge is $77.200 / 160.000 \times 100\% = 48,25\%$.
* **Net Profit Margin**: De winst die overblijft na aftrek van alle kosten (directe en indirecte) van de omzet, uitgedrukt als percentage van de omzet.
* Formule: $\text{Net Profit Margin} = \frac{\text{Nettowinst}}{\text{Omzet}} \times 100\%$
* Nettowinst: $\text{Omzet} - \text{Totale Kosten}$ (inclusief overheadkosten zoals administratie, verkoop en marketing).
* Voorbeeld: Omzet van 160.000 euro, totale kosten (COGS + overhead) van 82.800 + 25.000 = 107.800 euro. Nettowinst is $160.000 - 107.800 = 52.200$ euro. Nettowinstmarge is $52.200 / 160.000 \times 100\% = 32,5\%$.
* **Return on Equity (ROE)**: Meet hoe efficiënt het eigen vermogen van aandeelhouders wordt gebruikt om winst te genereren.
* Formule: $\text{ROE} = \frac{\text{Nettowinst}}{\text{Eigen Vermogen}} \times 100\%$
* Voorbeeld: Nettowinst van 40.000 euro en eigen vermogen van 400.000 euro resulteert in een ROE van $40.000 / 400.000 \times 100\% = 10\%$.
* **Return on Capital (ROC)**: Meet hoe efficiënt het totale geïnvesteerde kapitaal (eigen vermogen plus schulden) wordt gebruikt om winst te genereren.
* Formule: $\text{ROC} = \frac{\text{Nettowinst}}{\text{Totaal Geïnvesteerd Kapitaal}} \times 100\%$
* Totaal Geïnvesteerd Kapitaal: Eigen Vermogen + Schulden.
* Voorbeeld: Nettowinst van 40.000 euro en een totaal geïnvesteerd kapitaal van 1.200.000 euro (400.000 eigen vermogen + 800.000 schulden) resulteert in een ROC van $40.000 / 1.200.000 \times 100\% = 3,33\%$.
### 6.5 HR KPI's
HR KPI's meten de effectiviteit van het human resources management op het gebied van personeelsbeheer en -ontwikkeling.
* **Employee Turnover Rate**: Het percentage werknemers dat het bedrijf verlaat binnen een bepaalde periode.
* Formule: $\text{Employee Turnover Rate} = \frac{\text{Aantal vertrokken werknemers}}{\text{Gemiddeld aantal werknemers}} \times 100\%$
* Gemiddeld aantal werknemers: $(\text{Aantal werknemers begin jaar} + \text{Aantal werknemers eind jaar}) / 2$.
* Voorbeeld: 200 vertrokken werknemers en een gemiddeld aantal van 1030 werknemers resulteert in een turnover rate van $200 / 1030 \times 100\% = 19,42\%$.
* **Time to Hire**: De gemiddelde tijd die nodig is om een vacature te vervullen, vanaf het moment van plaatsing tot de aanstelling van een nieuwe werknemer.
* Formule: Gemiddelde van de tijdsduur voor elke succesvol ingevulde positie.
* Voorbeeld: Drie posities duurden respectievelijk 45, 28 en 23 dagen. Het gemiddelde is $(45 + 28 + 23) / 3 = 32$ dagen.
* **Cost to Hire**: De totale kosten die gepaard gaan met het werven van een nieuwe werknemer.
* Formule: Totale wervingskosten (inclusief advertenties, bureaus, interne tijd) gedeeld door het aantal ingevulde posities.
* Voorbeeld: Met bureaukosten van 1.600 euro (positie 1), eigen personeelskosten van 2.100 euro (positie 2), bureaukosten van 800 euro (positie 3) en globale advertentiekosten van 3.900 euro voor drie posities, is de gemiddelde kosten per positie $(1.600 + 2.100 + 800 + 3.900) / 3 = 2.800$ euro.
* **Employee Productivity**: De output per werknemer of per uur werk.
* Formule 1 (per uur): $\text{Productiviteit} = \frac{\text{Output (financieel)}}{\text{Totaal aantal gewerkte uren}}$
* Formule 2 (per werknemer): $\text{Productiviteit} = \frac{\text{Output (financieel)}}{\text{Aantal werknemers}}$
* Voorbeeld 1: 80.000 euro aan goederen geproduceerd in 1500 uur werk resulteert in een productiviteit van $80.000 / 1500 = 53,33$ euro per uur.
* Voorbeeld 2: 80.000 euro aan goederen geproduceerd door 30 werknemers in één week resulteert in een productiviteit van $80.000 / 30 = 2.666,67$ euro per werknemer per week.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Datagedreven Management | Een managementbenadering waarbij beslissingen primair worden gebaseerd op de analyse van gegevens en feitelijke informatie, in plaats van op intuïtie of anekdotisch bewijs. |
| Business Intelligence (BI) | Een reeks processen, technologieën en tools voor het verzamelen, integreren, analyseren en presenteren van bedrijfsinformatie. Het doel is om betere zakelijke beslissingen te ondersteunen door inzichten te verschaffen uit data. |
| KPI (Key Performance Indicator) | Een meetbare waarde die aangeeft hoe effectief een bedrijf of een specifieke activiteit presteert ten opzichte van belangrijke bedrijfsdoelstellingen. KPI's helpen bij het volgen van voortgang en het identificeren van verbeterpunten. |
| Big Data | Verwijst naar datasets die zo groot en complex zijn dat ze met traditionele gegevensverwerkingsapplicaties moeilijk te beheren, te verwerken en te analyseren zijn. Kenmerkend zijn de 3 V's: Volume, Velocity en Variety. |
| Kunstmatige Intelligentie (AI) | Een tak van informatica die zich richt op het creëren van systemen die taken kunnen uitvoeren die normaal gesproken menselijke intelligentie vereisen, zoals leren, probleemoplossing en besluitvorming. |
| Machine Learning | Een subset van AI die computers in staat stelt te leren van data zonder expliciet geprogrammeerd te zijn. Algoritmes verbeteren hun prestaties naarmate ze meer gegevens verwerken. |
| Deep Learning | Een geavanceerdere vorm van machine learning, gebaseerd op kunstmatige neurale netwerken met meerdere lagen. Deze techniek is bijzonder effectief in het herkennen van complexe patronen in grote hoeveelheden data, zoals beelden en spraak. |
| Database | Een georganiseerde verzameling van gerelateerde gegevens die is opgeslagen en toegankelijk is vanuit een computersysteem. Databases zijn essentieel voor het opslaan en beheren van grote hoeveelheden informatie. |
| Database Management System (DBMS) | Een softwareprogramma dat wordt gebruikt om databases te maken, te onderhouden en te beheren. Het fungeert als een interface tussen de gebruiker (of applicatie) en de fysieke database. |
| Relationele Database Management Systeem (RDBMS) | Een DBMS dat data organiseert in tabellen met rijen en kolommen, volgens het relationele model. Relaties tussen tabellen worden gelegd met behulp van primaire en vreemde sleutels. |
| SQL (Structured Query Language) | Een gestandaardiseerde programmeertaal die wordt gebruikt om gegevens op te vragen, te manipuleren en te beheren in relationele databases. Het is de standaardtaal voor interactie met RDBMS. |
| NoSQL Databases | Een categorie databases die niet voldoen aan het traditionele relationele model van tabellen. Ze zijn ontworpen om grote hoeveelheden ongestructureerde, semi-gestructureerde of gestructureerde data efficiënt op te slaan en te verwerken, vaak met betere schaalbaarheid. |
| JSON (JavaScript Object Notation) | Een lichtgewicht gegevensuitwisselingsformaat dat gemakkelijk te lezen en te schrijven is voor mensen en gemakkelijk te parsen en te genereren is voor machines. Het wordt veel gebruikt in NoSQL databases en webapplicaties. |
| ERP (Enterprise Resource Planning) | Een softwaresysteem dat alle kernprocessen van een bedrijf integreert en beheert, zoals financiën, personeelszaken, productie, inkoop, verkoop en voorraadbeheer, in één centraal systeem. |
| API (Application Programming Interface) | Een set regels en protocollen waarmee verschillende softwaretoepassingen met elkaar kunnen communiceren. API's maken het mogelijk om functionaliteit of data tussen systemen uit te wisselen. |
| Werkkapitaal | Het verschil tussen de vlottende activa (zoals liquide middelen, debiteuren en voorraden) en de kortlopende schulden (zoals crediteuren en kortlopende leningen) van een bedrijf. Het geeft de kortetermijn financiële gezondheid aan. |
| COGS (Cost of Goods Sold) | De directe kosten die gepaard gaan met de productie of inkoop van de goederen die door een bedrijf zijn verkocht gedurende een bepaalde periode. Dit omvat materiaalkosten en directe arbeidskosten. |
| Brutowinstmarge | De brutowinst (omzet minus COGS) uitgedrukt als een percentage van de omzet. Het geeft aan hoeveel winst er overblijft na aftrek van de directe kosten van verkochte goederen. |
| Nettowinstmarge | De nettowinst (brutowinst minus alle operationele kosten, belastingen en rentelasten) uitgedrukt als een percentage van de omzet. Het geeft de uiteindelijke winstgevendheid van een bedrijf aan. |
| Return on Equity (ROE) | Een financiële ratio die meet hoe efficiënt een bedrijf het geld van zijn aandeelhouders gebruikt om winst te genereren. Het wordt berekend als nettowinst gedeeld door het eigen vermogen. |
| Return on Capital (ROC) | Een financiële ratio die meet hoe efficiënt een bedrijf het totale geïnvesteerde kapitaal (eigen vermogen plus schulden) gebruikt om winst te genereren. |
| Data-analyseproces | Een gestructureerde reeks stappen die worden gevolgd om gegevens te verzamelen, voor te bereiden, te analyseren, te visualiseren en te interpreteren om inzichten te verkrijgen en beslissingen te ondersteunen. |
| Correlatie | Een statistische maat die de sterkte en richting van de lineaire relatie tussen twee variabelen aangeeft. Het geeft aan of en hoe variabelen samenhangen, maar impliceert geen causaliteit. |
| Regressie | Een statistische methode die wordt gebruikt om de relatie tussen een afhankelijke variabele en een of meer onafhankelijke variabelen te modelleren en te voorspellen. |
| Clustering | Een machine learning techniek die data groepeert op basis van hun gelijkenis. Het doel is om natuurlijke groepen of clusters te ontdekken binnen een dataset zonder vooraf gedefinieerde categorieën. |
| Classificatie | Een machine learning techniek die wordt gebruikt om gegevenspunten toe te wijzen aan vooraf gedefinieerde categorieën of klassen. Het algoritme leert van gelabelde trainingsdata om voorspellingen te doen voor nieuwe data. |
| Medewerkeromzetpercentage (Employee Turnover Rate) | Een KPI die aangeeft welk percentage van de werknemers een organisatie verlaat binnen een bepaalde periode. Het wordt berekend door het aantal vertrokken werknemers te delen door het gemiddeld aantal werknemers. |
| Werknemersproductiviteit | Een maatstaf die aangeeft hoeveel output (goederen of diensten) een werknemer produceert per eenheid input (zoals tijd of kosten). Het meet de efficiëntie van werknemers. |
Cover
Les 5-6-7-8 - slides_merged.pdf
Summary
# Data in AI: fundering en kwaliteit
Dit onderwerp verkent de fundamentele rol van data als drijvende kracht achter kunstmatige intelligentie (AI), inclusief de verschillende datatypes, hun herkomst, levenscyclus, en de cruciale aspecten van datakwaliteit, bias en misinterpretatie.
### 1.1 Data als brandstof voor AI
AI-systemen zijn volledig afhankelijk van data om te functioneren en te leren. Data kan beschouwd worden als de "superkracht" achter AI waarbij de kwaliteit van de data belangrijker is dan de kwantiteit. Het is essentieel te beseffen dat bias zich in de data bevindt en niet in de code van het AI-model zelf. Data wordt vaak vergeleken met het "nieuwe goud", maar vereist zorgvuldig gebruik [3](#page=3).
### 1.2 Soorten data
Er bestaan verschillende soorten data die cruciaal zijn voor AI-systemen:
* **Gestructureerde data**: Dit omvat data die is georganiseerd in tabellen, zoals in databases (SQL) of spreadsheets (Excel) [6](#page=6).
* **Ongestructureerde data**: Dit type data is niet vooraf gedefinieerd in een datamodel en omvat onder andere tekst, beeld, audio en video [6](#page=6).
Zowel gestructureerde als ongestructureerde data zijn nodig voor effectieve AI-systemen [6](#page=6).
### 1.3 Waar data vandaan komt
Het vinden van data is over het algemeen geen groot probleem, maar het vinden van de *juiste* data kan een uitdaging zijn. Gangbare bronnen van data zijn [7](#page=7):
* **Interne bedrijfsdata**: Informatie afkomstig uit systemen zoals CRM (Customer Relationship Management), ERP (Enterprise Resource Planning), verkoopgegevens en HR-data [7](#page=7).
* **Open data**: Vrij toegankelijke datasets, vaak aangeboden door overheden, universiteiten en NGO's (bijvoorbeeld data.gov, Statbel, EU open data portal) [7](#page=7).
* **Sensordata**: Data verzameld door sensoren, zoals temperatuurmeters, GPS-apparaten, machines en wearables [7](#page=7).
* **Gebruikersdata**: Informatie over gebruikersgedrag, zoals klikgedrag, zoekgeschiedenis en interacties binnen applicaties [7](#page=7).
* **Aangekochte data**: Data die wordt verkregen van externe partijen, zoals marketing- en advertentiedata [7](#page=7).
### 1.4 De levenscyclus van data
Data doorloopt een reeks stappen voordat het waarde kan genereren:
1. **Verzamelen**: Data wordt verkregen via sensoren, formulieren, databases, etc. [8](#page=8).
2. **Opslaan**: Data wordt opgeslagen in systemen zoals de cloud, servers of datalakes [8](#page=8).
3. **Schoonmaken**: Fouten worden verwijderd en ontbrekende waarden worden aangevuld [8](#page=8).
4. **Analyseren**: Patronen, correlaties en trends worden geïdentificeerd [8](#page=8).
5. **Interpreteren**: Betekenis wordt toegekend aan de geanalyseerde data om beslissingen te kunnen nemen [8](#page=8).
6. **Handelen**: De verkregen inzichten worden toegepast in processen of strategieën [8](#page=8).
Een AI-model is slechts zo goed als elke stap in deze cyclus [8](#page=8).
### 1.5 Het belang van datakwaliteit
De kwaliteit van data heeft een directe impact op de prestaties van AI-modellen. Dit principe wordt vaak samengevat met de uitspraak "Garbage in, garbage out" (GIGO). Slechte data leidt tot een "dom" AI-model [9](#page=9).
#### 1.5.1 Gevolgen van slechte data
* **Microsoft's Tay AI**: Een chatbot die in 2016 op Twitter-data werd getraind en racistische en seksistische taal leerde [9](#page=9).
* **IBM Watson for Oncology**: Dit systeem, ontworpen om kankerbehandelingen te adviseren, vertoonde slechte prestaties buiten de specifieke dataset waarop het was getraind, wat leidde tot gevaarlijke aanbevelingen. Watson werd een expert in de data van het specifieke ziekenhuis (MSK) in plaats van een algemene kanker-expert [10](#page=10).
#### 1.5.2 Het Data Kwaliteit Framework
Om te beoordelen of data van goede kwaliteit is, kan een framework worden gebruikt dat verschillende dimensies omvat [16](#page=16):
* **Nauwkeurigheid**: Zijn de feiten correct?. Bijvoorbeeld, is de gemeten tijd in Canvas accuraat of een meetfout? [16](#page=16).
* **Volledigheid**: Ontbreken er waarden in de dataset?. Bijvoorbeeld, als veel studenten geen Canvas-data hebben [17](#page=17).
* **Consistentie**: Komen data uit verschillende bronnen overeen?. Bijvoorbeeld, vergelijken van data tussen Wooclap en Canvas [18](#page=18).
* **Tijdigheid**: Is de data actueel?. Bijvoorbeeld, hoe om te gaan met data van weken geleden of met late inschrijvingen [19](#page=19).
* **Relevantie**: Is de data relevant voor de specifieke vraag of het probleem?. Bijvoorbeeld, is Canvas-tijd relevant voor het meten van begrip .
#### 1.5.3 Kosten van slechte datakwaliteit
Slechte datakwaliteit kan aanzienlijke financiële gevolgen hebben. Een voorbeeld is Unity Technologies dat in 2022 naar verluidt 110 miljoen dollars verloor door corrupte klantdata in trainingssets voor machine learning, wat leidde tot falende advertentie-targeting en een aanzienlijke daling van het aandeel .
### 1.6 Problemen in de data: Bias en Misinterpretatie
Data is niet altijd een objectieve weergave van de werkelijkheid en kan leiden tot misinterpretaties en vooringenomenheid (bias) [12](#page=12).
#### 1.6.1 Data ≠ Waarheid
Data vertelt een verhaal, maar niet *de* waarheid. Data wordt altijd gefilterd door de manier waarop het wordt verzameld, geïnterpreteerd door de analist, en is vaak incompleet omdat niet alles gemeten kan worden [12](#page=12).
#### 1.6.2 Correlatie versus Causaliteit
Een belangrijk onderscheid is dat tussen correlatie en causaliteit :
* **Correlatie**: Twee gebeurtenissen treden gelijktijdig op, maar de ene veroorzaakt de andere niet noodzakelijk .
* **Causaliteit**: De ene gebeurtenis is direct de oorzaak van de andere .
Bij het observeren van een correlatie tussen A en B, moeten drie vragen worden gesteld:
1. Kan A → B veroorzaken (causaliteit A als oorzaak)? .
2. Kan B → A veroorzaken (causaliteit B als oorzaak)? .
3. Kan een verborgen variabele C zowel A als B veroorzaken, wat de correlatie verklaart zonder directe causaliteit tussen A en B? .
#### 1.6.3 Simpson's Paradox
Simpson's Paradox treedt op wanneer een trend die zichtbaar is in subgroepen van data, verdwijnt of zelfs omkeert wanneer de data wordt samengevoegd tot een totale dataset. Het samenvoegen van data kan conclusies op een misleidende manier vervormen .
> **Voorbeeld**: Een universiteit wordt beschuldigd van seksisme omdat mannen een hoger toelatingspercentage lijken te hebben. Bij analyse per faculteit blijkt dat de Techniekfaculteit een hoog toelatingspercentage heeft en de Kunstfaculteit een laag percentage. Meer mannen meldden zich aan voor Techniek, terwijl meer vrouwen zich aanmeldden voor Kunst, wat de totale cijfers vertekende .
#### 1.6.4 Diverse vormen van bias in data
Er zijn meerdere manieren waarop bias kan ontstaan in data:
* **Bias in data (algemeen)**: Als data bias bevat, zal het AI-model deze bias "perfect" reproduceren [11](#page=11).
> **Voorbeeld**: Amazon's sollicitatie-AI, getraind op historische data, discrimineerde automatisch tegen CV's met het woord "vrouw", omdat de historische data 75% mannelijke werknemers bevatte en 80% van de aangenomen kandidaten mannen waren [11](#page=11).
* **Participation Bias**: Treedt op wanneer alleen gemotiveerde individuen deelnemen aan onderzoek of feedback geven, wat kan leiden tot overschatting van engagement of ontevredenheid, afhankelijk van wie deelneemt. Het probleem is dat men niet weet wie er ontbreekt .
* **Selection Bias**: Ontstaat wanneer groepen niet vergelijkbaar zijn door verborgen verschillen in hun samenstelling. Dit kan komen door :
* **Zelfselectie**: Mensen kiezen zelf hun groep, waardoor groepen al verschillen vóór enige interventie .
* **Sampling bias**: De steekproef is niet willekeurig getrokken, waardoor bepaalde groepen over- of ondervertegenwoordigd zijn .
* **Survivorship bias**: Alleen de "overlevers" of succesvolle gevallen worden waargenomen, terwijl falende gevallen verdwijnen .
* **Measurement Bias**: Ontstaat door de manier waarop data wordt gemeten. Wat we denken te meten (bijv. studietijd) is mogelijk niet hetzelfde als wat daadwerkelijk wordt gemeten (bijv. tijd dat een tabblad openstaat). Vaak wordt een proxy gemeten, wat een indirecte meting is en niet het echte fenomeen .
> **Voorbeeld**: Tijd in Canvas meten als proxy voor engagement, terwijl de echte studietijd, offline studie, of frustratie hiermee niets te maken hebben .
* **Confirmation Bias**: Dit is de neiging om informatie te zien, interpreteren en herinneren op een manier die eigen overtuigingen bevestigt .
* **Biased Search**: Selectief zoeken naar informatie die de eigen mening ondersteunt .
* **Biased Interpretation**: Informatie interpreteren op een manier die het eigen gelijk bevestigt .
* **Biased Recall**: Informatie herinneren die de eigen overtuigingen versterkt .
Sociale media-algoritmes versterken confirmation bias door content te tonen die de gebruiker bevalt, wat leidt tot "echokamers" .
> **Tip**: Om confirmation bias te vermijden bij data-analyse, formuleer vooraf wat je verwacht, wat je zou overtuigen van het tegendeel, en bekijk daarna pas de data. Controleer na de analyse je aannames en vraag of je alleen vond wat je verwachtte .
* **Outlier Bias**: Extreem afwijkende datapunten (outliers) kunnen de analyse sterk beïnvloeden. Gemiddelden kunnen deze extremen verbergen, terwijl ze juist belangrijk verhaal kunnen vertellen. Outliers kunnen foutief zijn (meetfout) of interessant (echt maar extreem gedrag) .
* **Behandeling van outliers**: Het is belangrijk om outliers te rapporteren, visualisere, en te onderzoeken waarom ze afwijken .
### 1.7 De student als datafabriek
Individuen genereren continu grote hoeveelheden data door hun dagelijkse activiteiten. Een student is niet alleen leerling, maar ook een product, trainingsdata, profiel en dataset [13](#page=13).
> **Voorbeeld**: De verzamelde data van studenten over quizdeelname, opdrachten en Canvas-activiteit vormt een dataset, vaak na anonimisering [14](#page=14).
### 1.8 Checklist voor bias
Een nuttige checklist om mogelijke biases te identificeren:
* **Wie ontbreekt?**: Zijn er groepen die niet in de data zitten? (Participation bias) .
* **Hoe is het gemeten?**: Meten we het echte fenomeen? (Measurement bias) .
* **Hoe is het gegroepeerd?**: Kan aggregatie patronen verbergen? (Simpson's Paradox) .
* **Wat zoek ik?**: Ben ik op zoek naar bevestiging? (Confirmation bias) .
* **Wie heeft de data geselecteerd?**: Zijn groepen vergelijkbaar of is er verborgen selectie? (Selection bias) .
* **Wat doen de outliers?**: Verbergen gemiddelden de echte verhalen? (Outlier bias) .
---
# Agentic AI en workflow-automatisering
Dit thema verkent de evolutie van AI-gebruik van reactief naar proactief door middel van Agentic AI en AI-agents, met de focus op het bouwen van agents, het automatiseren van workflows en de anatomie en best practices voor het ontwikkelen van effectieve AI-agents.
## 1. Evolutie van AI-gebruik
De manier waarop we AI gebruiken, evolueert van een puur reactieve modus naar steeds autonomere systemen. Traditioneel waren we als gebruiker gefocust op het geven van instructies via prompts, wat neerkomt op een één-op-één conversatie met de AI. Dit wordt gekenmerkt door reactief gebruik. De volgende stap is het worden van een workflow-ontwerper, waarbij systemen worden ontworpen die zelfstandig handelen en waarbij meerdere AI-agents samenwerken om proactieve automatisering te realiseren [28](#page=28).
Deze evolutie kan worden samengevat als:
* **LLM:** "Kun je dit voor mij doen?" (reactief) [28](#page=28).
* **Agent:** "Ik ontwerp een specialist" (semi-autonoom) [28](#page=28).
* **Agentic AI:** "Ik bouw een intelligent systeem" (autonoom) [28](#page=28).
* **Workflow:** "Mijn systeem werkt autonoom" (volledig geautomatiseerd) [28](#page=28).
## 2. Wat is Agentic AI?
Agentic AI verwijst naar het vermogen van AI-systemen om autonoom te handelen. In tegenstelling tot traditionele AI die alleen reageert op directe input, kan Agentic AI zelfstandig beslissingen nemen en acties ondernemen. Het is geen specifieke tool, maar eerder een eigenschap die een AI-systeem kan bezitten, wat resulteert in een verschuiving van reactief naar proactief gedrag [29](#page=29).
### 2.1 Agentic AI versus AI Agents
Het is belangrijk om onderscheid te maken tussen "Agentic AI" en "AI Agent" [29](#page=29):
* **AI Agent:** Dit is een **concreet systeem** dat beschreven wordt als een zelfstandig naamwoord. Het is het systeem zelf dat handelt. Een voorbeeld is: "Dit is een customer service agent." [29](#page=29).
* **Agentic AI:** Dit is een **eigenschap of concept** dat wordt beschreven als een bijvoeglijk naamwoord. Het beschrijft het gedrag en de capaciteiten van een AI. Een voorbeeld is: "Deze AI heeft agentic eigenschappen." [29](#page=29).
### 2.2 Kenmerken van een "Agentic" AI-systeem
Verschillende eigenschappen maken een AI-systeem "agentic" [30](#page=30):
* **Externe tools aanroepen:** De mogelijkheid om tools zoals een calculator, database, API, web search, of code execution te gebruiken. Het systeem kan zelf beslissen welke tool het nodig heeft [30](#page=30).
* **Geheugen:** Het vermogen om context op te bouwen door eerdere interacties te onthouden en kennis op te doen over de gebruiker of de situatie [30](#page=30).
* **Planning (multi-step reasoning):** Het kunnen maken van een plan met opeenvolgende stappen (stap 1 -> stap 2 -> stap 3) en complexe taken opdelen, inclusief het herkennen van afhankelijkheden tussen stappen [30](#page=30).
* **Feedback loops:** Het vermogen om eigen resultaten te evalueren en te itereren totdat het gewenste resultaat is bereikt [30](#page=30).
Hoe meer van deze eigenschappen een AI-systeem bezit, hoe autonomer de agent wordt [30](#page=30).
### 2.3 Nadelen en overwegingen van meer autonomie
Niet elk proces hoeft een autonome agent te zijn. Meer autonomie brengt ook meer risico's met zich mee [30](#page=30):
* **Minder voorspelbaar:** Het gedrag van een zeer autonome agent kan moeilijker te voorspellen zijn, wat het "black box"-probleem versterkt [30](#page=30).
* **Cascaderende fouten:** Foutjes in een autonome agent kunnen leiden tot grotere problemen met brede effecten [30](#page=30).
* **Overafhankelijkheid:** Er bestaat een risico van te veel vertrouwen in geautomatiseerde beslissingen [30](#page=30).
* **Versterken van bias:** AI kan bestaande vooroordelen onbedoeld versterken [30](#page=30).
* **Verantwoordelijkheid:** Het is onduidelijk wie aansprakelijk is wanneer een autonome agent een fout maakt [30](#page=30).
Het is daarom essentieel om continu de vraag te stellen: "Is deze autonomie echt nodig?" [30](#page=30) [44](#page=44).
### 2.4 Voorbeelden van Agentic AI-taken
Agentic AI kan worden ingezet voor diverse taken, waaronder [31](#page=31):
* **Zelfstandige Onderzoeksagent:** Zoekt, vergelijkt en vat informatie samen, bijvoorbeeld het vinden van artikelen over duurzame energie, vergelijken van standpunten en presenteren van conclusies in een tabel [31](#page=31).
* **Persoonlijke Financiële Coach:** Analyseert data (bv. banktransacties via API), categoriseert uitgaven en geeft wekelijks bespaartips [31](#page=31).
* **Customer Service Triager:** Beoordeelt inkomende supportmails, bepaalt urgentie en onderwerp, en routeert ze naar de juiste afdeling [31](#page=31).
* **HR Onboarding Agent:** Automatiseert personeelsprocessen zoals het versturen van onboarding-documenten, plannen van gesprekken en aanmelden van nieuwe medewerkers [31](#page=31).
* **Marketing Campagne Agent:** Plant, test en optimaliseert marketingcampagnes door social posts te genereren, publicaties te plannen en prestaties te analyseren [31](#page=31).
* **Onderwijs Tutor Agent:** Past uitleg aan per leerling, geeft gepersonaliseerde oefenopdrachten en volgt de voortgang [31](#page=31).
* **Data Cleaning Agent:** Automatiseert dataverwerking door datasets te controleren op dubbele waarden en inconsistenties en genereert een schoon CSV-bestand [31](#page=31).
* **Compliance & Audit Agent:** Controleert regels, policies en afwijkingen in contracten, detecteert risico's en genereert samenvattingen per compliance-domein [31](#page=31).
## 3. AI Agents bouwen
### 3.1 Prompten versus AI Agents
Er is een significant verschil tussen traditioneel prompten en het werken met AI Agents [32](#page=32):
* **Prompten:**
* Vereist het continu geven van context [32](#page=32).
* Mist toegang tot specifieke bedrijfskennis [32](#page=32).
* Kan leiden tot inconsistente antwoorden [32](#page=32).
* Noodzaakt het herhalen van dezelfde instructies [32](#page=32).
* Is niet schaalbaar voor teams [32](#page=32).
* Is te weinig agentic voor consistente business use [32](#page=32).
* **AI Agents:**
* Zijn voorgeconfigureerde, autonome AI-assistenten [32](#page=32).
* Context is ingebouwd (system prompt) [32](#page=32).
* Hebben toegang tot documenten en tools [32](#page=32).
* Zorgen voor consistent gedrag door vaste instructies [32](#page=32).
* Zijn schaalbaar: een heel team kan ermee werken [32](#page=32).
* Zijn voldoende agentic voor specifieke taken, maar blijven onder controle [32](#page=32).
### 3.2 Platforms voor het bouwen van AI Agents
Veel populaire AI-platforms bieden mogelijkheden om agents te bouwen [33](#page=33):
* **OpenAI:** Custom GPTs (vereist ChatGPT Plus) [16](#page=16) [33](#page=33).
* **Anthropic:** Claude Projects & Workflows (vereist Claude Pro/Team) [16](#page=16) [33](#page=33).
* **Perplexity:** Comet-browser (agentic zoeken) [33](#page=33).
* **Mistral AI:** Le Chat Agents (gratis tier beschikbaar) [16](#page=16).
* **Google:** Gemini Gems [16](#page=16).
De principes voor het bouwen van agents zijn universeel toepasbaar. Het testen van meerdere platforms voor specifieke use cases wordt aangeraden [16](#page=16).
### 3.3 Anatomie van een AI Agent
De opbouw van een effectieve AI-agent omvat verschillende componenten [34](#page=34):
* **Rol:** Het expertisegebied van de agent [34](#page=34).
* **Gedrag:** Formeel of informeel, bronnen vermelden, maximale lengte, emoji's/formatting [34](#page=34).
* **Safety:** Bepalen wat de agent nooit mag doen [34](#page=34).
* **Output:** De gewenste outputformaten, zoals tabellen, bullet points, of rapporten [34](#page=34).
* **Kennis (Knowledge Base):** Statische of dynamische toegang tot documenten, beleid, productinformatie [34](#page=34) [35](#page=35).
* **Tools:** Toegang tot web search, code execution, image generation, API's, databases, en bestanden [34](#page=34).
### 3.4 Best practices voor het bouwen van een goede Agent
Om een effectieve AI-agent te creëren, gelden de volgende 'DO's' en 'DON'Ts' [34](#page=34):
**DO's:**
* **Wees specifiek:** Geef duidelijke instructies, zoals "Antwoord in maximaal 3 zinnen" in plaats van "Wees beknopt." [34](#page=34).
* **Geef voorbeelden:** Illustreer gewenst gedrag met concrete voorbeelden, zoals "Als een klant vraagt X, antwoord Y." [34](#page=34).
* **Definieer grenzen:** Stel duidelijke grenzen aan de functionaliteit van de agent, bijvoorbeeld "Verwijs door bij vragen over [topic." [34](#page=34).
* **Specificeer toon:** Definieer de gewenste toon, zoals "Professioneel maar toegankelijk, vermijd jargon." [34](#page=34).
* **Output format:** Geef aan welke structuur de output moet hebben, zoals "Gebruik deze structuur: 1. Samenvatting, 2. Details, 3. Actie." [34](#page=34).
**DON'Ts:**
* **Te vaag zijn:** Vermijd algemene instructies zoals "Wees behulpzaam." [34](#page=34).
* **Tegenstrijdige instructies geven:** Zorg dat instructies coherent zijn [34](#page=34).
* **Geen safety measures inbouwen:** Cruciaal voor verantwoorde inzet [34](#page=34).
* **Te veel autonomie zonder checks:** Vooral bij kritieke taken is controle essentieel [34](#page=34).
### 3.5 Kennisbasis voor AI Agents
Een AI-agent zonder kennis is vergelijkbaar met een nieuwe medewerker zonder training. Een goed gestructureerde kennisbasis is cruciaal voor consistentie, actualiteit, specialisatie en schaalbaarheid. Het kan leiden tot kostenreductie doordat er minder training nodig is [35](#page=35).
Er zijn twee soorten kennisbenaderingen [36](#page=36):
* **Statisch:**
* Informatie wordt handmatig toegevoegd, vaak door het uploaden van documenten [36](#page=36).
* Niet schaalbaar en tijdrovend in onderhoud [36](#page=36).
* Geschikt voor vaste content zoals handleidingen en beleidsdocumenten [36](#page=36).
* Minder geschikt voor snel veranderende informatie [36](#page=36).
* **Dynamisch:**
* Koppeling met databronnen, waardoor de AI-agent continu gesynchroniseerde informatie heeft [36](#page=36).
* Schaalbaar en automatisch synchroniserend [36](#page=36).
* Geschikt voor teams, kennismanagement en real-time inzichten [36](#page=36).
#### 3.5.1 Dynamische Knowledge Base
Een dynamische knowledge base dient als centrale plek voor het bewaren, delen en actualiseren van informatie en documenten. Populaire platforms hiervoor zijn [36](#page=36):
* **Notion:** Biedt flexibele databanken, notities, wiki's en integraties [36](#page=36).
* **OneNote:** Gestructureerde notities binnen Microsoft 365 [36](#page=36).
* **Dropbox:** Samenwerken aan documenten met real-time synchronisatie [36](#page=36).
* **Google Drive:** Cloudopslag met AI-integratie en toegangsbeheer [36](#page=36).
* **GitHub:** Versiebeheer, documentatie en samenwerking aan code en projecten [36](#page=36).
Voordelen van een dynamische knowledge base zijn een centrale bron van waarheid, altijd actuele informatie en eenvoudige integratie met AI Agents [36](#page=36).
### 3.6 Het opbouwen van kwalitatieve kennis
Voor een effectieve kennisbasis zijn de volgende principes belangrijk [37](#page=37):
* **Kwaliteit boven kwantiteit:** Focus op accurate en relevante informatie [37](#page=37).
* **Consistente structuur:** Gebruik een logische mappenindeling en duidelijke naamgeving voor documenten [37](#page=37).
* **Vaste template voor documenten:** Standaardiseer de opmaak [37](#page=37).
* **AI-vriendelijk formaat:** Gebruik koppen en subkoppen, schrijf duidelijk en beknopt, en vermijd complexe tabellen [37](#page=37).
## 4. Workflows automatiseren
### 4.1 Van enkele agent naar orkest
Eén AI-agent voert doorgaans één specifieke taak uit. Wanneer meerdere agents en tools samenwerken binnen een gestroomlijnd proces, ontstaat er een **workflow**. Dit resulteert in een intelligent systeem dat complexe processen autonoom kan automatiseren [38](#page=38).
### 4.2 Workflow Automation
Workflow automation combineert meerdere agents en tools in een gestroomlijnd proces. Dit biedt aanzienlijke voordelen [38](#page=38):
* **Tijdsbesparing:** Repetitieve taken verdwijnen [38](#page=38).
* **Consistentie:** Eliminatie van menselijke fouten [38](#page=38).
* **Schaalbaarheid:** Workflows blijven werken, ongeacht het volume (bv. 100 of 10.000 tickets) [38](#page=38).
* **24/7 beschikbaarheid:** Agents werken continu [38](#page=38).
* **Kostenreductie:** Minder handmatig werk [38](#page=38).
### 4.3 De Workflow Lagen
Een workflow kan worden opgedeeld in verschillende functionele lagen [39](#page=39):
* **Laag 1: Triggers:** Bepaalt wanneer de workflow start. Voorbeelden zijn een nieuwe e-mail, formulierinzending, geplande tijd, of een nieuw bestand in een map [39](#page=39).
* **Laag 2: AI Agent Processing:** Analyseert de input en bepaalt de benodigde actie [39](#page=39).
* **Laag 3: Decision Logic:** Bevat de logica voor besluitvorming, zoals if/then regels of routing op basis van de output van de AI agent [39](#page=39).
* **Laag 4: Actions:** De daadwerkelijke uitvoer van taken, zoals het versturen van een e-mail, het creëren van een ticket, of het updaten van een database [39](#page=39).
* **Laag 5: Monitoring:** Zorgt voor het bijhouden van de workflow's status, inclusief logs, alerts en dashboards [39](#page=39).
### 4.4 Mogelijke uitdagingen bij workflow automation
Bij het implementeren van workflow automation kunnen diverse uitdagingen optreden [39](#page=39):
* **Integratie met bestaande systemen:** Vooral met legacy systemen kan integratie complex zijn [39](#page=39).
* **Datakwaliteit en beschikbaarheid:** Onvolledige of inconsistente data vormen een risico voor de betrouwbaarheid van de workflow [39](#page=39).
* **Veranderingsmanagement:** Teams moeten begeleid en opgeleid worden om effectief met de geautomatiseerde processen te werken [39](#page=39).
* **Governance:** Beveiliging, naleving van regelgeving, en risicobeheer moeten adequaat worden gewaarborgd [39](#page=39).
### 4.5 Workflow Automation Tools
Er zijn diverse tools beschikbaar voor het bouwen van workflows [40](#page=40):
* **Zapier:** Een van de meest bekende tools met meer dan 7000 app-integraties en een visuele workflow builder. Biedt een gratis tier met 100 taken per maand [40](#page=40).
* **Make.com (voorheen Integromat):** Biedt krachtigere logica dan Zapier en beschikt over ingebouwde AI agents. De gratis tier omvat 1000 operations per maand [40](#page=40).
* **n8n (Open Source):** Volledig zelf te hosten, wat resulteert in geen limieten, maar vereist meer technische kennis en flexibiliteit [40](#page=40).
* **Zelf scripten in Python:** Voor maximale controle en flexibiliteit wanneer geen afhankelijkheid van externe tools gewenst is [40](#page=40).
#### 4.5.1 Make.com Componenten en Terminologie
Make.com structureert workflows met de volgende elementen [40](#page=40) [41](#page=41):
* **Scenarios:** Geautomatiseerde workflows die via een drag-and-drop interface worden gebouwd en beheerd [41](#page=41).
* **Modules:** Individuele stappen binnen een scenario, die apps of acties vertegenwoordigen. Elk icoon in de builder is een module. Een module ontvangt input, voert verwerking uit en genereert output [40](#page=40) [41](#page=41).
* **Bundles:** Datapakketten die door de workflow stromen. Elke module produceert een bundle, die als input dient voor de volgende module. Data wordt vaak opgeslagen in een JSON-structuur [40](#page=40).
* **Operations:** Het aantal keren dat een module wordt uitgevoerd. Dit telt mee voor de limiet van het abonnement, waarbij 1 executie gelijk staat aan 1 operation. Monitoring van operations is belangrijk voor kostenbeheer [40](#page=40).
**Belangrijke secties in Make.com:** [41](#page=41).
* **Org:** Overzicht van de organisatie en werkruimtes [41](#page=41).
* **Scenarios:** Beheer van automatiseringen [41](#page=41).
* **AI Agents (Beta):** Mogelijkheid om AI-gedreven automatiseringen te maken en te beheren [41](#page=41).
* **Connections:** Beheer van API- en appverbindingen [41](#page=41).
* **Webhooks:** Ontvangen van data van externe bronnen [41](#page=41).
* **Templates:** Starten met vooraf gemaakte scenario's [41](#page=41).
* **Data stores:** Opslaan van gegevens binnen Make [41](#page=41).
* **Keys:** Beheer van API-sleutels [41](#page=41).
* **Devices:** Koppelen van apparaten aan Make [41](#page=41).
* **Data structures:** Definieren van eigen datastructuren [41](#page=41).
* **Custom Apps:** Bouwen van aangepaste integraties [41](#page=41).
### 4.6 Het bouwen van een workflow: Documenten analyse voorbeeld
Een voorbeeld van een workflow is de automatische analyse van documenten [32](#page=32) [41](#page=41):
1. **Dropbox - Watch Files:** Detecteert nieuwe bestanden in een specifieke Dropbox-map [33](#page=33).
2. **Dropbox - Download a File:** Download het nieuw toegevoegde bestand [33](#page=33).
3. **PDF.co - Convert from PDF:** Converteert de PDF naar tekst of een JSON-structuur [33](#page=33).
4. **Make AI Agents - Run an Agent:** Laat een AI-agent de inhoud analyseren of samenvatten [33](#page=33).
5. **JSON - Parse JSON:** Zet de AI-output om naar bruikbare data [33](#page=33).
6. **Google Sheets - Add a Row:** Voegt de verwerkte informatie toe aan een spreadsheet [33](#page=33).
#### 4.6.1 Workflow besturingselementen
Bij het bouwen van een workflow in Make.com zijn diverse besturingselementen beschikbaar [34](#page=34):
* **Run once:** Voer het scenario één keer uit voor testen [34](#page=34).
* **Every 15 minutes:** Automatische geplande uitvoering [34](#page=34).
* **Save:** Sla wijzigingen op [34](#page=34).
* **Run:** Start het scenario handmatig [34](#page=34).
* **Settings:** Configureer scenario-opties zoals foutmeldingen en logging [34](#page=34).
* **… (Menu):** Export/Import van workflows in JSON-formaat [34](#page=34).
### 4.7 Data doorgeven in Workflows
Computers moeten data opslaan en uitwisselen, waarvoor dataformaten essentieel zijn [43](#page=43).
* **Bekende formaten:** `.txt` (platte tekst), `.csv` (tabellen), `.json` (gestructureerde data voor AI en software) [43](#page=43).
* **Consistente formaten:** Zorgen voor betrouwbare communicatie tussen systemen [43](#page=43).
#### 4.7.1 JSON als universele taal
**JSON (JavaScript Object Notation)** is de universele taal in de computerwereld [43](#page=43):
* Het is tekstgebaseerd, leesbaar en gestructureerd [43](#page=43).
* Het maakt gebruik van sleutel-waarde-paren (key-value pairs) [43](#page=43).
Voorbeeld van een JSON-object:
```json
{
"titel": "AI for Business – Les 6",
"auteur": "Boonen, E.",
"jaar": 2025
}
``` [43](#page=43).
### 4.8 Waarom is een workflow "agentic"?
De workflow analyse van documenten is "agentic" vanwege de volgende kenmerken [44](#page=44):
* **Autonome trigger:** Reageert automatisch op nieuwe bestanden zonder menselijke tussenkomst [44](#page=44).
* **Multi-step reasoning:** Het proces verloopt via meerdere stappen (PDF naar tekst, analyse, structuur, opslag) [44](#page=44).
* **Decision making:** De AI-agent analyseert en structureert de data zelfstandig [44](#page=44).
* **Tool use:** Er worden verschillende tools (PDF.co, Google Sheets) gebruikt om het doel te bereiken [44](#page=44).
* **Continuous loop:** De workflow kan oneindig nieuwe documenten blijven verwerken [44](#page=44).
### 4.9 Risico's en Mitigatie bij Agentic AI en Workflows
Net als bij autonome agents, brengt workflow automation risico's met zich mee die beheerd moeten worden [44](#page=44):
* **Black box probleem:** Het kan moeilijk zijn om te begrijpen waarom bepaalde beslissingen zijn genomen [44](#page=44).
* **Mitigatie:** Log alle stappen en begrijp het besluitvormingspad (decision pathway) [44](#page=44).
* **Cascade fouten:** Eén fout kan het hele systeem beïnvloeden [44](#page=44).
* **Mitigatie:** Definieer helder wat de agent nooit mag doen [44](#page=44).
* **Overafhankelijkheid:** Te veel vertrouwen in geautomatiseerde beslissingen [44](#page=44).
* **Mitigatie:** Overweeg altijd of een simpele prompt volstaat in plaats van een agentic oplossing [44](#page=44).
* **Bias versterker:** AI kan vooroordelen versterken [44](#page=44).
* **Mitigatie:** Voer een risico/batenanalyse uit en weeg voordelen tegen risico's af [44](#page=44).
* **Verantwoordelijkheid:** Wie is aansprakelijk bij fouten [44](#page=44)?
* **Mitigatie:** Start conservatief met beperkte autonomie [44](#page=44).
De kernvraag blijft: "Is autonomie echt nodig?" [44](#page=44).
## 5. Conclusie: Wat neem je mee?
* Jij bent niet langer alleen gebruiker, maar ontwerper van intelligente systemen [45](#page=45).
* Agentic AI gaat over autonome systemen, niet alleen over slimme chatbots [45](#page=45).
* De kracht ligt in het orkestreren van agents en tools in workflows [45](#page=45).
* Met grote autonomie komt grote verantwoordelijkheid. Ethiek en risicobeheer zijn cruciaal [45](#page=45).
---
# AI-integratie en strategie
Dit onderwerp behandelt de structurele en doordachte opname van AI in organisaties, inclusief de verschillende integratieniveaus, succesfactoren, business cases en impactmeting.
### 3.1 Wat is AI-integratie?
AI-integratie gaat verder dan het simpelweg gebruiken van een tool; het houdt in dat AI-technologie structureel en doordacht wordt opgenomen in de organisatie. Dit is fundamenteel anders dan adoptie (experimenteren) of automatisering (taken overnemen), en richt zich op organisatietransformatie ("anders werken") [48](#page=48) [49](#page=49).
#### 3.1.1 Niveaus van AI-integratie
Er worden drie niveaus van integratie onderscheiden, oplopend in complexiteit en impact [49](#page=49):
* **Niveau 1: AI voor jezelf**
* **Kenmerken:** Gericht op individuele taken en persoonlijke efficiëntie. Heeft een lage drempel om te starten en levert snelle resultaten, maar met beperkte organisatorische impact [49](#page=49).
* **Risico's:** Gedeelde kennis kan ontbreken, werkwijzen kunnen inconsistent zijn, en privacy/security zijn mogelijk niet gegarandeerd [49](#page=49).
* **Voorbeeld:** Het gebruik van Grammarly om persoonlijke schrijfkwaliteit te verhogen, wat leidt tot tijdsbesparing voor de individuele gebruiker [50](#page=50).
* **Niveau 2: AI voor het team**
* **Kenmerken:** Integratie in gedeelde processen met gezamenlijke verantwoordelijkheid. De focus ligt op procesverbetering en vereist afstemming en training binnen het team [50](#page=50).
* **Succesfactoren:** Duidelijke afspraken, teambrede training en feedbackloops [50](#page=50).
* **Voorbeeld:** Een AI-ondersteuning voor handelsofficieren die relevante voorbeelden suggereert, wat leidt tot tijdsbesparing en betere kwaliteit per case [51](#page=51).
* **Niveau 3: AI voor de organisatie**
* **Kenmerken:** Richt zich op strategische transformatie met een AI-first strategie, een data-gedreven cultuur en continue innovatie. AI beïnvloedt strategische keuzes [51](#page=51).
* **Vereisten:** Leiderschapscommitment, datavolwassenheid, AI-competenties en ethische frameworks [51](#page=51).
* **Voorbeeld:** Een retailer die AI toepast voor voorraadbeheer, prijsstelling en kassasystemen om verspilling te verminderen, de omzet te verhogen en de duurzaamheid te verbeteren [52](#page=52).
> **Tip:** Adoptie is geen integratie; adoptie is een kostenpost, terwijl integratie een investering is [52](#page=52).
#### 3.1.2 Waarom AI-projecten falen
Een groot deel van de AI-projecten mislukt, met harde cijfers die variëren van 70-95% falen en 85% die hun doelen niet halen. Oorzaken zijn onder andere [53](#page=53):
* Bedrijfsdoelen die niet aansluiten bij AI-mogelijkheden [53](#page=53).
* Gebrek aan aandacht voor verandering en training [53](#page=53).
* Onduidelijke leiding [53](#page=53).
* Het "Big Bang" anti-patroon: een directe, organisatiebrede implementatie zonder ruimte voor leren en bijsturen [60](#page=60).
Meest gemaakte fouten omvatten het beginnen met data in plaats van het probleem, vage doelen, het onderschatten van AI-expertise en het behandelen van AI als standaard software. In België blijven veel projecten steken in de testfase (44%) door een tekort aan technische AI-skills (35%) en cognitieve vaardigheden (39%) [61](#page=61).
### 3.2 De 4 pijlers voor een succesvolle AI-integratie
Succesvolle AI-integratie rust op vier cruciale pijlers [54](#page=54):
1. **Data – De brandstof:**
* **Principe:** "Garbage in, garbage out". De kwaliteit van de data is essentieel [54](#page=54).
* **Data quality checklist:**
* Nauwkeurig (geen onmogelijke waarden) [54](#page=54).
* Volledig (geen ontbrekende data) [54](#page=54).
* Consistent (bronnen kloppen) [54](#page=54).
* Tijdig (actueel genoeg) [54](#page=54).
* Relevant (past bij de vraag) [54](#page=54).
* **Actie:** Verbeter eerst de datakwaliteit voordat AI wordt ingezet [54](#page=54).
2. **Cultuur – De mindset:**
* **Ondersteunende cultuur:** Stimuleert experimenteren ("Probeer het uit en deel wat je leert"), ziet fouten als leermomenten en bevordert open discussie over AI [55](#page=55).
* **Blokkerende cultuur:** Kenmerkt zich door weerstand ("Dat hebben we altijd zo gedaan"), angst voor verandering en gebrek aan experimenteerruimte [55](#page=55).
* **Impact:** Zelfs de beste AI-tool faalt in een angstige cultuur [55](#page=55).
3. **Opleiding – De skills:**
* **Technische skills:** Omvat AI-basis, toolvaardigheid en data literacy [55](#page=55).
* **Soft skills:** Belangrijk zijn kritisch denken (output controleren), creativiteit (nieuwe toepassingen) en aanpassingsvermogen (blijven leren) [55](#page=55).
* **Noot:** Training is geen eenmalige gebeurtenis maar vereist continue bijscholing vanwege de snelle ontwikkelingen in AI [55](#page=55).
4. **Iteratie – Het proces:**
* **Essentie:** AI-projecten zijn complex en onvoorspelbaar, wat experimenteren, meten en aanpassen noodzakelijk maakt [56](#page=56).
* **Iteratief proces:**
* Piloot (klein experiment) [56](#page=56).
* Meten (resultaten analyseren) [56](#page=56).
* Leren (waarom wel/niet?) [56](#page=56).
* Aanpassen (verbeteren) [56](#page=56).
* Schalen (uitrollen) [56](#page=56).
### 3.3 Jouw AI-kansen!
AI-integratie begint niet bij de technologie, maar bij het begrijpen van je eigen werk. Elke job is een verzameling van rollen en taken, en AI moet worden geïntegreerd in specifieke taken binnen die rollen [57](#page=57).
#### 3.3.1 De 3 A's van AI in je rol
Niet alles moet worden geautomatiseerd; de toegevoegde waarde zit in het slim toepassen van AI [58](#page=58):
* **Automatisering:** AI neemt taken volledig over (bv. data-entry, standaardantwoorden). "AI doet het repetitieve, jij bewaakt de kwaliteit." [58](#page=58).
* **Augmentatie:** AI ondersteunt bij taken (bv. onderzoek, analyse, brainstormen). "AI denkt mee, maar jij beslist." [58](#page=58).
* **Authenticiteit:** Blijft menselijk werk (bv. ethiek, visie, relaties). "AI helpt je wel sneller werken, maar jij maakt het betekenisvol." [58](#page=58).
#### 3.3.2 Kerntaken versus Frustraties
Een analyse van je rol, met name gericht op frustraties (waar het wringt), kan de grootste AI-kansen onthullen [58](#page=58).
#### 3.3.3 Impact-Haalbaarheid matrix
AI-kansen kunnen worden geplot op basis van hun impact (wat levert het op?) en haalbaarheid (kun je het vandaag al doen?) [59](#page=59):
* **Quick wins:** Laag risico, snel resultaat. Ideaal om mee te beginnen (bv. meeting-samenvattingen, AI-hulp bij rapporten) [59](#page=59).
* **Strategische projecten:** Grote ideeën met veel potentieel, maar vereisen meer voorbereiding (bv. klantprofielen met AI, voorspellende analyse) [59](#page=59).
* **Leuke extra's:** Handige tools voor leren of experimenteren, maar zonder grote impact (bv. templates, AI-suggesties) [59](#page=59).
* **Tijdverspillers:** Te vermijden, kost meer dan het oplevert (bv. overbodige AI-functies) [59](#page=59).
### 3.4 Succesvol implementeren
Het succesvol implementeren van AI vereist een strategische aanpak die verder gaat dan simpele technologie-implementatie.
#### 3.4.1 Proces analyse en mapping
Voordat AI wordt ingezet, is het cruciaal om processen grondig te begrijpen. Dit omvat [66](#page=66):
* Het doel van het proces vaststellen [66](#page=66).
* Stakeholders identificeren [66](#page=66).
* Pijnpunten (waar het fout gaat) opsporen [66](#page=66).
* De business impact van de huidige situatie kwantificeren [66](#page=66).
**Proces mapping**, vaak met een swimlane diagram, brengt de huidige werking visueel in kaart. Dit helpt bij het identificeren van bottlenecks, inefficiënties, en dataflows, en vormt de basis voor verbeteringen. Een checklist voor swimlanes zorgt voor duidelijkheid over eigenaren, stappen, handoffs, wachttijden, en bottlenecks [67](#page=67) [68](#page=68).
#### 3.4.2 De AI Business Case
Een business case is een onderbouwd voorstel dat aantoont waarom een AI-initiatief de moeite waard is. Zonder een duidelijke business case blijven AI-ideeën vaak wensen. Het **AI Business Case Canvas** biedt een gestructureerd kader [70](#page=70) [71](#page=71):
1. **Probleem:** Wat gaat er mis? Dit moet specifiek, meetbaar en gekwantificeerd zijn in termen van tijd, geld en kwaliteit [72](#page=72).
2. **Oplossing:** Hoe gaat AI dit oplossen? Specificeer de tool/technologie, de werking in de praktijk, en de scope [73](#page=73).
3. **Kosten:** Wees realistisch en conservatief, inclusief verborgen kosten zoals interne uren, en plan een buffer van 10-15% voor onvoorziene uitgaven [73](#page=73).
4. **Baten:** Kwantificeer de opbrengsten in euro's en kwaliteit, zoals tijdsbesparing, kwaliteitsverbetering, omzetimpact, en medewerkerstevredenheid [74](#page=74).
5. **Risico's:** Identificeer technische, organisatorische en ethische risico's en plan mitigatiemaatregelen [74](#page=74).
6. **Implementatie:** Stel een concreet stappenplan op met duidelijke eigenaren en check-ins [75](#page=75).
#### 3.4.3 De Productiviteit Paradox
Technologie, inclusief AI, moet als een tool worden gebruikt, niet als een baas. De paradox is dat investeringen in AI niet altijd leiden tot een stijging in productiviteit, en soms zelfs tot een daling. Oorzaken zijn onder andere [78](#page=78) [79](#page=79):
* AI die niet past in bestaande workflows [78](#page=78).
* Weerstand tegen verandering [78](#page=78).
* Te veel vertrouwen in AI, wat leidt tot fouten [78](#page=78).
* Verborgen kosten (training, support, aanpassingen) [78](#page=78).
AI voor routine kan tijd vrijmaken voor menselijk contact en betekenisvoller werk, waardoor de druk afneemt [79](#page=79).
#### 3.4.4 AI-impact meten
AI-impact moet in zes dimensies worden gemeten, bij voorkeur al voordat de implementatie start [80](#page=80):
* **Efficiëntie:** Tijdsbesparing (uren/week), gemeten via tijdregistratie of systeemlogs [80](#page=80).
* **Kwaliteit:** Minder fouten, hogere precisie, gemeten via foutpercentages, nauwkeurigheid of klanttevredenheid [81](#page=81).
* **Kosten:** Directe besparingen op materiaal, licenties, etc., gevolgd via kostenanalyse of budgettracking [81](#page=81).
* **Medewerkerstevredenheid:** Betere prestaties door gelukkigere medewerkers, gemeten via surveys, turnover rates of ziektedagen [82](#page=82).
* **Klantwaarde:** Betere ervaring en hogere loyaliteit, gemeten via NPS, tevredenheidsscores of churn rate [82](#page=82).
* **Innovatie:** Meer ruimte voor strategisch werk en minder "brandjes blussen", gemeten via tijdsbesteding analyse of projectportfolio [83](#page=83).
> **Tip:** Begin met het probleem, niet met de technologie. Meet alles, betrek mensen, denk in business cases en voorkom de productiviteitsparadox door AI voor richting te gebruiken, niet alleen voor snelheid [83](#page=83).
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Gestructureerde data | Data die is georganiseerd in een gedefinieerd formaat, zoals tabellen in databases of spreadsheets, waardoor het gemakkelijk te doorzoeken en analyseren is. |
| Ongestructureerde data | Data die geen vooraf gedefinieerd formaat heeft, zoals tekst, afbeeldingen, audio en video, wat de analyse complexer maakt. |
| Levenscyclus van data | Het volledige traject dat data doorloopt, van het verzamelen en opslaan tot het analyseren, interpreteren en uiteindelijk gebruiken ervan. |
| Garbage in, garbage out (GIGO) | Een principe dat aangeeft dat de kwaliteit van de output van een systeem afhankelijk is van de kwaliteit van de input; slechte data leidt tot slechte resultaten. |
| Bias in data | Systematische fouten of vertekeningen in data die kunnen leiden tot oneerlijke of onjuiste resultaten wanneer deze worden gebruikt om AI-modellen te trainen. |
| Correlatie | Een statistische relatie tussen twee of meer variabelen waarbij veranderingen in de ene variabele gepaard gaan met veranderingen in de andere, maar zonder noodzakelijkerwijs een oorzakelijk verband aan te tonen. |
| Causaliteit | Het principe dat één gebeurtenis of factor direct een andere gebeurtenis of factor veroorzaakt; er is een oorzaak-gevolg relatie. |
| Simpson's Paradox | Een fenomeen waarbij een trend die zichtbaar is in verschillende groepen data, verdwijnt of omkeert wanneer deze groepen worden samengevoegd tot een totale dataset. |
| Participation Bias | Een vertekening die optreedt wanneer alleen een specifieke, gemotiveerde subgroep van de populatie deelneemt aan onderzoek of dataverzameling, wat leidt tot overschatting van bepaalde kenmerken. |
| Selection Bias | Een vertekening die ontstaat wanneer de manier waarop data of deelnemers worden geselecteerd ervoor zorgt dat bepaalde groepen onevenredig worden over- of ondervertegenwoordigd, waardoor de resultaten niet representatief zijn. |
| Measurement Bias | Een vertekening die voortkomt uit de manier waarop variabelen worden gemeten, wat leidt tot systematische fouten of onnauwkeurigheden in de verzamelde data. |
| Confirmation Bias | De neiging om informatie te zoeken, interpreteren en te onthouden op een manier die de eigen bestaande overtuigingen of hypothesen bevestigt. |
| Outlier Bias | Een vertekening die optreedt wanneer extreme waarden (outliers) in een dataset onevenredig veel invloed hebben op de analyse of wanneer ze verkeerd worden geïnterpreteerd. |
| AI Agent | Een autonoom systeem dat is ontworpen om taken uit te voeren, beslissingen te nemen en te interageren met zijn omgeving, vaak gebruikmakend van externe tools en geheugen. |
| Agentic AI | De eigenschap of het concept van AI-systemen die in staat zijn om autonoom te handelen, te plannen en beslissingen te nemen zonder directe menselijke tussenkomst voor elke actie. |
| Workflow automation | Het proces van het stroomlijnen en automatiseren van een reeks taken of processen met behulp van technologie, vaak door AI-agents en verschillende tools te laten samenwerken. |
| Data Governance | Het overkoepelende beheer van de beschikbaarheid, bruikbaarheid, integriteit en beveiliging van de data die in een organisatie wordt gebruikt, inclusief het vaststellen van beleid en procedures. |
| AI Business Case | Een gedocumenteerd voorstel dat de rationale en verwachte voordelen van het implementeren van AI onderbouwt, inclusief kosten, baten en risico's, om investeringsbeslissingen te ondersteunen. |
| Productiviteitsparadox | Het fenomeen waarbij investeringen in technologie, zoals AI, niet altijd leiden tot de verwachte stijging in productiviteit, soms zelfs tot een daling. |
| Return On Investment (ROI) | Een financiële maatstaf die wordt gebruikt om de winstgevendheid van een investering te evalueren door de opbrengsten te vergelijken met de kosten. |
| JSON (JavaScript Object Notation) | Een lichtgewicht data-uitwisselingsformaat dat gemakkelijk te lezen en te schrijven is voor mensen en eenvoudig te parsen en genereren is voor machines, veel gebruikt in software en API's. |
Cover
Marktanalyse les 7.pptx
Summary
# Opstellen van een vragenlijst
Dit onderwerp behandelt de structuur, logische volgorde en de verschillende typen vragen die gebruikt kunnen worden bij het opstellen van een vragenlijst voor marktonderzoek.
### 1.1 Structuur en logische volgorde
Een efficiënte vragenlijst vereist een doordachte structuur en een logische volgorde van de vragen. Dit zorgt voor een betere respons en verhoogt de kwaliteit van de verzamelde data. Een typische logische volgorde kan de volgende stappen omvatten:
1. **Merkbekendheid**: Beginnen met algemene vragen over bekendheid met merken of concepten.
2. **Merximago**: Vervolgens de perceptie van respondenten over het imago van merken onderzoeken.
3. **Merkvoorkeur**: Daarna vragen naar de voorkeur van respondenten voor specifieke merken.
4. **Verwachtingen**: Afsluiten met vragen over de verwachtingen van respondenten met betrekking tot producten of diensten.
Deze opbouw kan worden gevisualiseerd met een flowchart om de navigatie voor de respondent soepel te laten verlopen.
### 1.2 Typen enquêtevragen
Er zijn diverse typen enquêtevragen die gebruikt kunnen worden, elk met eigen voordelen voor het verzamelen van specifieke soorten data.
#### 1.2.1 Meerkeuzevragen
Meerkeuzevragen zijn het meest populaire type, omdat ze respondenten de mogelijkheid geven één of meerdere opties te kiezen uit een vooraf gedefinieerde lijst.
* **Voordelen**:
* Intuïtief en gemakkelijk te beantwoorden voor respondenten.
* Leveren eenvoudig te analyseren, gestructureerde gegevens op.
* De antwoordopties sluiten elkaar uit (indien correct geformuleerd).
* Verhogen het comfort van de respondent tijdens het invullen van de enquête.
* Leveren duidelijke gegevens op voor analyse.
* **Toepassing**: Met name geschikt voor imago-meting.
* **Software-implementatie**: In tools zoals Microsoft Forms kan dit type vraag worden aangeduid als 'choice'.
#### 1.2.2 Schaalvragen
Schaalvragen, zoals een schaal van 1 tot 10, stellen respondenten in staat om hun mening, tevredenheid of voorkeur te kwantificeren op een numerieke schaal.
* **Voordelen**:
* Maken het mogelijk om gradaties in meningen te meten.
* Leveren kwantitatieve data op die statistisch geanalyseerd kan worden.
* **Toepassing**: Geschikt voor het meten van tevredenheid, bereidheid, of de mate van overeenstemming.
#### 1.2.3 Rangschikkingsvragen
Rangschikkingsvragen vragen respondenten om een reeks items te ordenen op basis van hun voorkeur of belangrijkheid.
* **Toepassing**: Handig om de relatieve belangrijkheid van verschillende factoren te achterhalen.
> **Tip:** Bij het opstellen van meerkeuzevragen is het cruciaal om de antwoordopties zo te formuleren dat ze elkaar uitsluiten en alle relevante mogelijkheden dekken. Voeg indien nodig een optie "anders, namelijk..." toe om respondenten de ruimte te geven voor aanvullingen.
> **Voorbeeld:** Een voorbeeld van een meerkeuzevraag voor een reisorganisatie zou kunnen zijn: "Welk type vakantie spreekt u het meeste aan?" met opties als: Strandvakantie, Actieve vakantie (sport/avontuur), Stedentrip, Culturele reis, Ontspanningsvakantie.
### 1.3 Casus: "De Perfecte Vakantieplanner"
**Omschrijving:** Een reisorganisatie wil een nieuw vakantiepakket ontwikkelen voor jongeren (18-30 jaar) die zowel avontuur als ontspanning zoeken. Een onderzoek wordt opgezet om inzicht te krijgen in de vakantievoorkeuren van deze doelgroep.
**Opdracht:**
* **Kernvraag formuleren:** Bijvoorbeeld: "Welke elementen zijn essentieel in een vakantiepakket voor jongeren (18-30 jaar) die zowel avontuur als ontspanning zoeken?"
* **Vragenlijst opstellen (3-5 vragen + 3 profielvragen):**
* Kies vragen die kwantitatieve data opleveren via gesloten vragen (bijv. meerkeuze, schaal 1-10).
* Zorg dat de vragen relevant zijn voor de kernvraag.
* **Onderzoeksmethode bepalen:** Bijvoorbeeld een online survey via Microsoft Forms.
**Mogelijke inhoud van de vragen (5):**
1. **Voorkeur plaats vakantie:** Welke regio of welk land heeft uw voorkeur voor een vakantie? (Meerkeuze)
2. **Type vakantie:** Welk type vakantie verkiest u, met focus op activiteit (strand, sport, avontuur)? (Meerkeuze)
3. **Logiesvoorkeur:** Welk type accommodatie prefereert u? (Meerkeuze, bv. hotel, hostel, appartement, kampeerplek)
4. **Informatie/Boekingskanaal:** Via welke kanalen zoekt u informatie over vakanties en boekt u deze het liefst? (Meerkeuze)
5. **Reisgezelschap:** Met wie reist u het liefst op vakantie? (Meerkeuze, bv. alleen, met partner, met vrienden, met familie)
**Profielvragen:**
1. Geslacht
2. Leeftijd
3. Studies/Werk (bv. student, werkend, werkzoekend)
* * *
# Case study: De Perfecte Vakantieplanner
Deze casestudy richt zich op het ontwikkelen van een nieuw vakantiepakket voor jongeren, waarbij het formuleren van een onderzoeksvraag en het opstellen van een vragenlijst centraal staan.
### 2.1 Introductie van de casestudy
Een reisorganisatie wenst een nieuw vakantiepakket te creëren specifiek gericht op jongeren tussen 18 en 30 jaar, die een combinatie van avontuur en ontspanning zoeken. De opdracht behelst het opzetten van een onderzoek om de vakantievoorkeuren van deze doelgroep in kaart te brengen.
### 2.2 Opdracht voor de groep
De taak voor de groep bestaat uit twee hoofdonderdelen:
#### 2.2.1 Formuleren van de onderzoeksvraag
Er dient een centrale vraag geformuleerd te worden die het onderzoek moet beantwoorden. Deze vraag moet de kern van het onderzoek omvatten.
* **Voorbeeld onderzoeksvraag:** "Welke elementen zijn essentieel in een vakantiepakket voor jongeren?"
#### 2.2.2 Opstellen van een vragenlijst
Er moeten drie tot vijf enquêtevragen worden bedacht die deel zouden uitmaken van een survey om inzicht te krijgen in de voorkeuren van jongeren. Daarnaast dienen er drie profielvragen (geslacht, leeftijd, studie/werk) te worden toegevoegd.
* **Eisen aan de vragen:**
* De vragen moeten kwantitatieve data opleveren.
* Er dient gebruik te worden gemaakt van gesloten vraagtypen (bijvoorbeeld meerkeuzevragen, schaalvragen van 1-10).
* De vragen moeten relevant zijn voor de geformuleerde onderzoeksvraag.
### 2.3 Onderzoeksmethode
Als onderzoeksmethode wordt een online survey voorgesteld, eventueel via Microsoft Forms.
### 2.4 Mogelijke inhoud van de enquêtevragen
De vragenlijst kan elementen bevatten die relevant zijn voor de hoofdvraag en de voorkeuren van de doelgroep vastleggen. De volgende onderwerpen zijn denkbaar:
* **Voorkeur voor bestemming:** Dit kan variëren van specifieke landen tot regio's.
* **Type vakantie:** Hieronder vallen activiteiten zoals strandvakanties, sportieve vakanties, avontuurlijke reizen, enzovoort.
* **Accommodatie:** Vragen over het soort verblijf dat de voorkeur heeft.
* **Informatie- en boekingskanalen:** Waar en hoe jongeren informatie zoeken en vakanties boeken.
* **Vervoer:** Voorkeuren met betrekking tot het reizen naar de bestemming.
### 2.5 Typen enquêtevragen
Voor het opstellen van de vragenlijst is kennis van verschillende vraagtypen essentieel.
#### 2.5.1 Meerkeuzevragen
Meerkeuzevragen zijn een populair en effectief type. Hierbij kan de respondent één of meerdere antwoorden selecteren uit een vooraf gedefinieerde lijst.
* **Voordelen:**
* Intuïtief voor respondenten.
* Gemakkelijk in gebruik voor verschillende doeleinden.
* Leveren eenvoudig te analyseren gestructureerde data op.
* Antwoordopties sluiten elkaar uit (mits correct geformuleerd).
* Verbeteren de enquête-ervaring voor respondenten.
* Resulteren in duidelijke, analyseerbare gegevens.
* **Toepassing:** Zeer geschikt voor imago-metingen.
#### 2.5.2 Overige vraagtypen (via Microsoft Forms)
Microsoft Forms biedt diverse vraagtypen die nuttig kunnen zijn voor het onderzoek:
* **Choice:** Vergelijkbaar met meerkeuzevragen.
* **Ranking:** Hiermee kunnen respondenten items rangschikken op basis van hun voorkeur.
> **Tip:** Bij het gebruik van meerkeuzevragen is het cruciaal om de antwoordopties zo te formuleren dat ze de lading dekken en waar mogelijk elkaar uitsluiten, tenzij expliciet de bedoeling is dat meerdere opties gekozen kunnen worden.
> **Voorbeeld:** Een meerkeuzevraag over het type vakantie zou kunnen zijn: "Welk type vakantie spreekt u het meest aan? (Selecteer één optie)" met antwoordmogelijkheden zoals "Strandvakantie", "Actieve/sportieve vakantie", "Avontuurlijke reis", "Culturele stedentrip", "Ontspannende wellness-vakantie".
* * *
# Typen enquêtevragen
Dit onderwerp behandelt de populaire en effectieve typen enquêtevragen die worden gebruikt voor het verzamelen van gestructureerde en analyseerbare gegevens, met een specifieke focus op meerkeuzevragen binnen marktonderzoek.
### 3.1 Populaire typen enquêtevragen
Enquêtes maken gebruik van verschillende vraagtypen om informatie te verzamelen. Enkele van de meest gebruikte zijn meerkeuzevragen. Deze vragen zijn populair vanwege hun intuïtieve aard, het gemak waarmee ze kunnen worden gebruikt en de eenvoudig te analyseren gegevens die ze opleveren.
#### 3.1.1 Meerkeuzevragen
Meerkeuzevragen zijn het meest voorkomende type enquêtevraag. Ze bieden respondenten de mogelijkheid om één of meerdere opties te selecteren uit een vooraf gedefinieerde lijst met antwoorden.
**Voordelen van meerkeuzevragen:**
* **Intuïtief en gebruiksvriendelijk:** Respondenten kunnen gemakkelijk antwoorden door een optie te selecteren.
* **Gestructureerde gegevens:** De antwoordopties liggen vast, wat leidt tot gestructureerde enquêtereacties en duidelijke, analyseerbare gegevens.
* **Uitsluitende antwoorden:** De antwoordopties kunnen zo worden opgesteld dat ze elkaar uitsluiten, wat de analyse vereenvoudigt.
* **Prettige deelname:** Door de duidelijke antwoordmogelijkheden wordt de deelname aan de enquête als prettiger ervaren door respondenten.
* **Geschikt voor specifieke toepassingen:** Ze zijn bijzonder nuttig voor metingen van imago en andere kwantitatieve analyses.
**Toepassingen:**
Meerkeuzevragen worden veelvuldig ingezet in marktonderzoek voor diverse doeleinden, zoals het meten van merkimago, het identificeren van productvoorkeuren, het vaststellen van demografische gegevens en het verzamelen van feedback over diensten.
#### 3.1.2 Andere vraagtypen (kort vermeld in bronmateriaal)
Hoewel meerkeuzevragen centraal staan, wordt ook kort verwezen naar andere vraagtypen die in enquêteplatforms zoals Microsoft Forms beschikbaar zijn:
* **Choice (Keuze):** Dit is de Nederlandse vertaling of variant van de meerkeuzevraag.
* **Ranking:** Respondenten rangschikken een lijst van items op basis van hun voorkeur of belangrijkheid.
* **Schaalvragen (bv. 1-10):** Respondenten geven hun mening of beoordeling aan op een numerieke schaal.
> **Tip:** Bij het opstellen van meerkeuzevragen is het cruciaal om de antwoordopties volledig en duidelijk te formuleren. Overweeg of respondenten "alle van toepassing" of "geen van toepassing" moeten kunnen selecteren, afhankelijk van de vraag.
> **Voorbeeld:** Een reisorganisatie die een nieuw vakantiepakket ontwikkelt voor jongeren, zou een meerkeuzevraag kunnen stellen zoals: "Welk type vakantie spreekt u het meest aan? (Kies één optie)" met antwoordopties als "Avontuurlijke vakantie", "Ontspannende strandvakantie", "Culturele rondreis", "Actieve sportvakantie".
### 3.2 Plan en structuur van een vragenlijst
Een logische volgorde van vragen in een vragenlijst is essentieel voor het succes van een onderzoek. Een veelgebruikte structuur volgt een funnel-achtige benadering, waarbij algemene vragen voorafgaan aan specifiekere vragen. Een typische opbouw kan zijn:
1. **Merkbekendheid:** Vragen over de bekendheid met een merk of product.
2. **Merkimago:** Vragen over de perceptie en associaties met het merk.
3. **Merkvoorkeur:** Vragen die de voorkeur van de respondent voor een bepaald merk meten.
4. **Verwachtingen:** Vragen over wat respondenten verwachten van een product of dienst.
Deze gestructureerde aanpak, eventueel ondersteund door een flowchart, helpt respondenten om de vragenlijst logisch te doorlopen en zorgt voor een hogere kwaliteit van de verzamelde gegevens.
#### 3.2.1 Case: "De Perfecte Vakantieplanner"
In een marktonderzoek voor een nieuw vakantiepakket voor jongeren (18-30 jaar) die avontuur en ontspanning zoeken, is het formuleren van een duidelijke onderzoeksvraag essentieel. Bijvoorbeeld: "Welke elementen zijn essentieel in een vakantiepakket voor jongeren?".
Om hierop antwoord te krijgen, kunnen relevante gesloten vragen worden gebruikt, zoals:
* **Voorkeur plaats vakantie:** Welk land of welke regio geeft u de voorkeur?
* **Type vakantie:** Welke activiteiten zoekt u? (bv. strand, sport, avontuur)
* **Logement:** Welk type accommodatie prefereert u?
* **Informatie/boekingskanaal:** Via welke kanalen informeert u zich en boekt u vakanties?
* **Transport:** Welk vervoersmiddel geeft u de voorkeur?
Daarnaast zijn profielvragen (geslacht, leeftijd, studie/werkstatus) belangrijk voor het segmenteren van de gegevens. De methode van onderzoek, bijvoorbeeld een online survey via Microsoft Forms, moet ook worden bepaald.
* * *
## Veelgemaakte fouten om te vermijden
* Bestudeer alle onderwerpen grondig voor examens
* Let op formules en belangrijke definities
* Oefen met de voorbeelden in elke sectie
* Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Marktonderzoek | Het systematisch verzamelen, analyseren en interpreteren van informatie over een markt, consumenten, concurrenten en de omgeving om zakelijke beslissingen te onderbouwen. |
| Vragenlijst | Een gestructureerde set vragen die wordt gebruikt om informatie te verzamelen van respondenten voor een specifiek onderzoeksdoel. |
| Logische volgorde | De rangschikking van vragen in een vragenlijst op een coherente en natuurlijke manier, vaak beginnend met algemene onderwerpen en eindigend met specifieke of gevoelige vragen. |
| Merkbekendheid | De mate waarin consumenten bekend zijn met een bepaald merk, inclusief de herkenning en herinnering van de merknaam en -symbolen. |
| Merkimago | De perceptie en associaties die consumenten hebben met een bepaald merk, gevormd door reclame, ervaringen en reputatie. |
| Merkvoorkeur | De mate waarin consumenten de voorkeur geven aan een bepaald merk boven concurrenten, vaak gebaseerd op merkimago, kwaliteit of prijs. |
| Meerkeuzevragen | Een type vraag waarbij respondenten één of meerdere opties kunnen kiezen uit een vooraf gedefinieerde lijst met antwoorden. |
| Kwantitatieve data | Numerieke gegevens die kunnen worden gemeten, geteld en statistisch geanalyseerd om patronen en relaties te ontdekken. |
| Gesloten vragen | Vragen waarbij respondenten een antwoord moeten kiezen uit een beperkt aantal opties, wat leidt tot gestructureerde en analyseerbare data. |
| Profielvragen | Vragen die demografische informatie verzamelen over respondenten, zoals leeftijd, geslacht en opleidingsniveau, om de resultaten te kunnen segmenteren. |
| Onderzoeksvraag | De centrale vraag die een onderzoek probeert te beantwoorden, en die de richting en focus van het hele onderzoek bepaalt. |
Cover
Samenvatting Data Driven Management.pdf
Summary
# Wat is data en de geschiedenis ervan
Dit onderwerp verkent de definitie van data en de evolutie van opslagtechnologieën door de geschiedenis heen, met een focus op de toenemende hoeveelheden en dalende kosten van dataopslag.
### 1.1. Definitie van data
Data wordt gedefinieerd als digitale informatie die door computers wordt opgeslagen, verwerkt en gemanipuleerd. Dit omvat een breed scala aan informatievormen, zoals tekst, afbeeldingen, figuren, video's, spreadsheets, internetwebsites en sensormetingen [7](#page=7).
### 1.2. Geschiedenis van dataopslag
De geschiedenis van dataopslag wordt gekenmerkt door de ontwikkeling van verschillende opslagmedia, met name floppy disks, harde schijven en de cloud [7](#page=7).
#### 1.2.1. Floppy disks
Floppy disks waren een populair opslagmedium van de jaren 1970 tot het einde van de jaren 1990. De opslagcapaciteit van floppy disks varieerde van enkele kilobytes (KB) tot een paar megabytes (MB). Ze waren geschikt voor het opslaan van een beperkte hoeveelheid data, zoals enkele Word-documenten of kleine afbeeldingen [8](#page=8).
> **Tip:** Een interessante observatie over floppy disks is dat de grootste fysieke disk de kleinste opslagcapaciteit had [8](#page=8).
#### 1.2.2. Hard disk drives (HDD)
Hard Disk Drives (HDD's) werden geïntroduceerd in de jaren 1950 en zijn tot op heden een essentieel onderdeel gebleven van computeropslag, zowel in datacenters als persoonlijke computers. De capaciteit en snelheid van HDD's zijn door de jaren heen aanzienlijk geëvolueerd. De opslagcapaciteit varieert nu van gigabytes (GB) tot meerdere terabytes (TB). Ter illustratie, één terabyte (TB) aan opslag is ongeveer gelijk aan het opslaan van 200.000 foto's. Moderne mobiele apparaten zoals GSM's, tablets en notebooks maken gebruik van Solid State Drives (SSD's), die intern vergelijkbaar zijn met harde schijven [8](#page=8).
#### 1.2.3. De cloud
De opkomst van de cloud is direct gerelateerd aan de ontwikkeling van het internet en werd geïntroduceerd in de jaren 2000. Cloudopslag stelt gebruikers in staat om gegevens op te slaan op externe servers die toegankelijk zijn via internet. Bekende voorbeelden van cloudopslagdiensten zijn Dropbox, Google Drive en iCloud [8](#page=8).
De cloud functioneert als een service-gebaseerd model waarbij gebruikers opslagruimte "huren" op het internet. Dit maakt het mogelijk om grote hoeveelheden data te uploaden, op te slaan en op te halen vanaf elke locatie. Een significant voordeel van de cloud is de flexibiliteit: de opslagcapaciteit kan worden aangepast aan de veranderende behoeften [8](#page=8).
> **Tip:** De cloud elimineert de traditionele fysieke opslaglimieten die gepaard gingen met eerdere opslagmedia [8](#page=8).
### 1.3. Observaties in de geschiedenis van data
Gedurende de evolutie van dataopslag zijn er een aantal belangrijke observaties te doen:
* Er zijn geen fysieke opslaglimieten meer, mede dankzij de cloud [8](#page=8).
* De kosten voor het opslaan van data zijn aanzienlijk gedaald [8](#page=8).
* Meer en meer organisaties maken de overstap naar cloudopslag [8](#page=8).
* Door de exponentiële toename in hoeveelheden wordt data steeds vaker geclassificeerd als 'big data' [8](#page=8).
* * *
# Data producers en Big Data
Hier is een uitgebreide studiehandleiding voor het onderwerp "Data producers en Big Data".
## 2\. Data producers en Big Data
Dit deel onderzoekt de oorsprong van data, de processen en technologieën die data genereren, en introduceert de vijf V's van Big Data [9](#page=9).
### 2.1. Processen
Een proces is een reeks stappen en beslissingen die betrokken zijn bij het voltooien van werk. Binnen een proces werken mensen en wordt technologie gebruikt. Voorbeelden van processen zijn het klaarmaken van ontbijt, het boeken van een hotelkamer, of het tanken van een voertuig [9](#page=9).
### 2.2. Technologie
Verschillende technologieën produceren data, waaronder sensoren, video, audio en afbeeldingen, het internet, en business applications. Sensoren vallen onder 'the Internet of Things' (IoT) [10](#page=10).
#### 2.2.1. Sensoren
* **Temperatuursensoren:** Controleren de temperatuur tijdens processtappen in sectoren zoals voedingsproductie, chemische processen en landbouw [10](#page=10).
* **Nabijheidssensoren:** Detecteren de aanwezigheid van een object of materiaal in de buurt door middel van geluidssignalen die weerkaatsen als een echo. Ze worden gebruikt in auto's en smartphones [10](#page=10).
* **GPS-locatiesensoren:** Genereren data over locatie [10](#page=10).
#### 2.2.2. Video, audio en afbeeldingen
Videobeelden worden gegenereerd door diverse camera's, zoals normale camera's, smart camera's (met objectherkenning), satellietcamera's en dronecamera's. Het volume van videodata kan snel toenemen, afhankelijk van de resolutie, en is significant groter dan dat van sensordata [10](#page=10).
#### 2.2.3. Internet
Het internet is een primaire en snelgroeiende bron van data afkomstig van websites, sociale media, e-mails, video en meer [11](#page=11).
* **Sociale media:** Het gebruik van platforms zoals Facebook, YouTube, WhatsApp en Instagram genereert grote hoeveelheden data die geëxporteerd en opgeslagen kunnen worden in Social Media Data Stores [11](#page=11).
* **Website traffic data:** Websites verzamelen data over bezoekersaantallen, populaire content en bezoekersinformatie (land, provider). Web scraping wordt gebruikt voor automatische data-extractie, bijvoorbeeld om prijzen van concurrenten te achterhalen [11](#page=11).
* **Online marketing campaigns data:** Data van online marketingcampagnes omvat statistieken zoals impressies, opens, open rate, clicks, click rate en conversies [11](#page=11).
#### 2.2.4. Business applications
Bedrijfsdata wordt verzameld via business applications zoals CRM (Customer Relationship Management), ERP (Enterprise Resource Planning) en Service Desk Management [12](#page=12).
* **CRM-systemen:** Beheren bedrijfsgegevens, relaties, communicatie en interacties (bv. Salesforce, Teamleader) [12](#page=12).
* **ERP-systemen:** Managen dagelijkse bedrijfsactiviteiten (bv. SAP, Odoo) [12](#page=12).
* **Service Desk Management:** Applicaties die incidenten en serviceaanvragen van klanten helpen oplossen en beheren, waarbij tickets worden geregistreerd en opgevolgd [12](#page=12).
#### 2.3. Data in de haven van Antwerpen
De haven van Antwerpen genereert data uit diverse bronnen, zoals scheepsposities (AIS), luchtkwaliteit, waterstanden, drijvend afval, bruggebruik, sluizen en energieverbruik [12](#page=12).
### 2.3. De vijf V's van Big Data
De vijf kernbegrippen van Big Data zijn Volume, Velocity, Variety, Veracity en Value [13](#page=13).
* **Volume:** Verwijst naar de omvang van Big Data, wat gespecialiseerde tools en infrastructuur vereist voor verwerking en analyse [13](#page=13).
* **Velocity:** Geeft de snelheid aan waarmee gegevens worden gegenereerd en verwerkt. Voldoende capaciteit is nodig om de data-instroom tijdig te verwerken en bruikbare inzichten te leveren [13](#page=13).
* **Variety:** Beschrijft de verschillende structuren van data [14](#page=14):
* **Gestructureerd:** Data geordend in tabelstructuren met rijen en kolommen, wat eenvoudige analyse mogelijk maakt (bv. CSV-bestanden, spreadsheets) [14](#page=14).
* **Semigestructureerd:** Data die enkele organisatorische kenmerken behoudt maar niet in tabelvorm is, wat analyse beter mogelijk maakt dan ongestructureerde data (bv. XML-, JSON-gegevens) [14](#page=14).
* **Ongestructureerd:** Data zonder vooraf gedefinieerde organisatie of structuur, wat analyse bemoeilijkt (bv. afbeeldingen, video's, audio-opnames) [14](#page=14).
* **Veracity:** Gaat over de nauwkeurigheid en authenticiteit van gegevens. Data moet gevalideerd worden om een accuraat beeld te garanderen, zonder manipulatie die de nauwkeurigheid aantast [14](#page=14).
* **Value:** Benadrukt de nuttigheid van de gegevens; Big Data moet waarde genereren [14](#page=14).
* * *
# Waarde uit data halen met datagebruikscases en business value pyramids
Dit onderwerp legt uit hoe data kan worden ingezet om zakelijke waarde te creëren via gedefinieerde datagebruikscases en business value pyramids, die zowel objectieve als subjectieve waardecriteria weerspiegelen.
### 3.1 Value streams en data
Een value stream is de reeks activiteiten die noodzakelijk zijn om een product of dienst aan een klant te leveren. Deze stream kent de volgende componenten [16](#page=16):
* **Trigger:** een verzoek dat de stroom initieert [16](#page=16).
* **Steps:** de activiteiten die nodig zijn om de bestelling te verwerken [16](#page=16).
* **Lead time:** de som van alle verwerkingstijden plus de vertragingstijden tussen de stappen [16](#page=16).
* **Value:** de toegevoegde waarde die door het product of de dienst aan de klant wordt geleverd [16](#page=16).
#### 3.1.1 Data use cases (UC)
Een Data UC is een specifieke situatie waarin data wordt gebruikt om een bepaald zakelijk doel te bereiken of een zakelijk probleem op te lossen. Dit toont aan hoe data de waardeketen van een organisatie kan verbeteren om meetbare zakelijke waarde te creëren. Zakelijke waarde is het totale voordeel dat een organisatie uit haar waardeketen haalt en wordt gecreëerd voor diverse belanghebbenden, waaronder klanten, werknemers, aandeelhouders en de maatschappij [17](#page=17).
##### 3.1.1.1 Service desk voorbeeld
Een voorbeeld van een Data UC is de verbetering van een servicedesk. De huidige situatie, waarbij meerdere personen e-mails en telefoons beantwoorden, kan worden geoptimaliseerd door de toevoeging van een chatbot [17](#page=17).
##### 3.1.1.2 Formaat van een Data UC
Een Data UC is doorgaans een eenpaginadocument dat de volgende elementen bevat [17](#page=17):
* De naam van het Data UC [17](#page=17).
* Een korte beschrijving [17](#page=17).
* Hoe dit UC zakelijke waarde aan de organisatie zal toevoegen [17](#page=17).
* Optioneel kunnen ook potentiële kosten, knelpunten en de technische architectuur worden opgenomen [17](#page=17).
### 3.2 Business value pyramids
Value Pyramids schetsen zowel objectieve als subjectieve criteria van business value. Er worden twee soorten piramides onderscheiden [18](#page=18):
#### 3.2.1 Business-to-consumer (B2C) value pyramid
De B2C piramide richt zich op de klant als belanghebbende en de vraag welke factoren klanten motiveren om een product of dienst aan te kopen. Hoe meer klanten, hoe meer waarde er voor de organisatie ontstaat. De elementen van de B2C piramide omvatten [18](#page=18):
* **Sociale impact elementen:** Klanten kopen een product omdat het verbindt met iets groters, zoals andere mensen, de natuur of een hogere macht [18](#page=18).
* **Levensveranderende elementen:** Klanten kopen een product omdat het hen begeleidt in levensveranderende gebeurtenissen [18](#page=18).
* **Emotionele elementen:** Klanten kopen een product omdat het emoties oproept [18](#page=18).
* **Functionele elementen:** Klanten kopen een product omdat het hun behoeften vervult [18](#page=18).
#### 3.2.2 Business-to-business (B2B) value pyramid
De B2B piramide richt zich op de organisatie, bedrijfseigenaar en aandeelhouders, met de vraag hoe zakelijke doelstellingen bereikt kunnen worden. De elementen van de B2B piramide omvatten [18](#page=18) [19](#page=19):
* **Inspirerende waarde:** Het creëren van een inspirerende organisatie die betekenis geeft aan haar stakeholders [19](#page=19).
* **Individuele waarde:** Het helpen van collega's en andere stakeholders om zich te verbeteren, bijvoorbeeld op carrièregebied (netwerkuitbreiding, marktwaarde, reputatie) of persoonlijk vlak (groei, ontwikkeling, plezier) [19](#page=19).
* **Gemak van zakendoen waarde:** Het verbeteren van de interactie en het proces van zakendoen, zowel operationeel (organisatie, vereenvoudiging, connectie) als via toegang (variëteit, configureerbaarheid) en relaties (responsiviteit, expertise, stabiliteit) [19](#page=19).
* **Functionele waarde:** Het verbeteren van de manier van werken van de organisatie, zowel economisch (verbeterde omzet, kostenreductie) als qua prestaties (productkwaliteit, schaalbaarheid, innovatie) [19](#page=19).
* **Basiswaarde:** Het verbeteren van het product of de dienst door te voldoen aan specificaties, een acceptabele prijs te bieden, te voldoen aan regelgeving en ethische normen [19](#page=19).
> **Tip:** Begrijp de specifieke drijfveren van zowel consumenten (B2C) als zakelijke klanten (B2B) om de meest effectieve waardepropositie te formuleren en te communiceren [18](#page=18) [19](#page=19).
* * *
# Data tools, producten en transformaties
Dit gedeelte behandelt diverse data tools, de definitie van data producten en hun onderdelen, en verklaart data transformaties binnen het DIKW framework en typische transformatieprocessen.
## 4\. Data tools, producten en transformaties
### 4.1 Data tools
Diverse tools faciliteren de omgang met data, variërend van eenvoudige toepassingen tot geavanceerde platformen [20](#page=20).
#### 4.1.1 Analytische tools
Analytische tools zijn specifiek ontworpen voor het vastleggen, visualiseren en manipuleren van data [20](#page=20).
* **Spreadsheets:** Dit zijn computerprogramma's waarin data in rijen en kolommen wordt vastgelegd, weergegeven en gemanipuleerd. Ze zijn een van de meest populaire tools, met voorbeelden als Microsoft Excel en Google Sheets [20](#page=20).
* **Dashboards:** Een dashboard is een informatiebeheertool die data uit gekoppelde databases visualiseert. Ze bieden doorgaans hoogstaande informatie in één weergave, maar kunnen data niet manipuleren [20](#page=20).
* **Data science toolboxes:** Dit is een verzameling softwareprogramma's en middelen die datawetenschappers gebruiken om inzichten uit gegevens te verkrijgen. De functionaliteiten omvatten programmeren, datavisualisatie, het toepassen van AI-algoritmen, datamanipulatie, verwerking van grote hoeveelheden data, en geavanceerde statistische berekeningen [20](#page=20).
#### 4.1.2 Digitale applicaties
Digitale applicaties zijn alle applicaties die data verwerken en de resultaten tonen aan de eindgebruiker. De focus ligt hierbij op het tonen van gebruiksklare datainsights, met beperkte ondersteuning voor analyse of manipulatie. Een voorbeeld hiervan is een weerapp [21](#page=21).
#### 4.1.3 AI prompts
Een AI-prompt is elke vorm van tekst, vraag, informatie of codering die aan AI communiceert welk antwoord gezocht wordt. Deze prompts werken in een Q&A of chatbot-achtige interactiestijl, waarbij ChatGPT een bekend voorbeeld is [21](#page=21).
### 4.2 Data producten
Een data product is een herbruikbaar data asset dat data bundelt met alles wat nodig is om het zelfstandig bruikbaar te maken door geautoriseerde gebruikers [22](#page=22).
#### 4.2.1 Onderdelen van een data product
Een data product bestaat uit de volgende kernonderdelen [23](#page=23):
* **Een dataset:** Dit is de verzameling gegevens zelf [23](#page=23).
* **Multi-table dataset:** Meerdere tabellen kunnen gekoppeld worden met behulp van 'keys'.
* **Primary key:** Identificeert data binnen een enkele tabel op unieke wijze. Elke rij in een tabel heeft een unieke primaire key [23](#page=23).
* **Foreign key:** Legt relaties tussen tabellen vast en linkt naar de primaire key van een andere tabel [23](#page=23).
* **Meta data:** Dit is data over data en helpt bij het beschrijven, vinden en beheren van andere gegevens. Meta data bestaat uit verschillende onderdelen [24](#page=24):
* **Basisinformatie:** Bevat de naam, beschrijving en aanmaakdatum van het product [24](#page=24).
* **Data product eigenaarschap:** Details over de eigenaar, hun organisatorische rol en contactinformatie [24](#page=24).
* **Data kwaliteitsmetriek:** Metrieken die de nauwkeurigheid en betrouwbaarheid van de gegevens beoordelen [24](#page=24).
* **Beveiligingsspecificaties:** Informatie over de gevoeligheid van de gegevens, gebruiksbeleid en retentiebeleid [24](#page=24).
* **Datamodellen:** Beschrijft hoe zakelijke entiteiten overeenkomen met de structuren van de datatabel [24](#page=24).
* **Fysiek format:** Dit is nodig om data aan te bieden in een gemakkelijke en leesbare indeling. Ongestructureerde data formaten zijn hiervoor minder geschikt. Twee veelvoorkomende formats zijn [25](#page=25):
* **Gestructureerd (tabellen):** Gemakkelijk te consumeren door zowel tools als mensen [25](#page=25).
* **API's (Application Programming Interface):** Gemakkelijk te consumeren door tools. Een API is een set regels en protocollen voor het bouwen en integreren van applicatiesoftware, en vormt een manier voor twee of meerdere computerprogramma's om met elkaar te communiceren [25](#page=25).
#### 4.2.2 Data product integratie
Data producten zijn interoperabel, wat betekent dat meerdere data producten binnen een organisatie kunnen bestaan, afkomstig kunnen zijn van verschillende gegevensbronnen, en vaak naar elkaar verwijzen. Dit resulteert in een netwerk van data producten [25](#page=25).
### 4.3 Data transformaties
Data transformaties zijn processen die data omzetten om de bruikbaarheid ervan te vergroten, vaak binnen het DIKW-framework [26](#page=26).
#### 4.3.1 DIKW framework
Het DIKW (Data, Information, Knowledge, Wisdom) framework beschrijft de hiërarchische structuur van data naar wijsheid [26](#page=26).
* **Data:** Een verzameling feiten in ruwe of ongeorganiseerde vorm. Het is het basisbouwblok. Voorbeeld: `12012023`, `100`, `FLB` [27](#page=27).
* **Information:** Data die op een gemakkelijkere manier gemeten, gevisualiseerd en geanalyseerd kan worden. Het is het tweede bouwblok. Voorbeeld: `12th of january 2023`, `100 EUR sales revenue`, `Flemish Brabant` [27](#page=27).
* **Knowledge:** Ontstaat door het verbinden van verschillende delen informatie, wat helpt begrijpen hoe deze toegepast kunnen worden om een doel te bereiken. Het is het derde bouwblok. Voorbeeld: `12th of January 2023 is the day with the lowest sales revenue (100 EUR) in Flemish Brabant in 2023. This is because of a webshop timeout that day due to too many website visitors.` [27](#page=27).
* **Wisdom:** De kennis toegepast in de praktijk, wat de top van de DIKW-piramide vormt. Voorbeeld: `Scaling the webshop platform so that this type of timeouts can no longer happen. This will lead to more sales.` [27](#page=27).
#### 4.3.2 Typische data transformaties
Er zijn verschillende typische transformatieprocessen die data bewerken [28](#page=28).
* **Conversie:** Het proces van het omzetten of transformeren van data van de ene vorm naar de andere, bijvoorbeeld van een ruwe indeling (zoals JSON) naar een tabelindeling. Dit is nuttig voor gegevensverwerking en -analyse [28](#page=28).
* **Aggregatie:** Het proces van het combineren en samenvatten van gegevens, waarbij gegevens van een lager detailniveau worden omgezet naar een hoger detailniveau [28](#page=28).
* **Filtering:** Het selecteren en isoleren van specifieke gegevens op basis van vooraf bepaalde selectiecriteria. Afhankelijk van de criteria worden gegevens uitgesloten of opgenomen in de dataset. Het resultaat is een subset van de oorspronkelijke dataset [28](#page=28).
* **Integratie:** Het combineren van gegevens op basis van vreemde keys, ook wel gegevens samenvoegen genoemd. Vijf veelvoorkomende typen zijn [29](#page=29):
* **Inner join:** Bevat alleen de rijen die een overeenkomstige waarde hebben in beide tabellen [29](#page=29).
* **Left join:** Bevat alleen rijen van de linkertabel en de overeenkomstige rijen van de rechtertabel [29](#page=29).
* **Outer join:** Bevat alle rijen van beide tabellen, waarbij ontbrekende delen als null worden weergegeven [29](#page=29).
* **Cross join:** Bevat alle mogelijke combinaties van rijen van beide tabellen [29](#page=29).
* **Union:** Bevat alle rijen uit beide selecties, maar verwijdert dubbele rijen [29](#page=29).
* **Advanced:** Geavanceerde algoritmen, vaak AI-gebaseerd, detecteren patronen, informatie en objecten in ongestructureerde data. Ongestructureerde gegevens worden hiermee informatie door het gebruik van geavanceerde technieken, zoals onderwerpsdetectie [29](#page=29).
* * *
# Data visualisatie, storytelling en kunstmatige intelligentie
Dit onderdeel verkent de synergie tussen data visualisatie en storytelling, en introduceert de fundamentele concepten van kunstmatige intelligentie.
### 6.1 De kracht van data visualisatie en storytelling
Data storytelling is essentieel voor het effectief communiceren van inzichten, aangezien data transformatie en analyse niet volstaan. Het doel is om complexe informatie op een begrijpelijke manier over te brengen door een duidelijk en boeiend verhaal te creëren met de juiste datapunten [31](#page=31).
#### 6.1.1 Hoe analyse en synthese samenkomen
Het proces van data storytelling omvat twee kerncomponenten:
* **Analyse:** Het ontleden van gegevens om patronen, trends en belangrijke bevindingen te identificeren [31](#page=31).
* **Synthese:** Het combineren en integreren van deze bevindingen tot een coherent en gemakkelijk te begrijpen verhaal [31](#page=31).
#### 6.1.2 De combinatie van data, visualisatie en verhaal
Data storytelling is een gestructureerde benadering die drie elementen combineert: de data zelf, de visualisatie daarvan, en het verhaal dat ermee verteld wordt. Het effectief combineren van deze elementen kan verandering beïnvloeden en stimuleren, aangezien data visualisaties en analyses die niet begrepen worden, geen impact zullen hebben [32](#page=32).
> **Tip:** Datavisualisaties en analyses die niet begrepen worden, zullen nooit enige impact hebben.
#### 6.1.3 Waarom storytelling werkt
Het vertellen van een verhaal heeft verschillende redenen waarom het effectief is:
* **Hersenactivatie:** Verhalen activeren onze hersenen anders dan feiten; we voelen verhalen, terwijl we statistieken horen [32](#page=32).
* **Neurale koppeling:** De geest van de verteller en het publiek worden op elkaar afgestemd [32](#page=32).
* **Memorabiliteit:** Verhalen blijven beter hangen [32](#page=32).
* **Overtuigingskracht:** Verhalen kunnen effectiever overtuigen [32](#page=32).
* **Engagement:** Verhalen trekken de aandacht en houden het publiek betrokken [32](#page=32).
#### 6.1.4 Het belang van een narratief
Feiten moeten worden ondersteund door een narratief. Dit vervangt mythes en creëert nieuwe inzichten [32](#page=32).
#### 6.1.5 Het verhaal van Ignaz Semmelweis
Het verhaal van Ignaz Semmelweis, een Hongaarse dokter die onderzoek deed naar kraambedsterfte in Wenen, illustreert de uitdagingen van het presenteren van data. Ondanks dat hij data verzamelde die aantoonde dat handhygiëne de sterfte significant verminderde, werd zijn theorie afgewezen omdat artsen zich aangesproken voelden en logica alleen niet volstond [30](#page=30) [31](#page=31).
> **Tip:** Niet iedereen is bereid om nieuwe gegevens te accepteren, en beslissingen worden vaak meer op emotie dan op logica genomen [31](#page=31).
### 6.2 Best practices voor data storytelling
#### 6.2.1 Verhaalstructuur
Er zijn verschillende manieren om een verhaal te structureren:
* **Basis structuur:** Begin, midden, slot. Dit is een fundamentele, maar minder boeiende aanpak [33](#page=33).
* **Betere structuur:** Normaal, explosie, nieuw normaal. Deze dynamische structuur omvat de initiële situatie (normaal), het hoofdinzicht (explosie), en de oplossing met vervolgstappen (nieuw normaal) [33](#page=33).
#### 6.2.2 Context toevoegen
Context is cruciaal voor het begrijpen van data. Er zijn zes essentiële manieren om context toe te voegen [33](#page=33) [36](#page=36):
* **Vergelijkend:** Hoe verhoudt de data zich tot andere gerelateerde waarden [33](#page=33) [37](#page=37)?
* **Directe vergelijkingen:** Items vergelijken met soortgelijke items [37](#page=37).
* **Indirecte vergelijkingen:** Items van verschillende groottes vergelijken met behulp van verhoudingen of percentages [37](#page=37).
* **Relatieve vergelijkingen:** Aantonen welk deel een cijfer vertegenwoordigt van een totaal [37](#page=37).
* **Informatief:** Welke andere factoren kunnen invloed hebben gehad? Biedt extra details en achtergrondinformatie om patronen, trends of afwijkingen te verklaren [33](#page=33) [37](#page=37).
* **Equivalent:** Is er een meer relateerbare interpretatie? Koppelt onbegrijpelijke getallen aan meer bekende en begrijpelijke voorbeelden [33](#page=33) [37](#page=37).
* **Bevestigend:** Moeten de cijfers worden geverifieerd of gevalideerd? Verduidelijkt significante anomalieën door te tonen waarom ze betrouwbaar en accuraat zijn [33](#page=33) [37](#page=37).
* **Geschaald:** Wat is het gecombineerde effect als het doorgaat? Het opschalen van waarden naar langere periodes kan de totale impact en het belang verduidelijken [33](#page=33) [37](#page=37).
* **Historisch:** Hoe verhoudt het zich tot eerdere prestaties? Toont prestaties over de tijd en houdt rekening met seizoenseffecten [33](#page=33) [37](#page=37).
#### 6.2.3 De 4 D's van data storytelling
De 4 D's vertegenwoordigen een methodologie voor effectieve data storytelling [34](#page=34):
* **Distill (Destilleren):** Vereenvoudig complexe gegevens tot hun essentie, waarbij de meest relevante informatie wordt geëxtraheerd en overbodige details worden weggelaten. Berekende statistieken, zoals dalende inkomsten per klant, zijn vaak inzichtelijker dan totale waarden [34](#page=34).
* **Display (Weergeven):** Presenteer de gegevens op een begrijpelijke en aantrekkelijke manier met behulp van visualisaties. Het doel is om de belangrijkste inzichten direct zichtbaar te maken. Gebruik duidelijke grafieken zoals staafdiagrammen en vermijd gestapelde of 3D-grafieken. Kleuren kunnen gebruikt worden, en elementen die minder belangrijk zijn kunnen lichter worden weergegeven [34](#page=34).
* **Declutter (Ontruimen):** Verwijder onnodige elementen uit visualisaties om de belangrijkste punten duidelijk te maken. Dit vermindert de cognitieve belasting. Het samenvoegen van minder kritieke gegevens, zoals marktaandelen van kleinere markten, kan de duidelijkheid van grotere marktaandelen vergroten. Dit is geïnspireerd door de 'data-ink ratio' [35](#page=35).
* **Direct (Richten):** Leid de aandacht van het publiek naar de belangrijkste inzichten en acties. Visuals moeten het verhaal ondersteunen en ingedeeld zijn op basis van het doel van het verhaal [35](#page=35).
#### 6.2.4 Gebruik van tekst en visuele aanwijzingen
Tekst is een integraal onderdeel van data storytelling. Headlines, titels, labels, aantekeningen en voetnoten zijn even belangrijk als de visuals zelf [36](#page=36). Algemene richtlijnen voor tekstgebruik:
* Tekstblokken mogen maximaal 140 tekens bevatten [36](#page=36).
* Zorg voor een duidelijke koppeling tussen tekst en visuele elementen [36](#page=36).
* Vermijd doorlopende zinnen; kies duidelijke, boodschapsgerichte headlines [36](#page=36).
* De visualisatie moet de kop ondersteunen [36](#page=36).
* Gebruik pijlen, cirkels, boxen of andere visuele aanwijzingen om belangrijke onderdelen te markeren, bij voorkeur in combinatie met annotaties [36](#page=36).
### 6.3 Kunstmatige intelligentie (AI)
#### 6.3.1 Belangrijke vragen en concepten
* **Wat is een AI-model?** Een algoritme of reeks algoritmen getraind om specifieke taken uit te voeren door patronen in data te herkennen en voorspellingen of beslissingen te nemen [38](#page=38).
* **Verschil AI en traditionele programmering:** Traditionele programmering volgt expliciete instructies. AI leert van data; machine learning modellen gebruiken voorbeelden om patronen te herkennen en beslissingen te nemen in plaats van expliciete regels [38](#page=38).
* **AI-serving:** Het proces van implementeren en beschikbaar stellen van een getraind AI-model voor real-time of on-demand voorspellingen/beslissingen [38](#page=38).
* **AI-training:** Het proces waarbij een AI-model data gebruikt om patronen en relaties te leren voor voorspellingen of beslissingen. Dit omvat meestal het optimaliseren van modelparameters [38](#page=38).
* **Turing-test:** Een test voorgesteld door Alan Turing om te bepalen of een machine intelligent gedrag vertoont dat niet te onderscheiden is van een mens, gemeten door gesprekken [38](#page=38).
#### 6.3.2 Belangrijkste AI-capabilities
* **Forecasting:** Voorspellen van toekomstige gebeurtenissen op basis van historische data. Voorbeeld: voorspellen van verkoopcijfers [38](#page=38).
* **Classification:** Categoriseren van data in vooraf gedefinieerde groepen. Voorbeeld: spamdetectie [38](#page=38).
* **Recommendation:** Voorstellen van items aan gebruikers op basis van hun voorkeuren en gedrag. Voorbeeld: filmrecommendaties [38](#page=38).
* **Clustering:** Groeperen van data in clusters met vergelijkbare kenmerken. Voorbeeld: klantsegmentatie op basis van koopgedrag [38](#page=38).
* **Generation:** Creëren van nieuwe data of content, zoals tekst, afbeeldingen of geluid. Voorbeeld: genereren van kunstwerken [38](#page=38).
#### 6.3.3 AI-modellen en concepten
* **Lineaire regressie:** Een statistische techniek die een lineaire relatie tussen onafhankelijke ($x$) en afhankelijke ($y$) variabelen modelleert. Voorbeeld: voorspellen van huizenprijzen op basis van vierkante meters. De relatie kan worden weergegeven als $y = mx + b$ [38](#page=38).
* **Decision tree:** Een beslissingsondersteunend model dat beslissingen en hun mogelijke gevolgen weergeeft in een boomstructuur. Voorbeeld: klantlening goedkeuring op basis van inkomen, kredietgeschiedenis en leeftijd [39](#page=39).
* **Artificial Neural Network (ANN):** Een computermodel geïnspireerd door het menselijk brein, bestaande uit lagen van neuronen die input verwerken en output doorsturen om complexe patronen te leren [39](#page=39).
* **Deep learning:** Een subveld van machine learning dat meerlaagse neurale netwerken gebruikt om complexe patronen in grote datasets te herkennen, effectief voor beeld- en spraakherkenning [39](#page=39).
#### 6.3.4 Prestatie- en bias-concepten
* **Accuracy:** Een maatstaf voor modelprestaties, gedefinieerd als het percentage correcte voorspellingen ten opzichte van het totale aantal voorspellingen [39](#page=39).
* **Overfitting:** Treedt op wanneer een model te goed presteert op trainingsdata maar slecht op nieuwe data. Kan worden overwonnen met cross-validatie, regularisatie en meer trainingsdata [39](#page=39).
* **Generative vs. Discriminative AI:**
* **Generative AI:** Leert de gezamenlijke waarschijnlijkheid van input en output en kan nieuwe data genereren [39](#page=39).
* **Discriminative AI:** Leert de grens tussen klassen en voorspelt labels voor nieuwe data [39](#page=39).
* **Selection bias:** Ontstaat wanneer de trainingsdataset niet representatief is voor de populatie, wat kan leiden tot misleidende voorspellingen. Het gebruik van diverse en representatieve datasets is cruciaal [39](#page=39).
* * *
# Dataplatforms, processen en governance
Dit onderwerp verkent de componenten en processen die ten grondslag liggen aan een dataplatform, met de nadruk op data-inname, opslag, pipelines, beveiliging en governance, en hoe deze elementen samenwerken om datakwaliteit en -beheer te waarborgen [40](#page=40).
### 8.1 Dataplatform: de centrale hub
Een dataplatform fungeert als het centrale verwerkingsknooppunt voor het datalandschap van een organisatie, waar gegevens uit diverse bronnen samenkomen voor beheer en verwerking. Het integreert tools van verschillende leveranciers om de volledige levenscyclus van data te beheren [40](#page=40).
Een uitgebreide dataplatformoplossing ondersteunt kritische functies:
* **Data-inname:** Het verzamelen van data van verschillende bronnen [40](#page=40).
* **Opslag:** Het veilig opslaan van data [40](#page=40).
* **Transformatie:** Het verwerken en analyseren van data om deze om te zetten in nuttige informatie [40](#page=40).
* **Levering:** Het distribueren van data naar de juiste gebruikers of systemen [40](#page=40).
* **Governance:** Het waarborgen van data-integriteit, -kwaliteit en naleving van regelgeving [40](#page=40).
* **Beveiliging:** Het beschermen van data tegen ongeautoriseerde toegang en bedreigingen [40](#page=40).
Dataplatformen stellen organisaties in staat om duurzame waarde uit hun data te halen, zoals het genereren van bedrijfsinzichten voor strategische besluitvorming, het creëren van dashboards voor prestatiebewaking en het ontwikkelen van AI-modellen [40](#page=40).
#### 8.1.1 Data engineers
Data engineers zijn verantwoordelijk voor het creëren en onderhouden van systemen die grote hoeveelheden data verzamelen, opslaan en organiseren. Ze bouwen de infrastructuur die nodig is om data effectief te beheren en ontwerpen pijplijnen die data van de bron naar de plaats verplaatsen waar het kan worden gebruikt. Data pipeline architecten zorgen ervoor dat de data schoon en klaar is voor analyse, wat inhoudt dat de data van hoge kwaliteit is en voldoet aan de vereisten voor gebruik door verschillende teams. Data engineers lossen complexe problemen op die verband houden met datahandeling en -opslag, creëren vaak op maat gemaakte oplossingen en werken innovatief om data efficiënt te verwerken [41](#page=41).
### 8.2 Data-opslagmethoden
#### 8.2.1 Databases
Een database fungeert als een georganiseerd digitaal archief voor snelle zoekopdrachten en data-ophaling, en vormt de basis van veel toepassingen. Databases waarborgen dat alleen geautoriseerde personen toegang hebben tot gegevens, wat helpt bij het beveiligen van privé-informatie. Een databasesysteem beheert de organisatie, opslag en toegang tot gegevens [42](#page=42).
##### 8.2.1.1 Relationele databases (RDB)
Relationele databases structureren informatie in tabellen met rijen (records) en kolommen (velden), wat zorgt voor een overzichtelijke weergave. Ze maken het mogelijk om relaties te leggen tussen verschillende stukken informatie, waardoor gegevens uit diverse tabellen gekoppeld kunnen worden voor een dieper inzicht. Door tabellen te koppelen, kunnen gegevens uit meerdere tabellen samengevoegd worden. Relationele databases bieden krachtigere alternatieven voor functies zoals de VLOOKUP in Excel, en maken complexe queries mogelijk [42](#page=42).
###### 8.2.1.1.1 Structured Query Language (SQL)
SQL is de standaardtaal voor het beheren en manipuleren van relationele databases, gebruikt voor het opvragen, bijwerken en structureren van gegevens. Het is veelzijdig voor data-interactie, inclusief selecteren, samenvoegen, invoegen, bijwerken en verwijderen. SQL heeft een leesbare, intuïtieve syntax die lijkt op natuurlijke taal en wordt breed ondersteund door relationele databasebeheersystemen [43](#page=43).
#### 8.2.2 Data warehouse
Een datawarehouse is een ondernemingsbreed data-platform voor analyse en rapportage van gestructureerde en semigestructureerde gegevens afkomstig van meerdere bronnen. Het slaat actuele en historische gegevens centraal op voor analyse en rapportage, en is nuttig voor trendanalyse en historische vergelijkingen. Datawarehouses zijn een primair onderdeel van business intelligence (BI) en gebruiken analytische databases die geoptimaliseerd zijn voor complexe query's [43](#page=43).
##### 8.2.2.1 OLTP versus OLAP
* **Online Transactional Processing (OLTP):** Systemen geoptimaliseerd voor snelle transacties en dagelijkse operationele taken, waarbij grote hoeveelheden transactionele gegevens door meerdere gebruikers worden verwerkt [44](#page=44).
* **Online Analytical Processing (OLAP):** Systemen ontworpen voor snelle verwerking en analyse van grote hoeveelheden gegevens, bedoeld voor diepgaande data-analyse en het verkrijgen van inzichten uit grote datasets [44](#page=44).
KenmerkOLTPOLAPDoelOndersteuning dagelijkse operationele en transactionele verwerkingData-analyse en het verkrijgen van inzichten uit grote datasetsGegevensverwerkingWerkt met kleine hoeveelheden gegevens, snel in realtime verwerktVerwerkt grote hoeveelheden gegevens, ondersteunt complexe queries voor diepgaande analyseVoorbeeldBedrijfstoepassingen zoals ERP’s en CRM’sAnalytische databases en datawarehouses voor business intelligence
###### 8.2.2.1.1 Data mart
Een data mart is een gespecialiseerde, op een specifieke gebruikersgroep gerichte weergave van data, vaak een subset van een datawarehouse. Het biedt snellere toegang tot gegevens en ondersteunt snellere besluitvorming [44](#page=44).
##### 8.2.2.2 Verticale versus horizontale schaalvergroting
* **Verticale schaalvergroting:** Het toevoegen van meer middelen (RAM, CPU, opslag) aan een bestaande machine om deze krachtiger te maken. Dit is vaak duurder [45](#page=45).
* **Horizontale schaalvergroting:** Het toevoegen van meer machines aan een gedistribueerd systeem om de werklast te verdelen. Dit is vaak goedkoper voor grote hoeveelheden gegevens en complexe queries [45](#page=45).
Voor datawarehouse databases is horizontale schaalvergroting vaak de voorkeursmethode [45](#page=45).
#### 8.2.3 Data lake
Een data lake is een centrale opslagplaats die grote hoeveelheden ruwe gegevens in hun oorspronkelijke formaat opslaat, zonder eerst een structuur op te leggen. Het is ontworpen om flexibel en schaalbaar te zijn voor uiteenlopende soorten data [45](#page=45).
#### 8.2.4 Data lakehouse
Een Data Lake House combineert de voordelen van een traditioneel Data Warehouse en een Data Lake in één geïntegreerde architectuur. Het biedt een balans tussen kosten, schaalbaarheid, volume, datatypen en leesprestaties [46](#page=46).
KenmerkDWHData LakeData LakehouseKosten+++++++SchaalbaarheidVerticaalHorizontaalHorizontaalVolume++++++++++DatatypeGestr.Gestr., Semigestr., Ongestr.Gestr., Semigestr., Ongestr.Leesprestaties+++++++++(+)
### 8.3 Data-inname (Ingest)
Data-ingestie is het proces van het verzamelen van gegevens uit verschillende bronnen en het verplaatsen naar een doellocatie voor verdere verwerking. Het is cruciaal voor downstream datawetenschap, BI en analysetoepassingen en vereist tijdige, volledige en nauwkeurige gegevens. Als data-ingestie wegvalt, kunnen er geen dataproducten gemaakt worden [47](#page=47).
Het operationele vlak (OLTP) is waar alle data bronapplicaties draaien, geoptimaliseerd voor snelle transacties. Het analytische vlak (OLAP) is waar data-analyse, rapportages en complexe query's worden uitgevoerd, met componenten waar gegevens worden geanalyseerd voor inzichten. Ingestie tools verplaatsen gegevens van de bronnen naar het analytische vlak [47](#page=47).
### 8.4 Data pipelines (ETL)
Een data pipeline is een proces dat gegevens van een bron naar een bestemming verplaatst, waarbij zorg wordt gedragen voor zuivering, transformatie en opslag in een geschikt formaat voor analyse. De term ETL staat voor Extracting, Transforming, en Loading [48](#page=48).
Data pipelines worden vaak aaneengeschakeld, waarbij het resultaat van de ene pipeline wordt doorgegeven aan de volgende. Een Direct Acyclic Graph (DAG) wordt gebruikt om de volgorde van uitvoering van deze processen te beheren, waarbij gegevensstromen en afhankelijkheden tussen taken duidelijk worden gedefinieerd [48](#page=48).
### 8.5 Beveiliging
#### 8.5.1 Data classificatie en toegangscontrole
Data classificatie omvat het organiseren van gegevens op gevoeligheid en het instellen van regels voor gegevens toegang om te zorgen dat alleen geautoriseerde individuen gevoelige informatie kunnen openen. Dit proces is cruciaal voor het beschermen van informatie tegen ongeautoriseerde toegang en lekken, en helpt organisaties te voldoen aan wettelijke en regelgevende vereisten met betrekking tot dataprivacy en beveiliging [49](#page=49).
### 8.6 Observeerbaarheid
Observeerbaarheid in een dataplatform houdt in dat de gegevensstroom continu wordt gevolgd om de gezondheid en prestaties van datasystemen te monitoren, problemen vroegtijdig te identificeren en diepgaande inzichten te verkrijgen in hoe het datasysteem opereert [49](#page=49).
### 8.7 Governance
#### 8.7.1 Data lifecycle management (DLM)
DLM is het proces van het beheren van gegevens gedurende hun hele levenscyclus: creëren, opslaan, gebruiken, delen, archiveren en vernietigen. De drie belangrijkste doelen van DLM zijn [49](#page=49):
* **Vertrouwelijkheid:** Gegevens beveiligen tegen onbevoegde toegang, delen en diefstal [49](#page=49).
* **Integriteit:** Zorgen dat gegevens authentiek, accuraat en betrouwbaar zijn [49](#page=49).
* **Beschikbaarheid:** Gegevens beschikbaar maken voor bevoegde gebruikers [49](#page=49).
##### 8.7.1.1 Levenscyclusfasen
* **Creëren (create):** Data kan intern gegenereerd of door IT-systemen verzameld worden [50](#page=50).
* **Opslaan (store):** Na creatie worden gegevens opgeslagen op een gegevensplatform en geclassificeerd op basis van gevoeligheid en waarde [50](#page=50).
* **Gebruiken (use):** Diverse belanghebbenden gebruiken data door middel van analyse en visualisatie, via rapporten, AI-modellen en digitale tools [50](#page=50).
* **Delen (share):** DLM zorgt ervoor dat het delen van gegevens beperkt is tot wat noodzakelijk en toegestaan is door beleid en regelgeving [50](#page=50).
* **Archiveren (archive):** Niet langer gebruikte data wordt meestal gearchiveerd naar goedkope opslag, waardevol voor gegevens die om bedrijfs- of wettelijke redenen bewaard moeten blijven [50](#page=50).
* **Vernietigen (destroy):** Data dat niet meer gebruikt wordt en niet bewaard hoeft te worden, kan worden verwijderd [50](#page=50).
#### 8.7.2 Voordelen van data governance
Data governance is het beleid waarmee een organisatie de kwaliteit, beveiliging, beschikbaarheid en integriteit van haar gegevens beheert. Voordelen zijn [50](#page=50):
* Gemeenschappelijke terminologie rond datasets [50](#page=50).
* Verhoogd vertrouwen in datakwaliteit [50](#page=50).
* Verbeterde herbruikbaarheid van data [50](#page=50).
* Betere mechanismen voor databeheer [50](#page=50).
* Een enkelvoudige bron van waarheid [50](#page=50).
#### 8.7.3 Datamanagement
Datamanagement voert de spelregels van data governance in de praktijk uit. Dit omvat [51](#page=51):
* **Data-architectuur:** Het definiëren welke data aanwezig is en hoe deze door de organisatie stroomt, inclusief business domeinen, processen en entiteiten [51](#page=51).
* **Datamodellering en ontwerp:** Het bieden van een gemeenschappelijk vocabulaire rond gegevens, uitgedrukt in conceptuele, logische en fysieke datamodellen [51](#page=51).
* **Dataopslag en -operaties.** [51](#page=51).
* **Databeveiliging:** Definiëren van beveiligingsbeleid en -procedures [51](#page=51).
* **Data-integratie en interoperabiliteit:** Het verplaatsen en consolideren van gegevens [51](#page=51).
* **Documenten en inhoud.** [51](#page=51).
* **Referentie- en stamgegevens.** [51](#page=51).
* **Datawarehousing en bedrijfsinformatie.** [51](#page=51).
* **Metadata:** Het beheren en beschikbaar maken van gegevensbeheerobjecten [51](#page=51).
* **Datakwaliteit:** Het definiëren van standaarden en implementeren van processen voor kwaliteitsbeheer en -verbetering [51](#page=51).
##### 8.7.3.1 Datakwaliteit
Datakwaliteit is de mate waarin gegevens geschikt zijn voor het beoogde doel en genereert vertrouwen in gegevens. Belangrijke datakwaliteit dimensies zijn [52](#page=52):
* **Volledigheid:** Meet de mate waarin alle verwachte records en gegevens in een dataset aanwezig zijn [52](#page=52).
* **Geldigheid:** Meet de mate waarin waarden in een gegevenselement geldig zijn [52](#page=52).
* **Nauwkeurigheid:** Meet de mate waarin gegevens correct zijn en de waarheid vertegenwoordigen [52](#page=52).
* **Uniekheid:** Meet de mate waarin records in een dataset niet gedupliceerd zijn [52](#page=52).
* **Tijdigheid:** Meet de beschikbaarheid van een dataset volgens SLA's [52](#page=52).
* **Consistentie:** Meet de mate waarin gegevens hetzelfde zijn in alle instanties [52](#page=52).
#### 8.7.4 Organisatie van dataverantwoordelijkheden
* **Data-eigenaar:** Verantwoordelijk voor classificatie, bescherming, gebruik en kwaliteit van datasets [53](#page=53).
* **Data-steward:** Vakexpert met grondige kennis van een specifieke dataset, verantwoordelijk voor het waarborgen van classificatie, bescherming, gebruik en kwaliteit conform de standaarden van de data-eigenaar [53](#page=53).
* **Data-custodian:** Verantwoordelijk voor technische dataveranderingen op basis van vereisten van de data-eigenaar [53](#page=53).
* * *
# Data visualisatie best practices en dashboards
Dit gedeelte verkent de fundamenten en evolutie van datavisualisatie, inclusief effectieve en ineffectieve methoden, en de diverse typen dashboards die in een organisatie kunnen worden ingezet.
### 7.1 Wat is datavisualisatie?
Datavisualisatie omvat het gebruik van visuele hulpmiddelen om data te representeren, waardoor complexe informatie gemakkelijker te begrijpen en te communiceren wordt. De gemeenschappelijke kenmerken zijn onder meer het inzetten van visuele hulpmiddelen, het representeren van data, het vereenvoudigen van complexe data, en het faciliteren van communicatie en begrip [54](#page=54).
### 7.2 Geschiedenis van datavisualisatie
De geschiedenis van datavisualisatie kent verschillende mijlpalen:
* **1569:** Gerardus Mercator introduceerde de mercatorprojectie, een vroege vorm van visualisatie om continenten en hun onderlinge verhoudingen te tonen [54](#page=54).
* **1644:** Florent Van Langen visualiseerde de afstand tussen verschillende steden en Rome, een eenvoudige eendimensionale visualisatie [54](#page=54).
* **1822:** William Playfair introduceerde voor het eerst tweedimensionale data-visualisaties, zoals de graanprijzen door de tijd heen, wat een verbetering was ten opzichte van de voorheen gebruikte tabellen [54](#page=54).
* **1855:** Florence Nightingale visualiseerde de doodsoorzaken tijdens oorlogen, waarbij ze aantoonde dat ziektes (visueel weergegeven in grijsblauwachtige kleuren) de meeste slachtoffers eisten, met name in de winter. Dit leidde tot verbeteringen in de hygiëne in de kampen [54](#page=54).
* **1869:** Charles Minard illustreerde de correlatie tussen temperatuur en het aantal doden tijdens de tocht van Napoleon's leger van Kiev naar Moskou [54](#page=54).
### 7.3 Soorten dashboards en kenmerken
Dashboards zijn visuele weergaven van belangrijke informatie die wordt gevolgd, geanalyseerd en gerapporteerd om de prestaties van een organisatie te beheren. Ze worden ingezet om de kwaliteit, beveiliging, beschikbaarheid en integriteit van gegevens te beheren. Er zijn verschillende soorten dashboards, elk met specifieke kenmerken en toepassingen [44](#page=44) [50](#page=50) [51](#page=51) [52](#page=52) [53](#page=53):
#### 7.3.1 Strategische dashboards
Strategische dashboards zijn gericht op de langetermijnvisie en de algemene doelstellingen van de organisatie \[48-54. Ze bieden een hoog niveau overzicht van kritieke prestatie-indicatoren (KPI's) die verband houden met strategische doelen \[48-54.
* **Kenmerken:**
* Focus op langetermijndoelen en strategie \[48-54.
* Overzicht van algemene bedrijfsprestaties \[48-54.
* Bevatten vaak financiële data, marktaandeel, klanttevredenheid op hoog niveau \[48-54.
* Vereisen minder frequente updates, bijvoorbeeld maandelijks of per kwartaal \[48-54.
* Gegevens komen uit verschillende bronnen, vaak geconsolideerd \[48-54.
#### 7.3.2 Tactische dashboards
Tactische dashboards ondersteunen besluitvorming op middellange termijn en worden gebruikt door afdelingsmanagers of teamleiders \[48-54. Ze bieden inzicht in specifieke afdelingen of projecten \[48-54.
* **Kenmerken:**
* Focus op middellangetermijnplanning en prestaties \[48-54.
* Gedetailleerder dan strategische dashboards, maar nog steeds geaggregeerd \[48-54.
* Gaan over specifieke afdelingen zoals verkoop, marketing of productie \[48-54.
* Vereisen frequentere updates, bijvoorbeeld wekelijks \[48-54.
* Data wordt vaak uit operationele systemen gehaald en geanalyseerd \[48-54.
#### 7.3.3 Operationele dashboards
Operationele dashboards bieden realtime of bijna realtime inzicht in de dagelijkse activiteiten en processen \[48-54. Ze zijn bedoeld voor operationele medewerkers en supervisors om directe beslissingen te nemen en problemen onmiddellijk aan te pakken \[48-54.
* **Kenmerken:**
* Focus op realtime operationele efficiëntie \[48-54.
* Zeer gedetailleerd en gericht op specifieke taken of processen \[48-54.
* Bevatten data zoals productievolumes, klantenservice tickets, serverprestaties \[48-54.
* Vereisen zeer frequente, indien mogelijk realtime, updates \[48-54.
* Data wordt direct uit operationele systemen getrokken \[48-54.
### 7.4 Principes voor effectieve datavisualisatie
Hoewel de specifieke documentatie de best practices van datavisualisatie niet diepgaand behandelt, impliceert de geschiedenis en het nut van visualisatie dat de volgende principes cruciaal zijn voor effectieve implementatie:
* **Kies het juiste type visualisatie:** Verschillende datatypes en relaties vereisen verschillende grafiektypen (bijvoorbeeld lijncharts voor trends, staafdiagrammen voor vergelijkingen, scatterplots voor correlaties).
* **Houd het simpel en duidelijk:** Vermijd onnodige complexiteit, 3D-effecten of overmatige versieringen die de interpretatie kunnen belemmeren [54](#page=54).
* **Focus op de boodschap:** Zorg ervoor dat de visualisatie de belangrijkste inzichten snel en effectief communiceert [54](#page=54).
* **Accurate representatie:** De visualisatie moet de data accuraat weergeven zonder te misleiden [54](#page=54).
* **Context is essentieel:** Zorg voor duidelijke titels, labels, eenheden en eventuele toelichtingen [54](#page=54).
> **Tip:** Het visualiseren van complexe data maakt deze gemakkelijker te begrijpen en te communiceren [54](#page=54).
### 7.5 Hoe data te visualiseren en hoe niet
De verstrekte tekst geeft voorbeelden van historische visualisaties, wat impliceert dat het succes van deze visualisaties lag in hun vermogen om complexe informatie toegankelijk te maken. Hoewel specifieke "niet te doen" voorbeelden niet expliciet worden genoemd, kan men hieruit afleiden dat:
* **Te veel informatie:** Het overladen van een visualisatie met te veel data kan contraproductief werken.
* **Onjuiste grafiekkeuze:** Het gebruiken van een cirkeldiagram om meer dan drie categorieën weer te geven, of een lijndiagram voor discrete, niet-tijdgebonden data, kan leiden tot misinterpretatie.
* **Misleidende schalen:** Manipuleren van de assen om bepaalde trends te overdrijven of te minimaliseren.
* **Gebrek aan context:** Visualisaties zonder duidelijke labels, titels of eenheden zijn nutteloos.
> **Voorbeeld:** Florence Nightingale's visualisatie van doodsoorzaken tijdens de Krimoorlog was effectief omdat het de relatieve impact van ziekte versus gevechtswonden duidelijk maakte, wat leidde tot concrete verbeteringen in hygiëne. Dit toont aan hoe datavisualisatie direct kan bijdragen aan verbeterde besluitvorming en resultaten [54](#page=54).
* * *
## Veelgemaakte fouten om te vermijden
* Bestudeer alle onderwerpen grondig voor examens
* Let op formules en belangrijke definities
* Oefen met de voorbeelden in elke sectie
* Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Data | Digitale informatie die wordt opgeslagen, verwerkt en gemanipuleerd door computers, zoals tekst, afbeeldingen, video's en sensormetingen. |
| Floppy Disk | Een oud opslagmedium dat populair was tussen 1970 en eind 1990, met een opslagcapaciteit variërend van kilobytes tot enkele megabytes. |
| Hard Disk Drive (HDD) | Een computeropslagapparaat dat in 1950 werd geïntroduceerd en dat evolueert in capaciteit en snelheid, variërend van gigabytes tot meerdere terabytes. |
| Solid State Drive (SSD) | Een sneller opslagapparaat dat gebruik maakt van flashgeheugen, vaak gebruikt in moderne apparaten zoals smartphones, tablets en notebooks. |
| Cloud | Een service-gebaseerd model waarbij gegevens worden opgeslagen op externe servers die toegankelijk zijn via internet, zoals Dropbox en Google Drive. |
| Data Producers | Entiteiten of systemen die data genereren, zoals technologie die wordt gebruikt binnen een proces. |
| Proces | Een reeks stappen en beslissingen die betrokken zijn bij het voltooien van werk, waarbij zowel mensen als technologie betrokken kunnen zijn. |
| Sensoren | Technologie die wordt gebruikt om fysieke omstandigheden te meten en data te genereren, zoals temperatuur-, nabijheids- en GPS-locatiesensoren. |
| Internet of Things (IoT) | Een netwerk van fysieke objecten ('dingen') die zijn voorzien van sensoren, software en andere technologieën met het doel verbinding te maken en data uit te wisselen. |
| Big Data V's | Een concept dat vijf belangrijke kenmerken van grote datasets beschrijft: Volume (omvang), Velocity (snelheid), Variety (diversiteit van structuren), Veracity (nauwkeurigheid) en Value (nuttigheid). |
| Gestructureerde data | Data die is georganiseerd in tabelstructuren met rijen en kolommen, eenvoudig te adresseren en te analyseren. |
| Semigestructureerde data | Data die enkele organisatorische kenmerken behoudt maar niet strikt in tabelstructuren is georganiseerd, zoals XML- en JSON-gegevens. |
| Ongestructureerde data | Data zonder vooraf gedefinieerde organisatie of structuur, zoals afbeeldingen, video's en audio-opnames, die lastig te analyseren is. |
| Master data | Data die de kernentiteiten van een organisatie beschrijft, zoals mensen, plaatsen en dingen, en essentieel is voor systeemintegratie. |
| Transactionele data | Data die de transacties vastlegt die plaatsvinden tijdens de bedrijfsvoering, zoals verkooporders en facturen. |
| Reference data | Data die classificatieschema's beschrijft waarnaar systemen verwijzen, zoals codelijsten en producttypen. |
| Value Stream | De reeks activiteiten die nodig zijn om een product of dienst aan een klant te leveren, inclusief trigger, stappen, lead time en waarde. |
| Data Use Case (UC) | Een specifieke situatie waarin gegevens worden gebruikt om een zakelijk doel te bereiken of een probleem op te lossen, gericht op het creëren van meetbare zakelijke waarde. |
| Business Value Pyramids | Modellen die de objectieve en subjectieve criteria van business value schetsen, onderverdeeld in B2C (klantfocus) en B2B (organisatiefocus). |
| Spreadsheets | Computerprogramma's voor het vastleggen, weergeven en manipuleren van gegevens in rijen en kolommen, zoals Microsoft Excel. |
| Dashboards | Informatiebeheertools die gegevens visualiseren in één weergave, meestal afkomstig uit een database, maar zonder data manipulatie. |
| Data Science Toolboxes | Verzamelingen van softwareprogramma's en middelen die datawetenschappers gebruiken voor programmeren, datavisualisatie en data-analyse. |
| Digitale Applicaties | Applicaties die gegevens verwerken en resultaten tonen aan de eindgebruiker, met focus op gebruiksklare datainsights. |
| AI Prompts | Tekst, vragen of coderingen die aan een AI worden gegeven om een specifiek antwoord of output te verkrijgen. |
| Data Product | Een herbruikbaar data-asset dat data bundelt met alles wat nodig is om het zelfstandig bruikbaar te maken. |
| Dataset | Een verzameling gestructureerde gegevens, die een essentieel onderdeel vormt van een data product. |
| Multi-table Dataset | Een dataset die bestaat uit meerdere tabellen die met elkaar zijn gekoppeld via primaire en vreemde sleutels. |
| Primaire sleutel | Een veld of set velden die een rij in een tabel uniek identificeert. |
| Vreemde sleutel | Een veld in een tabel dat verwijst naar de primaire sleutel in een andere tabel, om relaties tussen tabellen vast te leggen. |
| Meta data | Data over data, die helpt bij het beschrijven, vinden en beheren van andere gegevens, inclusief basisinformatie, eigenaarschap en kwaliteitsmetriek. |
| Fysiek Format | De indeling waarin data wordt aangeboden, zodat het gemakkelijk leesbaar en consumeerbaar is voor tools en mensen. |
| API (Application Programming Interface) | Een set regels en protocollen die de interactie tussen verschillende softwareapplicaties mogelijk maken. |
| Data Integratie | Het combineren van gegevens uit verschillende bronnen tot een uniforme weergave, vaak met behulp van join-operaties. |
| DIKW Framework | Een model dat de hiërarchie van data, informatie, kennis en wijsheid beschrijft, van ruwe data tot toegepaste inzichten. |
| Raw Data | Feiten in een ruwe, ongeorganiseerde vorm, het basiselement van het DIKW framework. |
| Information | Data die is georganiseerd en verwerkt om betekenis te geven, de tweede laag in het DIKW framework. |
| Knowledge | De verbinding van verschillende stukken informatie die helpt begrijpen hoe ze toe te passen om doelen te bereiken, de derde laag in het DIKW framework. |
| Wisdom | Kennis toegepast in de praktijk, de top van de DIKW piramide. |
| Data Transformaties | Processen die data omzetten van de ene vorm naar de andere, zoals conversie, aggregatie en filtering. |
| Conversie | Het proces van het omzetten van data van de ene vorm naar de andere, bijvoorbeeld van JSON naar een tabelindeling. |
| Aggregatie | Het proces van het combineren en samenvatten van gegevens van een laag detailniveau naar een hoger detailniveau. |
| Filtering | Het selecteren van specifieke gegevens op basis van vooraf bepaalde criteria, resulterend in een subset van de oorspronkelijke dataset. |
| Integratie | Het combineren van gegevens uit verschillende bronnen, vaak door het samenvoegen van tabellen op basis van sleutels. |
| Data Visualisatie | Het gebruik van visuele hulpmiddelen om complexe data weer te geven, te begrijpen en te communiceren. |
| Data Storytelling | De gestructureerde aanpak om data-inzichten te communiceren door middel van een combinatie van data, visualisatie en een verhaal. |
| Ignaz Semmelweis | Een Hongaarse arts die onderzoek deed naar kraambedsterfte en het belang van handhygiëne benadrukte, maar wiens werk aanvankelijk werd afgewezen. |
| DIKW Framework | Een hiërarchisch model dat de evolutie van data naar wijsheid beschrijft: Data, Informatie, Kennis, Wijsheid. |
| Kunstmatige Intelligentie (AI) | Een tak van informatica die zich bezighoudt met het creëren van systemen die taken kunnen uitvoeren die normaal menselijke intelligentie vereisen. |
| AI-model | Een algoritme of reeks algoritmen getraind om patronen in data te herkennen en specifieke taken uit te voeren. |
| Traditionele Programmering | Een programmeerbenadering waarbij expliciete instructies voor de computer worden geschreven. |
| AI-serving | Het proces van het implementeren en beschikbaar stellen van een getraind AI-model voor voorspellingen of beslissingen. |
| AI-training | Het proces van het trainen van een AI-model met behulp van gegevens om patronen en relaties te leren herkennen. |
| Turing-test | Een test om te bepalen of een machine intelligent gedrag vertoont dat niet te onderscheiden is van dat van een mens. |
| Belangrijkste AI-capabilities | Fundamentele functies van AI, zoals forecasting (voorspellen), classificatie, aanbeveling, clustering en generatie. |
| Lineaire Regressie | Een statistische techniek die een lineaire relatie tussen variabelen modelleert. |
| Decision Tree | Een beslissingsondersteunend model dat beslissingen en hun mogelijke gevolgen weergeeft in een boomstructuur. |
| Artificial Neural Network (ANN) | Een computermodel geïnspireerd door het menselijk brein, bestaande uit lagen van neuronen die patronen leren herkennen. |
| Deep Learning | Een subveld van machine learning dat gebruikmaakt van meerlaagse neurale netwerken voor complexe patroonherkenning. |
| Accuracy | Een maatstaf voor de prestaties van een model, gedefinieerd als het percentage correcte voorspellingen. |
| Overfitting | Wanneer een model te goed presteert op trainingsdata maar slecht op nieuwe data; kan worden overwonnen met technieken als cross-validatie. |
| Generative vs. Discriminative AI | Generative AI kan nieuwe data creëren, terwijl discriminative AI de grens tussen klassen leert om labels te voorspellen. |
| Selection Bias | Vertekening die optreedt wanneer de trainingsdataset niet representatief is voor de populatie, leidend tot misleidende voorspellingen. |
| Data Platform | Het centrale verwerkingsknooppunt voor het datalandschap van een organisatie, dat data-inname, opslag, transformatie, levering, governance en beveiliging integreert. |
| Data Engineers | Professionals die verantwoordelijk zijn voor het creëren en onderhouden van systemen voor het verzamelen, opslaan en organiseren van grote hoeveelheden data. |
| Data Pipeline | Een proces dat gegevens van een bron naar een bestemming verplaatst, inclusief zuivering, transformatie en opslag. |
| ETL (Extract, Transform, Load) | Een proces voor het verplaatsen en transformeren van gegevens uit verschillende bronnen naar een datawarehouse. |
| DAG (Directed Acyclic Graph) | Een grafiek zonder cycli die de volgorde van uitvoering van processen beheert, gebruikt in data pipelines. |
| Data Classificatie | Het organiseren van gegevens op basis van hun gevoeligheid en belang om te bepalen hoe ze moeten worden behandeld en beschermd. |
| Access Control | Het proces van het definiëren wie toegang heeft tot verschillende soorten gegevens om ongeautoriseerde toegang te voorkomen. |
| Observability | Het continu volgen van de gegevensstroom in een dataplatform om de gezondheid en prestaties van datasystemen te monitoren en problemen vroegtijdig te identificeren. |
| Data Governance | Het beleid en de processen waarmee een organisatie de kwaliteit, beveiliging, beschikbaarheid en integriteit van haar gegevens beheert. |
| Data Lifecycle Management (DLM) | Het proces van het beheren van gegevens gedurende hun hele levenscyclus: creëren, opslaan, gebruiken, delen, archiveren en vernietigen. |
| Data Management | De praktische uitvoering van de regels van datagovernance, inclusief data-architectuur, modellering, opslag, beveiliging en datakwaliteit. |
| Data Warehouse | Een data platform voor ondernemingen, gebruikt voor analyse en rapportage van voornamelijk gestructureerde en semigestructureerde gegevens uit meerdere bronnen. |
| OLTP (Online Transactional Processing) | Systemen ontworpen voor het verwerken van grote hoeveelheden transactionele gegevens, ideaal voor dagelijkse operationele taken. |
| OLAP (Online Analytical Processing) | Systemen ontworpen voor snelle verwerking en analyse van grote hoeveelheden gegevens, gebruikt voor diepgaande data-analyse. |
| Data Mart | Een gespecialiseerde weergave van data, gericht op een specifieke groep gebruikers binnen een organisatie, als subset van een datawarehouse. |
| Verticale Schaalvergroting | Het toevoegen van meer middelen aan een bestaande machine om deze krachtiger te maken. |
| Horizontale Schaalvergroting | Het toevoegen van meer machines aan een systeem om de werklast te verdelen. |
| Data Lake | Een centrale opslagplaats die grote hoeveelheden ruwe gegevens in hun oorspronkelijke formaat opslaat, zonder eerst een structuur op te leggen. |
| Data Lake House | Een architectuur die de voordelen van een traditioneel Data Warehouse en een Data Lake combineert in één geïntegreerde omgeving. |
| Data Ingestie | Het proces van het verzamelen van gegevens van verschillende bronnen en het verplaatsen naar een doellocatie voor verdere verwerking. |
| Operationeel Vlak | Het OLTP-landschap waar data bronapplicaties draaien, geoptimaliseerd voor snelle transacties. |
| Analytisch Vlak | Het gebied waar data-analyse, rapportages en complexe query's worden uitgevoerd met behulp van OLAP. |
| Data Producten (Oefening) | Voorbeelden van toepassingen van data producten, zoals voorspelling van aardbeienoogst en aandrijving van slimme thermostaten. |
| Datakwaliteit | Een maatstaf voor de geschiktheid van gegevens voor het beoogde doel, gegenereerd door vertrouwen in de data. |
| Volledigheid (Datakwaliteit) | Meet de mate waarin alle verwachte records aanwezig zijn in een dataset. |
| Geldigheid (Datakwaliteit) | Meet de mate waarin de waarden in een gegevenselement geldig zijn. |
| Nauwkeurigheid (Datakwaliteit) | Meet de mate waarin gegevens correct zijn en de waarheid vertegenwoordigen. |
| Uniekheid (Datakwaliteit) | Meet de mate waarin records in een dataset niet gedupliceerd zijn. |
| Tijdigheid (Datakwaliteit) | Meet de mate waarin een dataset beschikbaar is wanneer verwacht, afhankelijk van SLA's. |
| Consistentie (Datakwaliteit) | Meet de mate waarin gegevens hetzelfde zijn in alle instanties van die gegevens. |
| Data-eigendom | Het toewijzen van verantwoordelijkheden voor datasets aan specifieke rollen zoals data-eigenaar, data-steward en data-custodian. |
| Data Eigenaar | Verantwoordelijk voor classificatie, bescherming, gebruik en kwaliteit van datasets. |
| Data Steward | Vakexpert die de classificatie, bescherming, gebruik en kwaliteit van een specifieke dataset waarborgt conform de standaarden van de data-eigenaar. |
| Data Custodian | Verantwoordelijk voor technische dataveranderingen op basis van vereisten van de data-eigenaar. |
| Datavisualisatie Geschiedenis | Evolutie van datavisualisatie vanaf 1569 met Gerardus Mercator tot 1869 met Charles Minard, inclusief bijdragen van William Playfair en Florence Nightingale. |
| Boxplot | Een grafische weergave die helpt om de verdeling van een dataset te visualiseren, inclusief minimum, Q1, mediaan, Q3 en maximum. |
| Descriptive Analytics | Analyse die zich richt op het begrijpen wat er gebeurd is, met technieken als samenvattende statistieken en datavisualisatie. |
| Diagnostic Analytics | Analyse die zich richt op het begrijpen waarom iets gebeurd is, door het analyseren van oorzaken van trends. |
| Predictive Analytics | Analyse die zich richt op het voorspellen wat er zal gebeuren, met behulp van statistische methoden en machine learning. |
| Prescriptive Analytics | Analyse die zich richt op het bepalen hoe een gewenst resultaat mogelijk gemaakt kan worden, met technieken als optimalisatie en scenariodenken. |
| Daniel Kahneman: Thinking, Fast and Slow | Een boek dat de twee systemen van het menselijk brein beschrijft: Systeem 1 (snel, intuïtief) en Systeem 2 (traag, beredeneerd). |
| Pre-attente Kenmerken | Visuele eigenschappen die onze hersenen automatisch waarnemen zonder bewuste aandacht, zoals lengte, afstand en kleur. |
| Less is More (Datavisualisatie) | Een principe dat stelt dat het verminderen van onnodige elementen in een visualisatie de helderheid vergroot. |
| Dashboarding | Het creëren van dashboards, waarbij het publiek (strategisch, tactisch, operationeel) belangrijk is om de juiste informatie te presenteren. |
| Strategisch Dashboard | High-level management gericht dashboard, met weinig interactie, dat periodes vergelijkt. |
| Tactisch Dashboard | Dashboard voor middle management, met interactie, gericht op analyse en root cause analysis. |
| Operationeel Dashboard | Dynamisch dashboard met real-time updates, gedetailleerd transactieniveau en recente data voor directe operationele beslissingen. |
| Master Data (Oefening) | Voorbeelden van master data, zoals werknemersgegevens en productinformatie. |
| Transactionele Data (Oefening) | Voorbeelden van transactionele data, zoals patiëntbezoeken en klantoproepen. |
| Reference Data (Oefening) | Voorbeelden van referentiedata, zoals gestandaardiseerde postcodes en lijsten van eenheden. |