Cover
Mulai sekarang gratis Les_5_SPC_IKZ_25.pdf
Summary
# Statistische procescontrole en grafische weergave
Statistische procescontrole (SPC) omvat het weergeven van data op een overzichtelijke manier met behulp van verschillende soorten grafieken om inzicht te krijgen in processen [4](#page=4).
### 1.1 Basisprincipes van SPC
SPC richt zich op het gebruik van statistische methoden om de kwaliteit van een proces te bewaken en te verbeteren. Het hoofddoel is het identificeren van variabiliteit binnen een proces en het onderscheiden van willekeurige variatie (common cause variation) van systematische oorzaken (special cause variation). Door deze variatie te begrijpen, kunnen bedrijven proactief ingrijpen om fouten te voorkomen en de procesprestaties te optimaliseren [2](#page=2) [3](#page=3) [9](#page=9).
### 1.2 Grafische weergavemethoden
Een cruciaal onderdeel van SPC is het visualiseren van data om trends, patronen en afwijkingen gemakkelijk te herkennen. Verschillende soorten grafieken worden hiervoor gebruikt [4](#page=4):
#### 1.2.1 Staafdiagram (Bar Chart)
Een staafdiagram toont de frequentie of het aantal metingen voor verschillende categorieën. De lengte van elke staaf is proportioneel aan de waarde die het vertegenwoordigt. Dit type grafiek is nuttig voor het vergelijken van discrete data tussen groepen [4](#page=4) [5](#page=5).
> **Tip:** Staafdiagrammen zijn uitstekend geschikt om snel te zien welke categorie het meest voorkomt of om verschillen tussen categorieën te benadrukken [5](#page=5).
#### 1.2.2 Naalddiagram (Needle Chart / Dot Plot)
Een naalddiagram toont individuele datapunten als stippen of korte lijnen die vanuit een basislijn omhoog schieten. Dit type grafiek is effectief voor het visualiseren van de distributie van data, het identificeren van clusters en het opsporen van uitschieters, vooral bij middelgrote tot grote datasets [4](#page=4) [6](#page=6).
> **Voorbeeld:** Bij het monitoren van de diameter van geproduceerde onderdelen kan een naalddiagram snel laten zien hoe de diameters verdeeld zijn en of er exemplaren buiten de acceptabele toleranties vallen [6](#page=6).
#### 1.2.3 Lijndiagram (Line Chart)
Een lijndiagram wordt gebruikt om de verandering van een variabele over tijd te tonen. De datapunten worden met elkaar verbonden door lijnen, wat de trend en de continuïteit van de data benadrukt. Dit is een van de meest voorkomende grafieken in SPC, met name voor controlekaarten die de procesprestaties over opeenvolgende metingen volgen [4](#page=4) [7](#page=7).
> **Tip:** Lijndiagrammen zijn ideaal om te observeren of een proces stabiel blijft, verbetert of verslechtert over een bepaalde periode [7](#page=7).
#### 1.2.4 Cirkeldiagram (Pie Chart)
Een cirkeldiagram wordt gebruikt om de proportionele verdeling van verschillende categorieën binnen een geheel weer te geven. Het hele diagram vertegenwoordigt 100%, en elke 'taartpunt' toont het relatieve aandeel van een specifieke categorie [4](#page=4) [8](#page=8).
> **Voorbeeld:** Een cirkeldiagram kan gebruikt worden om de verdeling van verschillende soorten defecten in een productieproces te visualiseren [8](#page=8).
> **Let op:** Cirkeldiagrammen zijn minder geschikt voor het vergelijken van precieze waarden tussen categorieën, vooral als er veel kleine segmenten zijn. Voor vergelijkingen zijn staafdiagrammen vaak duidelijker [5](#page=5) [8](#page=8).
* * *
# De frequentietabel en bijbehorende berekeningen
Dit onderdeel behandelt de constructie en interpretatie van frequentietabellen, inclusief de bepaling van het aantal klassen, de klassebreedte, klassegrenzen en verschillende soorten frequenties [10](#page=10).
### 2.1 Constructie van een frequentietabel
Een frequentietabel is een methode om resultaten in te delen in verschillende groepen, genaamd klassen. De constructie omvat het bepalen van het aantal klassen, de klassebreedte en de klassegrenzen [10](#page=10).
#### 2.1.1 Aantal klassen
Het aantal klassen wordt vaak bepaald met een vuistregel: de vierkantswortel van het aantal waarnemingen ($n$) [11](#page=11). $$ \\text{aantal klassen} = \\sqrt{n} $$ waarbij $n$ het aantal waarnemingen is [11](#page=11).
#### 2.1.2 Klassebreedte
De klassebreedte ($b$) wordt berekend door het verschil tussen de grootste en de kleinste waarneming te delen door het aantal klassen [12](#page=12). $$ b = \\frac{m\_{max} - m\_{min}}{n} $$ waarbij $m\_{max}$ de grootste waarneming is, $m\_{min}$ de kleinste waarneming en $n$ het aantal klassen [12](#page=12).
#### 2.1.3 Klassegrenzen
Klassegrenzen worden bepaald met een nauwkeurigheid van 1 eenheid meer dan de waarneming zelf. De onderste klassegrens wordt berekend door de helft van de klassebreedte af te trekken van de kleinste waarneming. Daarna wordt de klassebreedte steeds opgeteld om de volgende grenzen te verkrijgen [13](#page=13). $$ \\text{onderste klassegrens} = m\_{min} - \\frac{b}{2} $$
> **Tip:** Bij het bepalen van de klassegrenzen is het belangrijk om consistent te zijn met de nauwkeurigheid van de data. Indien de waarnemingen bijvoorbeeld gehele getallen zijn, worden de klassegrenzen met een halve eenheid nauwkeuriger bepaald (bijvoorbeeld `.5` grenzen) [16](#page=16).
### 2.2 Soorten frequenties
Een frequentietabel kan verschillende soorten frequenties bevatten:
* **Frequentie:** Het aantal keren dat een bepaalde waarde of klasse voorkomt in de dataset [18](#page=18).
* **Cumulatieve frequentie:** Het aantal keren dat een bepaalde waarde of klasse, \_plus alle voorgaande waarden of klassen, voorkomt [18](#page=18).
* **Relatieve frequentie:** De frequentie van een waarde of klasse gedeeld door het totale aantal waarnemingen. Dit geeft het aandeel aan van die specifieke klasse [18](#page=18). $$ \\text{relatieve frequentie} = \\frac{\\text{frequentie}}{\\text{totaal aantal waarnemingen}} $$
* **Cumulatieve relatieve frequentie:** De cumulatieve frequentie gedeeld door het totale aantal waarnemingen. Dit geeft het aandeel aan van waarnemingen tot en met die specifieke klasse [18](#page=18).
### 2.3 Voorbeeld van een frequentietabel
Gegeven de volgende waarnemingen (pagina 15-22), kunnen we een frequentietabel construeren. Stel, we hebben de volgende gegevens:
* Minimum: 494 [15](#page=15).
* Maximum: 519 [15](#page=15).
* Aantal waarnemingen: 10 [15](#page=15).
We passen de eerder besproken regels toe:
* Aantal klassen ($n$): 10 waarnemingen, dus we nemen 10 klassen [15](#page=15).
* Klassebreedte ($b$): $b = \\frac{519 - 494}{10} = \\frac{25}{10} = 2.5$. Echter, het voorbeeld op pagina 15 geeft een klassebreedte van 2, mogelijk afgerond of gebaseerd op een andere vuistregel. Laten we uitgaan van een klassebreedte van 2 voor dit specifieke voorbeeld [15](#page=15).
* Onderste klassegrens: $494 - \\frac{2}{2} = 493$ [15](#page=15).
De klassen zouden dan zijn: \[493-495), \[495-497), ..., \[511-513). De exacte grenzen en berekeningen zijn gedetailleerd weergegeven in de documentatie, inclusief hoe de frequenties, cumulatieve frequenties en relatieve frequenties worden berekend en ingevuld in de tabel [14-22](#page=14-22).
### 2.4 Polygoondiagram
Een polygoondiagram is een grafische weergave van de frequentieverdeling, waarbij de toppen van de staven van een histogram met elkaar worden verbonden door een gebroken lijn. Theoretisch kan, bij een oneindig aantal klassen en een klassebreedte die naar nul nadert, de polygoon een vloeiende lijn worden. In dit theoretische geval kan de kans berekend worden door middel van integreren, waarbij de oppervlakte onder de curve een maat is voor de kansdichtheid [23](#page=23).
* * *
# Kengetallen van de normale verdeling
Dit onderwerp behandelt de centrale tendens en spreiding van data binnen een normale verdeling door middel van specifieke kengetallen [30](#page=30).
### 3.1 Centrale tendens
Kengetallen voor centrale tendens geven een idee van de doorsneewaarde van de resultaten [30](#page=30).
#### 3.1.1 Rekenkundig gemiddelde
Het rekenkundig gemiddelde ($\\overline{X}$) is het belangrijkste en meest gebruikte kengetal voor de ligging van meetresultaten. Het wordt berekend met de formule [31](#page=31): $$ \\overline{X} = \\frac{1}{n} \\sum\_{i=1}^{n} X\_i $$
> **Voorbeeld:** Gegeven de getallen 6, 8, 7, 8, 7, 6, 7, 7, 6 [31](#page=31). Het rekenkundig gemiddelde is: $$ \\overline{X} = \\frac{6+8+7+8+7+6+7+7+6}{9} = \\frac{66}{9} \\approx 6,89 $$[31](#page=31).
#### 3.1.2 Mediaan
De mediaan (Me) is de middelste waarneming van een groep op volgorde gerangschikte waarnemingsresultaten. In tegenstelling tot het gemiddelde wordt de mediaan niet beïnvloed door uitschieters [32](#page=32).
> **Voorbeeld:** Gegeven de getallen 6, 8, 7, 8, 7, 6, 7, 7, 6 [32](#page=32). Na sortering: 6, 6, 6, 7, 7, 7, 7, 8, 8 [32](#page=32). De mediaan is het middelste getal: 7 [32](#page=32).
Bij een even aantal getallen wordt het gemiddelde van de middelste twee getallen als mediaan genomen [33](#page=33).
> **Voorbeeld:** Gegeven de getallen 6, 8, 7, 8, 7, 6, 7, 7 [33](#page=33). Na sortering: 6, 6, 7, 7, 7, 7, 8, 8 [33](#page=33). De middelste twee getallen zijn 7 en 7. $$ Me = \\frac{7 + 7}{2} = 7 $$[33](#page=33).
#### 3.1.3 Modus
De modus (Mo) is het waarnemingsresultaat dat het meest voorkomt, oftewel dat de hoogste frequentie heeft [34](#page=34).
> **Voorbeeld:** Gegeven de getallen 6, 8, 7, 8, 7, 6, 7, 7, 6 [34](#page=34). Het getal 7 komt het meest voor (4 keer), dus de modus is 7 [34](#page=34).
Bij gelijke maxima spreekt men van een bimodale (bij 2 maxima) of multimodale verdelingen [35](#page=35).
### 3.2 Spreiding
Kengetallen kunnen ook de spreiding van data aanduiden. Ze geven aan hoever de gegevens uit elkaar liggen [36](#page=36).
#### 3.2.1 Range of variatiebreedte
De range (R), ook wel variatiebreedte genoemd, wordt gegeven door het grootste en het kleinste waarnemingsresultaat. Het duidt de grenzen aan waartussen de waarnemingsresultaten voorkomen [37](#page=37).
> **Voorbeeld:** Gegeven de getallen 6, 8, 7, 8, 7, 6, 7, 7, 6 [37](#page=37). Het grootste resultaat is 8 en het kleinste is 6. De range is dus 8 - 6 = 2 [37](#page=37).
#### 3.2.2 Standaarddeviatie
De standaarddeviatie (s) is de belangrijkste en meest gebruikte spreidingsmaatstaf voor waarnemingsresultaten. De formule voor de variantie ($s^2$) is [38](#page=38) [39](#page=39): $$ s^2 = \\frac{1}{n-1} \\sum\_{i=1}^{n} (X\_i - \\overline{X})^2 $$
> **Tip:** De standaarddeviatie kan handmatig berekend worden, maar is ook eenvoudig te bepalen met statistische software of functies zoals `=STDEV.S(...)` in Excel [39](#page=39).
### 3.3 Oefenvoorbeeld
Bepaal voor het volgende voorbeeld (manueel) het gemiddelde, de mediaan, de modus, de range en de standaarddeviatie [40](#page=40): 25, 23, 21, 22, 24 22, 23, 24, 22, 24 23, 22, 24, 22, 21 24, 22, 22, 25, 21
De oplossing hiervan wordt gegeven op het bord [41](#page=41).
* * *
# Theoretische benadering van de Gaussverdeling en uitschieters
Dit gedeelte behandelt de theoretische eigenschappen van de normale (Gauss)verdeling en methoden voor het identificeren en behandelen van uitschieters in data.
### 4.1 De gaussverdeling
De normale verdeling, ook wel de gaussverdeling genoemd, is een continue kansverdeling die gekenmerkt wordt door twee parameters: de verwachtingswaarde ($\\mu$) en de standaardafwijking ($\\sigma$). De kansdichtheid van deze verdeling wordt weergegeven door een symmetrische curve die het hoogst is rond het gemiddelde ($\\mu$) en afneemt naarmate de afstand tot het gemiddelde groter wordt, zonder ooit exact nul te worden. Deze curve wordt ook wel de gausscurve genoemd. De normale verdeling loopt theoretisch van min oneindig ($-\\infty$) tot plus oneindig ($+\\infty$) en wordt volledig bepaald door het gemiddelde ($\\mu$) en de spreiding ($\\sigma$) [42](#page=42) [43](#page=43).
#### 4.1.1 Kenmerken van de gaussverdeling
* **Symmetrie**: De kansdichtheid is perfect symmetrisch rond de verwachtingswaarde ($\\mu$) [43](#page=43).
* **Top**: De curve is het hoogst bij het gemiddelde ($\\mu$) [43](#page=43).
* **Spreiding**: De kansdichtheid neemt af naarmate de afstand tot het gemiddelde toeneemt, zonder ooit nul te worden [43](#page=43).
* **Parameters**: De verdeling wordt volledig bepaald door $\\mu$ (locatie) en $\\sigma$ (schaal/spreiding) [43](#page=43).
#### 4.1.2 Interpretatie van standaardafwijking grenzen
De standaardafwijking ($\\sigma$) is cruciaal voor het begrijpen van de spreiding van data binnen een normale verdeling. Specifieke grenzen rond het gemiddelde ($\\mu$) geven een indicatie van het percentage waarnemingen dat binnen die grenzen valt:
* **1 $\\sigma$ grens**: Ongeveer 68,8% van de data ligt binnen de grenzen $\\mu - \\sigma$ en $\\mu + \\sigma$ [45](#page=45).
* **2 $\\sigma$ grens**: Ongeveer 95,4% van de data ligt binnen de grenzen $\\mu - 2\\sigma$ en $\\mu + 2\\sigma$ [45](#page=45).
* **3 $\\sigma$ grens**: Ongeveer 99,73% van de data ligt binnen de grenzen $\\mu - 3\\sigma$ en $\\mu + 3\\sigma$ [45](#page=45).
> **Tip**: Deze grenzen bieden een snelle manier om te beoordelen of een datapunten binnen de verwachte spreiding valt. Waarnemingen buiten de $3\\sigma$ grens kunnen potentieel als uitschieters worden beschouwd.
### 4.2 Uitschieters (outliers)
Uitschieters, ook wel uitbijters genoemd, zijn extreme waarden in een dataset die significant afwijken van de rest van de data. Ze kunnen een grote invloed hebben op het gemiddelde, maar hebben doorgaans weinig tot geen invloed op de mediaan. Het identificeren en omgaan met uitschieters is niet altijd eenvoudig en er is vaak discussie over de vraag of en hoe deze verwijderd moeten worden [47](#page=47).
#### 4.2.1 Methodes voor het identificeren van uitschieters
Er zijn diverse methoden om uitschieters te detecteren:
* **Vuistregels**: Zoals het criterium van meer dan 3 standaardafwijkingen ($\\sigma$) van het gemiddelde [48](#page=48).
* **Statistische tests**:
* Criterium van Chauvenet [48](#page=48).
* Grubbs’ test voor uitbijters [48](#page=48).
* Peirces criterium [48](#page=48).
* **Standaardmethoden**: ASTM E178 standaardmethode [48](#page=48).
* **Criteria gebaseerd op kwartielafstand**: Zoals Tukey’s fences [48](#page=48).
#### 4.2.2 Tukey’s fences
Tukey’s fences is een methode om uitschieters te identificeren op basis van de interkwartielafstand (IQR). Deze methode maakt gebruik van de mediaan (Q2), het eerste kwartiel (Q1 - de waarde op het 25e percentiel) en het derde kwartiel (Q3 - de waarde op het 75e percentiel). De grenzen worden bepaald met behulp van een constante factor ($k$) [49](#page=49):
De formule voor de grenzen is: $$Q1 - k(Q3 - Q1) \\quad \\text{en} \\quad Q3 + k(Q3 - Q1)$$
* Voor "outliers" wordt doorgaans een $k$ van 1,5 gebruikt [49](#page=49).
* Voor "far outs" (meer extreme uitschieters) wordt een $k$ van 3 gebruikt [49](#page=49).
##### 4.2.2.1 Voorbeeld van Tukey’s fences
Stel we hebben de volgende datareeks: 22, 24, 23, 23, 23, 21, 18, 23, 24, 23, 39, 22 [50](#page=50).
Om de Tukey’s fences te bepalen, moeten eerst Q1, Q3 en de mediaan (Q2) berekend worden (dit is uitgewerkt op het bord ) [50](#page=50).
> **Example**: Als na berekening de datareeks gesorteerd zou zijn en Q1 = 22.5, Q3 = 23.5, dan is de IQR = 23.5 - 22.5 = 1.
>
> * Voor "outliers" ($k=1.5$):
>
> * Ondergrens: $22.5 - 1.5 \\times 1 = 21$
>
> * Bovengrens: $23.5 + 1.5 \\times 1 = 25$ Waarden kleiner dan 21 of groter dan 25 worden beschouwd als "outliers".
>
> * Voor "far outs" ($k=3$):
>
> * Ondergrens: $22.5 - 3 \\times 1 = 19.5$
>
> * Bovengrens: $23.5 + 3 \\times 1 = 26.5$ Waarden kleiner dan 19.5 of groter dan 26.5 worden beschouwd als "far outs". In dit voorbeeld zou de waarde 39 een "far out" zijn.
>
* * *
## Veelgemaakte fouten om te vermijden
* Bestudeer alle onderwerpen grondig voor examens
* Let op formules en belangrijke definities
* Oefen met de voorbeelden in elke sectie
* Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Statistische Procescontrole (SPC) | Een methode die statistische technieken gebruikt om de kwaliteit van een proces te monitoren en te controleren, met als doel afwijkingen te identificeren en te minimaliseren. |
| Staafdiagram | Een grafische weergave van data waarbij rechthoekige staven worden gebruikt om discrete categorieën te representeren; de lengte van elke staaf is proportioneel aan de waarde die het weergeeft. |
| Naalddiagram | Een type grafiek dat lijnen gebruikt die van een basislijn naar een datapunkt lopen, vaak gebruikt om trends of patronen weer te geven; lijkt op een lijndiagram maar de punten zijn vaak gemarkeerd met symbolen. |
| Lijndiagram | Een grafische weergave die punten verbindt met lijnsegmenten om de trend van gegevenspunten over een interval of tijd te tonen. |
| Pie-chart (Cirkeldiagram) | Een ronde grafiek die is verdeeld in sectoren om de proportionele frequentie van categorieën in een dataset weer te geven; de grootte van elke sector is proportioneel aan de hoeveelheid die het vertegenwoordigt. |
| Frequentietabel | Een tabel die de frequentie van elk voorkomend datapunt of elke categorie in een dataset weergeeft, vaak ingedeeld in klassen of intervallen. |
| Aantal klassen | Het aantal intervallen of groepen waarin een dataset wordt verdeeld voor de constructie van een frequentietabel of histogram. |
| Klassebreedte | Het verschil tussen de bovengrens en de ondergrens van een klasse in een frequentietabel; de breedte van elk interval. |
| Klassegrenzen | De waarden die het begin en einde van elke klasse in een frequentietabel definiëren; deze grenzen helpen bij het indelen van gegevenspunten in specifieke intervallen. |
| Vuistregel | Een algemene richtlijn of methode die wordt gebruikt om een schatting te maken of een beslissing te nemen, vaak gebaseerd op ervaring in plaats van strikte berekeningen. |
| Vierkantswortel | Het getal dat, wanneer vermenigvuldigd met zichzelf, een gegeven getal oplevert; genoteerd als $\sqrt{n}$. |
| Waarneming | Een individueel gemeten of geregistreerd datapunt in een dataset. |
| Frequentie | Het aantal keren dat een specifiek datapunt of een waarde binnen een klasse voorkomt in een dataset. |
| Cumulatieve frequentie | Het totaal aantal waarnemingen in een klasse en alle voorgaande klassen in een frequentietabel. |
| Relatieve frequentie | De verhouding van de frequentie van een klasse tot het totale aantal waarnemingen in de dataset; berekend als frequentie / totaal aantal waarnemingen. |
| Cumulatieve relatieve frequentie | De som van de relatieve frequenties van een klasse en alle voorgaande klassen in een frequentietabel. |
| Polygoondiagram | Een lijngrafiek die de frequentiepunten van opeenvolgende klassen van een histogram verbindt om de algemene vorm van de verdeling te tonen. |
| Kans | De waarschijnlijkheid dat een bepaalde gebeurtenis zal plaatsvinden, uitgedrukt als een getal tussen 0 en 1. |
| Integraalrekening | Een tak van de wiskunde die zich bezighoudt met het bepalen van integralen, wat gebruikt kan worden om oppervlaktes onder curves te berekenen, gerelateerd aan kansdichtheid. |
| Kansdichtheid | Een functie die de relatieve waarschijnlijkheid van het voorkomen van een continue willekeurige variabele op een bepaald punt aangeeft; de integraal van de kansdichtheidsfunctie over een interval geeft de kans op die gebeurtenis aan. |
| Normale verdeling (Gaussverdeling) | Een continue kansverdeling die de vorm heeft van een symmetrische klokcurve, gekarakteriseerd door zijn gemiddelde en standaarddeviatie. |
| Verwachtingswaarde (µ) | Het gemiddelde van een kansverdeling; de langetermijn gemiddelde waarde van een willekeurige variabele. |
| Standaardafwijking (σ) | Een maat voor de spreiding van een dataset rond het gemiddelde; geeft aan hoe ver de gegevenspunten gemiddeld van het gemiddelde liggen. |
| Rekenkundig gemiddelde ($\bar{X}$) | De som van alle waarden in een dataset gedeeld door het aantal waarden; een maat voor centrale tendens. |
| Mediaan (Me) | De middelste waarde in een geordende dataset; de waarde die de dataset in twee gelijke helften verdeelt. |
| Modus (Mo) | De waarde die het vaakst voorkomt in een dataset. |
| Bi-modale verdeling | Een kansverdeling met twee moda, of twee pieken. |
| Multimodale verdeling | Een kansverdeling met meer dan twee moda, of meer dan twee pieken. |
| Spreiding | De mate waarin data in een dataset verspreid zijn rond het gemiddelde. |
| Range (Variatiebreedte) (R) | Het verschil tussen de hoogste en laagste waarde in een dataset. |
| Standaarddeviatie (s) | Een statistische maat die de spreiding van een dataset aangeeft ten opzichte van het gemiddelde; de vierkantswortel van de variantie. |
| Kwartielafstand (Interkwartielafstand) | Het verschil tussen het derde kwartiel (Q3) en het eerste kwartiel (Q1) van een dataset; een maat voor de spreiding van de middelste 50% van de data. |
| Q1 (Eerste kwartiel) | De waarde waaronder 25% van de data in een geordende dataset valt. |
| Q3 (Derde kwartiel) | De waarde waaronder 75% van de data in een geordende dataset valt. |
| Tukey's fences | Een methode die gebruikmaakt van kwartielen en een constante factor (k) om grenzen te definiëren waarbuiten datapunten als uitschieters worden beschouwd. |
| Outlier | Een datapunt dat significant afwijkt van andere waarden in een dataset. |
| Far out | Een datapunt dat nog verder van de rest van de dataset af ligt dan een "outlier", zoals gedefinieerd door Tukey's fences. |