Cover
ابدأ الآن مجانًا 2__Lecture_RAID-LVM-iSCSI.pdf
Summary
# Inleiding tot opslagtechnologieën
Dit gedeelte introduceert de drie primaire opslagtechnologieën: RAID, LVM en iSCSI, die een cruciale rol spelen in datacenteromgevingen door het beheer en de toegankelijkheid van opslag te verbeteren [1](#page=1) [2](#page=2).
### 1.1 Overzicht van de belangrijkste opslagtechnologieën
In dit document worden drie verschillende lagen van opslagtechnologieën besproken: RAID, LVM en iSCSI. Deze technologieën worden in het lab opgezet en bieden oplossingen voor het efficiënt en flexibel gebruiken van opslagapparaten binnen een datacenter [2](#page=2).
#### 1.1.1 RAID
RAID (Redundant Array of Independent Disks) is een oplossing die het mogelijk maakt om meerdere harde schijven gelijktijdig te gebruiken. Het voornaamste doel van RAID is het bieden van redundantie, wat betekent dat gegevens veilig worden opgeslagen in geval van een schijfstoring [2](#page=2).
#### 1.1.2 LVM
LVM (Logical Volume Management) is een technologie die opslagapparaten of opslagarrays groepeert. LVM biedt aanzienlijke flexibiliteit in het beheer van opslagruimte, waardoor het makkelijker wordt om opslag dynamisch aan te passen en te beheren [2](#page=2).
#### 1.1.3 iSCSI
iSCSI (Internet Small Computer System Interface) is een protocol dat blokapparaten toegankelijk maakt over een netwerk. Het primaire doel van iSCSI is het creëren van een SAN (Storage Area Network), wat leidt tot de mogelijkheid om centraal beheerde opslagruimte aan te bieden aan servers [2](#page=2).
> **Tip:** Hoewel "SAN" staat voor "Storage Area Network", verwijzen datacenterbeheerders vaak specifiek naar "De SAN" als de SAN Storage Server zelf [2](#page=2).
---
# RAID (Redundant Array of Independent Disks)
RAID-technologie stelt opslagapparaten in staat om data te distribueren en/of te dupliceren over meerdere schijven voor verbeterde prestaties, redundantie of beide [4](#page=4).
### 2.1 Wat is RAID?
RAID staat voor "Redundant Array of Independent (or Inexpensive) Disks". Het is een methode om data op te slaan op een set van meerdere harde schijven. Naast de verschillende RAID-niveaus, bestaat ook de optie Just a Bunch Of Disks (JBOD), waarbij schijven één voor één worden gevuld en dit wordt niet als ware RAID beschouwd [4](#page=4).
### 2.2 RAID-niveaus
Er zijn verschillende RAID-niveaus, elk met specifieke kenmerken qua capaciteit, redundantie en snelheid.
#### 2.2.1 RAID 0: Striping
* **Werking:** RAID 0, ook wel "striping" genoemd, verdeelt data over twee of meer schijven [5](#page=5).
* **Capaciteit:** De totale capaciteit is de som van de capaciteiten van alle schijven. Bijvoorbeeld, twee schijven van 1 TB in RAID 0 bieden 2 TB aan opslagruimte [5](#page=5).
* **Redundantie:** RAID 0 biedt **geen** redundantie. Het falen van één schijf leidt tot het verlies van alle data [5](#page=5).
* **Snelheid:** Het belangrijkste voordeel van RAID 0 is de snelheid. Zowel lees- als schrijfsnelheden kunnen potentieel verdubbelen, en elke extra schijf kan de snelheid verder verhogen, mits de RAID-controller dit kan ondersteunen [5](#page=5).
> **Tip:** RAID 0 is nuttig wanneer snelheid cruciaal is en databeveiliging minder belangrijk is, of wanneer data elders geback-upt wordt.
#### 2.2.2 RAID 1: Mirroring
* **Werking:** RAID 1, bekend als "mirroring", dupliceert data over twee of meer schijven. Elke schijf bevat een exacte kopie van de data [7](#page=7).
* **Capaciteit:** De totale bruikbare capaciteit is gelijk aan die van de kleinste schijf in de array. Twee schijven van 1 TB in RAID 1 bieden dus 1 TB opslag [7](#page=7).
* **Redundantie:** RAID 1 biedt **volledige** redundantie. Eén schijf mag uitvallen zonder dataverlies. Meerdere schijven verhogen de redundantie, maar niet de capaciteit [7](#page=7).
* **Snelheid:** De leessnelheid kan verdubbelen, mits de RAID-controller dit ondersteunt. Schrijfsnelheden worden meestal niet significant verbeterd, omdat data naar meerdere schijven geschreven moet worden [7](#page=7).
> **Tip:** RAID 1 is een goede keuze voor kritieke data waar beschikbaarheid essentieel is en de capaciteitsbeperking acceptabel is.
#### 2.2.3 RAID 5: Parity
* **Werking:** RAID 5 ("parity") verdeelt data en pariteitsinformatie over drie of meer schijven. Pariteitsinformatie wordt gebruikt om data te reconstrueren in geval van een schijfstoring. De pariteitsberekening maakt gebruik van de XOR-operator [10](#page=10) [9](#page=9).
* **Capaciteit:** De totale capaciteit is de som van de capaciteiten van alle schijven minus de capaciteit van één schijf (voor pariteitsinfo). Bijvoorbeeld, drie schijven van 1 TB in RAID 5 bieden 2 TB aan opslag. Vier schijven van 1 TB bieden 3 TB [9](#page=9).
* **Redundantie:** RAID 5 biedt redundantie voor **één enkele schijfstoring**. Als twee schijven uitvallen, gaat alle data verloren. Het concept van een "hot spare" schijf kan een extra schijf bevatten die automatisch wordt geactiveerd om het reconstructieproces te starten bij een schijfstoring [9](#page=9).
* **Snelheid:** Leessnelheden zijn over het algemeen goed, vergelijkbaar met striping, omdat data van meerdere schijven gelezen kan worden. Schrijfsnelheden kunnen echter trager zijn dan bij RAID 0 of RAID 1 vanwege de overhead van het berekenen en schrijven van pariteitsinformatie [9](#page=9).
> **Tip:** RAID 5 biedt een goede balans tussen opslagcapaciteit, redundantie en prestaties voor veel toepassingen, vooral met drie of meer schijven.
#### 2.2.4 RAID 10: Mirror plus Striping
* **Werking:** RAID 10 (ook wel RAID 1+0 genoemd) combineert de voordelen van RAID 1 (mirroring) en RAID 0 (striping). Eerst worden RAID 1-arrays (spiegels) gecreëerd, en deze worden vervolgens samengevoegd via striping [12](#page=12).
* **Capaciteit:** De totale capaciteit is de helft van de som van de capaciteiten van alle schijven. Bijvoorbeeld, vier schijven van 1 TB in RAID 10 bieden 2 TB aan opslag [12](#page=12).
* **Redundantie:** RAID 10 biedt een hoge mate van redundantie. Een enkele schijf kan uitvallen, en in sommige gevallen zelfs een tweede schijf, mits deze zich in een andere gespiegelde set bevindt [12](#page=12).
* **Snelheid:** Het biedt uitstekende lees- en schrijfsnelheden dankzij de striping, gecombineerd met de redundantie van mirroring [12](#page=12).
> **Tip:** RAID 10 is een populaire keuze voor enterprise-omgevingen die zowel hoge prestaties als goede redundantie vereisen.
#### 2.2.5 RAID 01: Stripe plus Mirroring
* **Werking:** RAID 01 (ook wel RAID 0+1 genoemd) is de omgekeerde combinatie van RAID 10. Eerst worden RAID 0-arrays (stripes) gemaakt, en deze worden vervolgens gespiegeld (RAID 1) [13](#page=13).
* **Capaciteit:** De totale capaciteit is ook hier de helft van de som van de capaciteiten van alle schijven. Bij vier schijven van 1 TB in RAID 01 is dit 2 TB [13](#page=13).
* **Redundantie:** Net als RAID 10 biedt RAID 01 redundantie, waarbij een of twee schijven mogen uitvallen afhankelijk van de specifieke schijf [13](#page=13).
* **Nadeel:** Ondanks de gelijkenissen in capaciteit en redundantie, wordt RAID 01 niet gebruikt door bedrijven. De reden is dat wanneer een schijf uitvalt in een RAID 0-array, de gehele "last" op de andere RAID 0-array komt te liggen, wat het risico op een nieuwe storing vergroot [13](#page=13).
### 2.3 Software RAID versus Hardware RAID
Het belangrijkste verschil tussen software- en hardware-RAID ligt in waar de berekeningen voor de RAID-functionaliteit plaatsvinden [14](#page=14).
* **Hardware RAID:** Gebruikt een speciale RAID-chip, die geïntegreerd kan zijn op het moederbord of als een aparte insteekkaart. Dit ontlast de hoofdprocessor (CPU) van de server [14](#page=14).
* **Software RAID:** Maakt gebruik van de gedeelde processor, meestal de CPU, van het systeem voor de RAID-berekeningen. Bij Direct-Attached Storage (DAS) systemen is hardware RAID minder zinvol, omdat de hoofd-CPU meestal krachtig genoeg is. Software RAID kan over het algemeen eenvoudiger te herstellen zijn [14](#page=14).
* **Intel Rapid Storage Technology (RST):** Dit is een voorbeeld van software-RAID dat geïntegreerd is in veel Intel-chipsets. Het vereist drivers in het besturingssysteem om RAID-arrays te creëren en te gebruiken, en de berekeningen worden door de CPU uitgevoerd [15](#page=15).
> **Tip:** Bij netwerkopslagapparaten zoals NAS-apparaten is er vaak geen keuze; deze beschikken doorgaans over een dedicated hardware RAID-controller met eigen algoritmes [14](#page=14).
### 2.4 RAID is geen Backup!
Het is cruciaal om te onthouden dat RAID geen vervanging is voor een back-upsysteem [16](#page=16).
* **RAID:** Beschermt tegen schijf- of hardwarefouten en zorgt voor data-beschikbaarheid en systeem-uptime [16](#page=16).
* **Backup:** Beschermt tegen dataverlies door accidentele verwijdering, corruptie, rampen of malware. Een back-up maakt het mogelijk om terug te keren naar een eerdere staat van de data, iets wat RAID niet kan [16](#page=16).
---
# LVM (Logical Volume Manager)
Logical Volume Manager (LVM) is een technologie die het mogelijk maakt om fysieke opslag, zoals schijven, RAID-sets en volumes, op te delen in flexibele "apparaten" [19](#page=19).
### 3.1 Opbouw van LVM
LVM werkt met drie hiërarchische lagen om deze flexibiliteit te realiseren [19](#page=19):
* **Physical Volumes (PV)**: Dit zijn de onderliggende fysieke opslagcomponenten. Dit kunnen complete schijven, RAID-sets, of partities zijn die geconfigureerd zijn als een PV [19](#page=19).
* **Volume Groups (VG)**: Meerdere PV's kunnen worden gecombineerd tot één of meerdere Volume Groups. Een VG vormt een pool van opslagruimte [19](#page=19).
* **Logical Volumes (LV)**: Vanuit een VG kunnen vervolgens één of meerdere Logical Volumes worden aangemaakt. Deze LV's gedragen zich als normale partities of apparaten en kunnen worden geformatteerd om data op te slaan [19](#page=19).
### 3.2 Voordelen van LVM
Het belangrijkste voordeel van LVM ten opzichte van traditionele RAID-configuraties is de flexibiliteit bij het beheren van opslagvolumes [20](#page=20).
* **Groei- en krimpbaarheid zonder dataverlies**: In tegenstelling tot RAID, waarbij het vergroten van een array vaak dataverlies impliceert, staat LVM toe om de grootte van logische volumes aan te passen zonder gegevens te verliezen. Dit geldt zowel voor het vergroten als het verkleinen van volumes [20](#page=20).
* **Dynamisch beheer**: Veel LVM-bewerkingen, zoals het vergroten of verplaatsen van volumes, kunnen worden uitgevoerd terwijl de data op de volumes actief wordt benaderd [20](#page=20).
* **Integratie met RAID**: LVM kan een RAID-array transformeren tot een Physical Volume. Dit PV kan vervolgens worden toegevoegd aan een bestaande Volume Group om de bijbehorende Logical Volumes te vergroten, wat de flexibiliteit van LVM combineert met de redundantie van RAID [20](#page=20).
> **Tip:** Stel je voor dat een LV die traag presteert zich op een trage schijf bevindt. Met LVM kun je een snellere SSD toevoegen, een nieuwe VG creëren, en de trage LV naar deze nieuwe VG verplaatsen zonder dat er downtime is. Op dezelfde manier kan een gehele VG naar een nieuwe PV worden verplaatst. Dit geeft een aanzienlijke flexibiliteit zonder de redundantie van RAID te verliezen [20](#page=20).
---
# iSCSI (Internet Small Computer System Interface)
iSCSI is een technologie die wordt gebruikt om een Storage Area Network (SAN) te creëren, waarbij blokgebaseerde opslag over een netwerk wordt geleverd [23](#page=23) [24](#page=24).
### 4.1 De rol van iSCSI in Storage Area Networks (SANs)
Er bestaan twee belangrijke technologieën voor het opzetten van een SAN: Fibre Channel en iSCSI [24](#page=24).
* **Fibre Channel:** Bestaat sinds 1994 en was lange tijd de voorkeursoplossing voor SANs. Vereist echter specifieke hardware en software [24](#page=24) [25](#page=25).
* **iSCSI (internet Small Computer System Interface):** Werd populair rond 2006. Vereist aangepaste software, maar standaard Ethernet-hardware is voldoende [24](#page=24).
iSCSI wordt beschouwd als de meer toegankelijke keuze, met name voor het midden- en kleinbedrijf (MKB), waarbij veel SAN-opstellingen gebruik maken van iSCSI. Het levert blokgebaseerde I/O, vergelijkbaar met traditionele opslagsystemen, maar dan over een netwerk [23](#page=23) [26](#page=26).
### 4.2 Kernterminologie van iSCSI
Om iSCSI te begrijpen, is het belangrijk om de volgende terminologie te kennen [26](#page=26):
* **iSCSI Target:** Dit is de "server" in een iSCSI-configuratie. Het biedt opslag eenheden, bekend als LUNs (Logical Unit Numbers), aan initiators [26](#page=26).
* **iSCSI Initiator:** Dit is de "client" die verbinding maakt met een iSCSI Target. De Initiator krijgt toegang tot de LUNs die door het Target worden aangeboden. iSCSI Initiator-software is vaak ingebouwd in besturingssystemen zoals Windows [26](#page=26).
* **LUN (Logical Unit Number):** Een logische opslageenheid die door een iSCSI Target wordt aangeboden aan Initiators.
### 4.3 iSCSI adressering en identificatie
iSCSI gebruikt IQNs (iSCSI Qualified Names) als een vorm van WWN (World Wide Name) om iSCSI Targets en Initiators uniek te identificeren [27](#page=27).
* Zowel het Target als de Initiator hebben een IQN nodig voor identificatie [27](#page=27).
* Het is mogelijk om meerdere IQNs te configureren op één enkel IP-adres [27](#page=27).
* iSCSI ondersteunt een *n-tot-n* relatie, wat betekent dat meerdere Initiators verbinding kunnen maken met één of meerdere Targets, en toegang kunnen krijgen tot één of meerdere LUNs [27](#page=27).
**Voorbeeld van iSCSI-adressering:**
* **iSCSI target name:** `iqn.1992-08.com.microsoft:stor1-47cf3c25`
* **iSCSI alias:** `stor1`
* **IP address:** `192.168.36.101`
* **iSCSI initiator name:** `iqn.1998-01.com.vmware:train1-64ad4c29`
* **iSCSI alias:** `train1`
* **IP address:** `192.168.36.88`
### 4.4 Uitdagingen met bestandssystemen en gelijktijdige toegang
Een significant probleem met iSCSI (en SANs in het algemeen) is de gelijktijdige toegang van meerdere clients tot dezelfde LUN. Hoewel technisch mogelijk, ligt de uitdaging primair bij de bestandssystemen [28](#page=28).
* **Bestandssystemen zoals NTFS, EXT4, en ZFS zijn niet ontworpen voor gelijktijdig gebruik door meerdere block-level systemen** [28](#page=28).
* Een van de problemen is gerelateerd aan het **cache-mechanisme** van deze bestandssystemen. Schrijfacties naar de schijf worden niet altijd direct verwerkt, maar eerst gecached in het geheugen voordat ze naar de schijf worden geschreven. Dit kan leiden tot inconsistenties wanneer meerdere clients tegelijkertijd proberen te schrijven [28](#page=28).
* Het uitschakelen van de schrijfcache kan weliswaar geconfigureerd worden, maar lost het fundamentele probleem van gelijktijdige SAN-toegang niet op [28](#page=28).
* Virtualisatieoplossingen hebben dit probleem van gelijktijdige LUN-toegang opgelost middels specifieke methoden, zoals later zal worden besproken [28](#page=28).
> **Tip:** Het gedrag van bestandssysteemcaches benadrukt waarom het belangrijk is om opslagapparaten (zoals USB-sticks) altijd veilig te verwijderen, om dataverlies of corruptie te voorkomen [28](#page=28).
---
# Praktische oefening: RAID, LVM en iSCSI
Dit gedeelte beschrijft de praktische oefeningen die studenten zullen uitvoeren om de behandelde opslagtechnologieën te implementeren, inclusief richtlijnen voor het uitvoeren van de labs en het inleveren van het werk [29](#page=29).
### 5.1 Doelstellingen van de oefeningen
De praktische oefeningen hebben als doel om studenten hands-on ervaring te laten opdoen met de implementatie van RAID, LVM en iSCSI. Er wordt gestreefd naar een balans tussen het eenvoudig volgen van instructies en het begrijpen van de uitgevoerde acties [29](#page=29) [30](#page=30).
### 5.2 Uitvoering van de labs
Er worden twee scenario's voorgesteld voor de praktische oefeningen:
* **Scenario 1: Gebruik van een voorgeconfigureerde VM**
* Gebruik een vooraf geconfigureerde virtuele machine (VM) die een Synology NAS emuleert om een RAID-array en iSCSI in te stellen [30](#page=30).
* **Scenario 2: Handmatige configuratie in een eigen VM**
* Creëer een eigen VM.
* Configureer handmatig alle drie de componenten: RAID (tijdens de installatie), LVM en iSCSI [30](#page=30).
> **Tip:** Het is cruciaal om te begrijpen wat elke gebruikte opdracht doet tijdens de labs [30](#page=30).
### 5.3 Documentatie en inlevering
* **Probleemoplossing:** Maak elk lab eigen door eventuele problemen die je tegenkomt zelf op te lossen [30](#page=30).
* **Vragen beantwoorden:** Zorg ervoor dat alle gestelde vragen worden beantwoord, aangezien deze belangrijk kunnen zijn voor het examen [30](#page=30).
* **Inlevering:** Vergeet niet om je lab-rapport, quizzen en/of screenshots in te leveren vóór de deadline [30](#page=30).
* **Evaluatie:** Houd rekening met de evaluatieregels en de cursusdisclaimer [30](#page=30).
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| RAID | Een technologie die meerdere harde schijven combineert om redundantie en/of prestatieverbeteringen te bieden voor gegevensopslag. Het staat voor "Redundant Array of Independent Disks". |
| JBOD | "Just a Bunch Of Disks" is een opslagconfiguratie waarbij schijven één voor één worden gevuld, zonder de redundantie of prestatieverbeteringen van ware RAID-niveaus. |
| Striping (RAID 0) | Een RAID-configuratie die gegevens verdeelt over meerdere schijven om de lees- en schrijfsnelheden te verhogen en de totale capaciteit te vergroten. Biedt geen redundantie. |
| Mirroring (RAID 1) | Een RAID-configuratie die identieke kopieën van gegevens op meerdere schijven opslaat, wat zorgt voor volledige redundantie ten koste van de effectieve opslagcapaciteit. |
| Parity (RAID 5) | Een RAID-configuratie die pariteitsinformatie over alle schijven verspreidt om gegevensverlies bij het falen van één schijf te voorkomen. Vereist minimaal drie schijven. |
| XOR | Een logische operatie die wordt gebruikt in RAID 5 om pariteitsinformatie te berekenen. De XOR-operatie vergelijkt bits en retourneert 1 als de bits verschillend zijn, en 0 als ze gelijk zijn. |
| Hot Spare | Een extra schijf die klaarstaat om een defecte schijf in een RAID-array onmiddellijk te vervangen om het rebuild-proces te starten en de redundantie te herstellen. |
| LVM (Logical Volume Manager) | Een opslagmanagementsysteem dat flexibiliteit biedt door fysieke opslagapparaten (zoals schijven of RAID-arrays) te groeperen in volumegroepen, die vervolgens kunnen worden opgedeeld in logische volumes. |
| Fysiek Volume (PV) | Een opslagapparaat (schijf, partitie, RAID-array) dat is geconfigureerd om te worden gebruikt door LVM. |
| Volume Groep (VG) | Een verzameling van één of meer Fysieke Volumes (PV's) in LVM, die samen één grote opslagpool vormen. |
| Logisch Volume (LV) | Een virtuele partitie die is gemaakt binnen een Volume Groep (VG) in LVM. Deze LV's kunnen worden geformatteerd en gebruikt als standaard opslagapparaten. |
| SAN (Storage Area Network) | Een speciaal netwerk dat block-level opslagapparaten aan servers levert. Het wordt vaak gebruikt in bedrijfsomgevingen voor gecentraliseerde opslagtoegang. |
| iSCSI (Internet Small Computer System Interface) | Een netwerkprotocol dat block-level opslagtoegang over een TCP/IP-netwerk mogelijk maakt, waardoor het mogelijk is om een SAN te creëren met standaard Ethernet-hardware. |
| iSCSI Target | De server die iSCSI-opslag (LUNs) aanbiedt aan initiators. |
| iSCSI Initiator | De client die verbinding maakt met een iSCSI Target om toegang te krijgen tot de aangeboden opslag (LUNs). |
| LUN (Logical Unit Number) | Een logisch gedefinieerde opslageenheid die door een iSCSI Target wordt aangeboden aan een iSCSI Initiator. |
| IQN (iSCSI Qualified Name) | Een unieke naamgevingsconventie die wordt gebruikt om iSCSI Targets en Initiators te identificeren, vergelijkbaar met een World Wide Name (WWN). |
| Block I/O | Input/Output operaties die gegevens verwerken in vaste blokken, typisch gebruikt voor directe opslagtoegang op schijfniveau. |
| File I/O | Input/Output operaties die gegevens verwerken op bestandsniveau, waarbij de bestandsstructuur en metadata worden beheerd. |
| DAS (Direct-Attached Storage) | Opslag die rechtstreeks is verbonden met een enkele server, in tegenstelling tot gedeelde opslag via een SAN of NAS. |
| NAS (Network-Attached Storage) | Opslagapparaten die toegang bieden tot bestanden via een netwerkprotocol (zoals NFS of SMB), bedoeld voor file-level toegang. |
| 3-2-1 regel | Een veelgebruikte backup-strategie die stelt dat er minstens drie kopieën van de gegevens moeten zijn, opgeslagen op minstens twee verschillende media, waarvan er minstens één zich op een andere locatie bevindt. |