Cover
Start nu gratis Ppt4_Seq.pdf
Summary
# PCR en sequencing methoden
Dit document behandelt de evolutie en de principes van PCR- en sequentietechnieken, van de klassieke Sanger-sequencing tot diverse Next Generation Sequencing (NGS) methoden zoals Illumina en Nanopore.
## 1. PCR en sequencing methoden
### 1.1 Inleiding tot sequencing
Sequencingmethoden zijn essentieel voor het bepalen van de volgorde van nucleotiden in DNA of RNA. Dit proces vormt de basis voor vele moleculair biologische toepassingen.
### 1.2 Sanger sequencing
Sanger sequencing, ook wel de dideoxymethode genoemd, was de eerste grootschalige sequencingtechniek en is nog steeds relevant voor specifieke toepassingen [7](#page=7).
#### 1.2.1 Principe van Sanger sequencing
Het principe berust op de inbouw van dideoxynucleotiden (ddNTP's) tijdens de DNA-synthese. Deze ddNTP's hebben geen 3'-hydroxylgroep, waardoor de ketenextensie stopt. De concentratie van ddNTP's ten opzichte van dNTP's is cruciaal; er is significant meer dATP aanwezig dan ddATP in de reactie [9](#page=9).
#### 1.2.2 Vereisten voor Sanger sequencing
Een belangrijke voorwaarde voor Sanger sequencing is dat de aangrenzende basen aan ten minste één zijde van de onbekende sequentie bekend moeten zijn om een primer te kunnen ontwerpen [6](#page=6).
#### 1.2.3 Geautomatiseerde Sanger sequencing
Moderne Sanger sequencing is geautomatiseerd. Dit omvat het gebruik van fluorescente labels op primers of ddNTP's, waardoor detectie via laser en capillaire elektroforese mogelijk is. Dit resulteert in een chromatogram dat automatisch wordt afgelezen en geïnterpreteerd [12](#page=12).
#### 1.2.4 Problemen en oplossingen bij Sanger sequencing
Enkele uitdagingen bij Sanger sequencing zijn:
* Sequenties met opeenvolgende identieke nucleotiden [16](#page=16).
* Hoog GC-gehalte, wat leidt tot hoge smelttemperaturen [16](#page=16).
* Secundaire structuren in het DNA-template [16](#page=16).
Oplossingen omvatten het optimaliseren van reactiecondities en het sequencen van complementaire en overlappende sequenties. Sanger sequencing is doorgaans geschikt voor sequenties tot ongeveer 1000 basenparen (bp) [16](#page=16) [17](#page=17).
### 1.3 Shotgun sequencing en assembly
Voor het sequencen van langere fragmenten (bijvoorbeeld 20 kb) wordt shotgun sequencing toegepast, waarbij het DNA in kleinere fragmenten wordt verdeeld, geëmbleerd, en vervolgens de aangrenzende fragmenten worden geïdentificeerd om een grotere sequentie op te bouwen [18](#page=18) [19](#page=19).
### 1.4 Sequentieanalyse en toepassingen
Sequentiegegevens kunnen worden opgeslagen en geanalyseerd met behulp van diverse databases zoals NCBI, EMBL, UniProt en OMIM, en tools zoals BLAST [21](#page=21).
Toepassingen van sequentieanalyse omvatten:
* **Klonering:** Controle van de correcte opname van DNA-fragmenten en het aantal kopieën [23](#page=23).
* **Identificatie van coderende gebieden (ORF's):** Zoeken naar expressiesignalen, promotors, en translatie-initiatieplaatsen [24](#page=24).
* **DNA-sequentievergelijking:** Identificatie van mutaties en genetische variatie [26](#page=26).
### 1.5 Next Generation Sequencing (NGS)
NGS, ook wel massaal parallel sequencing genoemd, is een high-throughput methode die sneller en goedkoper is per staal dan traditionele methoden, omdat het geen klonering in een vector vereist en geen noodzaak voor gekende aangrenzende sequenties [29](#page=29).
#### 1.5.1 Technieken binnen NGS
Verschillende NGS-technieken bestaan, waaronder:
* Bridge amplification (Solexa/Illumina) [29](#page=29) [30](#page=30).
* Nanopore sequencing [29](#page=29) [30](#page=30).
* Pyrosequencing (454 Life Sciences, Roche) [30](#page=30).
* SOLiD sequencing (Applied Biosystems) [30](#page=30).
* IonTorrent Sequencing [30](#page=30).
* PacBio Sequencing [30](#page=30).
#### 1.5.2 Algemene kenmerken van NGS
NGS maakt sequencing mogelijk van meerdere genen tegelijk, gerichte sequencing van specifieke regio's na PCR, of zelfs volledige genomen (Whole Genome Sequencing, WGS). Toepassingen omvatten onder andere kankerdiagnostiek, het voorspellen van fenotypes (ziektes, resistentie), en het bepalen van de ontvankelijkheid voor individuele behandelingsstrategieën [32](#page=32) [33](#page=33).
#### 1.5.3 Illumina (Solexa) sequencing (Bridge amplification)
Deze methode werkt met 'short reads' (maximaal 150 bp per read) en maakt gebruik van 'sequencing by synthesis' [31](#page=31) [46](#page=46).
Het proces omvat:
1. Maken van een bibliotheek van 'sheared' DNA-fragmenten [34](#page=34).
2. Ligatie van adaptors aan beide zijden, inclusief een index voor identificatie [34](#page=34) [52](#page=52) [53](#page=53).
3. Denaturatie en binding van de fragmenten aan een flow cell via complementaire adaptors [34](#page=34).
4. DNA-polymerase synthetiseert de eerste complementaire streng [34](#page=34).
5. Bridge amplification in situ creëert clusters van identieke ssDNA-moleculen met dezelfde oriëntatie [34](#page=34) [51](#page=51).
6. De 'reverse' streng wordt doorgeknipt [34](#page=34).
7. Een sequencing primer bindt, waarna DNA-polymerase dNTP's met fluorescente labels inbouwt. Dit gebeurt cyclisch, een proces dat bekend staat als 'cyclic reversible termination' [34](#page=34) [49](#page=49) [50](#page=50).
8. Een flow cell kan miljoenen clusters bevatten [46](#page=46).
#### 1.5.4 Nanopore sequencing
Nanopore sequencing staat bekend om het genereren van 'long reads' (tot wel 4000 kb) [31](#page=31) [66](#page=66).
Het principe omvat:
1. Maken van een bibliotheek van gedeeltelijk verknipte DNA-fragmenten met ligatie van adaptors en indices [63](#page=63).
2. DNA-moleculen worden door een synthetisch membraan met nanometer-grote poriën geleid door een elektrische stroom (elektroforese) [63](#page=63).
3. Een helicase splitst dubbelstrengs DNA naar enkelstrengs DNA [64](#page=64).
4. Verschillende nucleotiden veroorzaken variaties in de doorlaatbaarheid van de porie door hun verschillende vormen, wat leidt tot verstoringen in de ionenstroom [64](#page=64).
5. Deze methode maakt ook epigenetische detectie mogelijk, zoals methylaties [64](#page=64).
#### 1.5.5 Vergelijking van Illumina en Nanopore
* **Leeslengte:** Illumina produceert short reads (ca. 150 bp), terwijl Nanopore long reads (tot 4000 kb) genereert [66](#page=66).
* **Accuraatheid:** Illumina heeft een foutenmarge van ongeveer 0,1%, terwijl Nanopore een foutenmarge van 5-10% heeft. De hogere accuraatheid van Illumina is mede te danken aan de gelijktijdige passage van meerdere nucleotiden in de porie [66](#page=66).
#### 1.5.6 Target enrichment
Wanneer niet het hele genoom wordt afgelezen, kan 'target enrichment' worden toegepast. Dit kan via gerichte PCR van specifieke regio's of via random PCR gevolgd door selectie met 'capturing' [54](#page=54) [57](#page=57).
#### 1.5.7 NGS data-analyse
Na sequencing kan de data worden geanalyseerd via:
* **Mapping to a reference genome:** Het mappen van de sequentie reads naar een bestaand referentiegenoom [67](#page=67) [68](#page=68) [69](#page=69).
* **De novo sequence assembly:** Het combineren van alle sequentiefragmenten om een nieuw genoom op te bouwen, waarbij gaten opgevuld kunnen worden [67](#page=67).
* **Annotatie:** Identificatie en verdere acties gebaseerd op gekende consensus sequenties [67](#page=67).
#### 1.5.8 Probleemzones bij NGS
Specifieke uitdagingen bij NGS, vooral bij eukaryoten, zijn herhalingen zoals verspreide herhalingen en tandem repeats [70](#page=70).
---
# Transcriptomics en metagenomics
Dit deel van de cursus behandelt transcriptomics, de studie van het volledige RNA-molecuul dat door een cel wordt geproduceerd, en metagenomics, de studie van genetisch materiaal van een gemengde populatie van organismen uit een omgevingsstaal [73](#page=73).
### 2.1 Transcriptomics
Transcriptomics, ook bekend als transcriptome sequencing, RNAseq, of whole transcriptome shotgun sequencing (WTSS), is de studie van het volledige RNA-molecuul dat door een cel wordt geproduceerd. Het biedt zowel kwalitatieve als kwantitatieve informatie over het transcriptome [73](#page=73) [74](#page=74).
#### 2.1.1 Transcriptomics in Eukaryoten
Bij eukaryoten begint het proces met RT-PCR (reverse transcriptase polymerase chain reaction) met oligo(dT) primers, wat resulteert in een cDNA-bibliotheek die vervolgens wordt gesequenced met Next-Generation Sequencing (NGS). De verkregen sequenties worden vergeleken met het genoom. Een uitdaging hierbij is het intron-probleem, dat wordt opgelost door de sequenties in silico naar het exoom (het deel van het genoom dat uit exonen bestaat) te mappen [74](#page=74).
Het RNA in een eukaryote cel bestaat voor een groot deel uit:
* rRNA: 70-80%
* tRNA: 15%
* mRNA: 3-4%
* Andere RNA's [75](#page=75).
#### 2.1.2 Kwalitatieve en Kwantitatieve Informatie uit mRNAseq
* **Kwalitatieve informatie** uit mRNAseq betreft de identificatie van welke genen tot expressie komen [75](#page=75).
* **Kwantitatieve informatie** uit mRNAseq geeft inzicht in de mate van expressie van deze genen, dus hoeveel van elk transcript aanwezig is [75](#page=75).
Om de analyse te focussen op de mRNA-moleculen, wordt vaak een **enrichment voor mRNA** uitgevoerd [76](#page=76).
#### 2.1.3 Technieken binnen Transcriptomics
Diverse technieken worden gebruikt voor transcriptomics analyses, waaronder:
* Serial analysis of gene expression (SAGE) [77](#page=77).
* Cap analysis gene expression (CAGE) [77](#page=77).
* Single cell RNA seq [77](#page=77).
#### 2.1.4 Toepassingen van Transcriptomics
Transcriptomics kent verschillende specifieke toepassingen:
* **miRNA seq:** Deze techniek vindt plaats na selectie op grootte van RNA (17-25 nucleotiden) [79](#page=79).
* **Prokaryotic rRNA seq:** Voor prokaryoten worden sequence-specifieke primers gebruikt die zich richten op geconserveerde gebieden van het rRNA [79](#page=79).
> **Tip:** Het gebruik van random primers voor RT-PCR in plaats van oligo(dT) primers kan leiden tot een bredere detectie van RNA-moleculen, inclusief niet-polyadenylerende RNA's, maar kan ook de bias in de representatie van verschillende transcripten veranderen [74](#page=74).
### 2.2 Metagenomics
Metagenomics richt zich op de studie van genetisch materiaal afkomstig van een gemengde populatie van organismen uit een omgevingsstaal [73](#page=73) [80](#page=80).
#### 2.2.1 Informatie Verkregen uit Metagenomics
Door het sequencen van een multi-organisme staal kunnen verschillende soorten informatie worden verkregen:
* Identificatie van de aanwezige soorten, inclusief de ontdekking van nieuwe soorten [80](#page=80).
* Het vaststellen van taxonomische relaties tussen de gedetecteerde organismen [80](#page=80).
* Inzicht in de eigenschappen van de soorten, zoals de aanwezigheid van antibioticum-resistentie genen [80](#page=80).
---
# Sequentie-analyse en toepassingen
Dit onderwerp richt zich op de methoden en toepassingen van het analyseren van DNA-sequenties, met name door het gebruik van databanken en gereedschappen zoals BLAST, om biologische informatie te ontcijferen en toe te passen [21](#page=21) [23](#page=23).
### 3.1 Databanken en analyse tools
Er zijn verschillende publiek toegankelijke databanken die DNA-sequenties en bijbehorende annotaties bevatten. Belangrijke voorbeelden hiervan zijn NCBI, EMBL, UniProt en OMIM. Voor het analyseren van deze sequenties zijn diverse tools beschikbaar, waarvan BLAST (Basic Local Alignment Search Tool) een cruciaal instrument is [21](#page=21).
### 3.2 Toepassingen van sequentie-analyse
De analyse van DNA-sequenties kent een breed scala aan toepassingen in moleculair biologisch onderzoek en biotechnologie [23](#page=23).
#### 3.2.1 Kloneringscontrole
Een fundamentele toepassing is de controle na klonering. Sequentie-analyse kan bevestigen of een DNA-fragment correct is opgenomen in een vector. Dit omvat het verifiëren van het aantal keren dat het fragment is opgenomen en of het in de juiste oriëntatie is ingebracht [23](#page=23).
#### 3.2.2 Identificatie van coderende gebieden
Sequentie-analyse is essentieel voor het identificeren van coderende regio's binnen een genoom. Dit proces omvat het zoeken naar verschillende expressiesignalen [24](#page=24).
* **Promotorregio:** Identificatie van bindingsplaatsen voor transcriptiefactoren, waaronder enhancers en repressors, die de genexpressie reguleren [24](#page=24) [71](#page=71).
* **Transcriptie-initiatieplaats:** Het bepalen van het startpunt van de RNA-synthese [24](#page=24).
* **Translatie-initiatieplaats:** Het lokaliseren van de startcodon (meestal AUG) waar de eiwitsynthese begint [24](#page=24).
* **Open Reading Frame (ORF):** Het identificeren van de specifieke sequentie die codeert voor een eiwit, van start- tot stopcodon [24](#page=24).
#### 3.2.3 Detecteren van mutaties en genetische variatie
DNA-sequentievergelijking stelt onderzoekers in staat om mutaties te detecteren en de genetische variatie binnen populaties of tussen individuen te bestuderen [26](#page=26).
#### 3.2.4 Verdere toepassingen
Naast de bovengenoemde toepassingen, leidt sequentie-analyse tot:
* **Voorspelling van producten of afwijkende producten:** Het identificeren van potentiële eiwitproducten en het voorspellen van afwijkende eiwitstructuren als gevolg van mutaties, wat relevant is voor medicijngevoeligheid en gentherapieontwikkeling [71](#page=71).
* **Begrip van genexpressieregulatie:** Door het analyseren van transcriptiefactor responselementen in regulatorische regio's, verkrijgt men een beter inzicht in genexpressie. Dit is cruciaal voor gepersonaliseerde geneeskunde en gentherapie [71](#page=71).
* **Bestuderen van genetische verwantschappen:** Het bepalen van evolutionaire verwantschappen tussen individuen en soorten [71](#page=71).
> **Tip:** De nauwkeurigheid van sequentie-analyse is direct afhankelijk van de kwaliteit van de gebruikte databanken en de juiste interpretatie van de resultaten van analyse-tools zoals BLAST. Zorg ervoor dat u de parameters van deze tools correct instelt voor uw specifieke onderzoeksvraag.
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Polymerase Chain Reaction (PCR) | Een moleculair-biologische techniek die gebruikt wordt om exponentieel specifieke DNA-fragmenten te amplificeren, wat essentieel is voor diverse toepassingen zoals sequencing en diagnostiek. |
| Sanger Sequencing | Een methode voor DNA-sequencing die gebaseerd is op de ketenterminatie door dideoxynucleotiden (ddNTPs) en elektroforese om de sequentie te bepalen, oorspronkelijk ontwikkeld door Frederick Sanger. |
| Next Generation Sequencing (NGS) | Een verzamelnaam voor moderne high-throughput sequencingtechnologieën die parallel duizenden tot miljoenen DNA-fragmenten kunnen sequencen, wat aanzienlijk sneller en goedkoper is dan Sanger sequencing voor grootschalige projecten. |
| Bridge Amplification | Een techniek die gebruikt wordt in Illumina sequencing om clusters van identieke DNA-moleculen te genereren op een flowcel, wat essentieel is voor het produceren van een sterk signaal tijdens sequencing by synthesis. |
| Sequencing by Synthesis | Een veelgebruikte NGS-methode waarbij DNA-fragmenten worden gesequenced terwijl ze worden gesynthetiseerd, waarbij bij elke stap de ingebouwde nucleotide wordt gedetecteerd, vaak via fluorescentie. |
| Nanopore Sequencing | Een single-molecule sequencingtechniek die gebruikmaakt van nanoporiën om DNA-moleculen te geleiden en de reeks van doorgelaten nucleotiden te detecteren aan de hand van veranderingen in elektrische stroom. |
| Transcriptomics | Het onderzoek naar de volledige set van RNA-transcripten die door een cel of organisme op een bepaald moment worden geproduceerd, wat inzicht geeft in genexpressie en cellulaire processen. |
| Metagenomics | De studie van genetisch materiaal dat rechtstreeks uit omgevingsmonsters is geïsoleerd, waardoor de analyse van de genetische diversiteit en functionele capaciteiten van gemeenschappen van micro-organismen mogelijk wordt. |
| Shotgun Sequencing | Een DNA-sequencingstrategie waarbij het gehele genoom willekeurig wordt gefragmenteerd, de fragmenten worden gesequenced en vervolgens geassembleerd tot een volledige sequentie door middel van bio-informatische methoden. |
| Contig Assembly | Het proces waarbij overlappende DNA-sequenties van individuele fragmenten worden samengevoegd tot langere, aaneengesloten stukken DNA, genaamd contigs, als onderdeel van de reconstructie van een volledig genoom. |
| BLAST (Basic Local Alignment Search Tool) | Een bio-informatica-algoritme dat gebruikt wordt om DNA- of aminozuursequenties te vergelijken met databases om homologieën te vinden en de functie van onbekende sequenties te voorspellen. |
| Open Reading Frame (ORF) | Een continue reeks van codons in een DNA- of RNA-sequentie die begint met een startcodon en eindigt met een stopcodon, wat een potentiële eiwitcoderende regio aangeeft. |
| Whole Genome Sequencing (WGS) | De bepaling van de volledige DNA-sequentie van het genoom van een organisme, wat alle genen en niet-coderende regio's omvat en gedetailleerde informatie verschaft over de genetische samenstelling. |
| Cyclic Reversible Termination | Een technologie die gebruikt wordt in sommige sequencing-by-synthesis methoden, waarbij de sequentiecyclus wordt beëindigd met een omkeerbaar cap en fluorescent label, wat cyclische detectie van nucleotiden mogelijk maakt. |
| Target Enrichment | Een strategie om specifieke DNA- of RNA-regio's te selecteren en te concentreren uit een complexe mix, om zo de efficiëntie en gevoeligheid van downstream analyses, zoals sequencing, te verbeteren. |
| SMRT Sequencing (Single Molecule, Real-Time) | Een long-read sequencingtechnologie ontwikkeld door PacBio die de DNA-synthese van enkele moleculen in real-time volgt, waardoor lange reads met hoge nauwkeurigheid mogelijk zijn. |
| Epigenetische Detectie | De mogelijkheid om chemische modificaties aan DNA of histonen te detecteren, zoals methylatie, die de genexpressie beïnvloeden zonder de onderliggende DNA-sequentie te veranderen, wat mogelijk is met bepaalde nanopore sequencing technologieën. |
| De Novo Sequence Assembly | Het proces van het construeren van een sequentie van een genoom of DNA-fragment zonder gebruik te maken van een bestaande referentie-sequentie, wat essentieel is voor het sequencen van nieuwe of nog niet gekarakteriseerde organismen. |
| RNA-Seq (RNA Sequencing) | Een transcriptomics-techniek die next-generation sequencing gebruikt om de aanwezigheid en kwantiteit van RNA-moleculen in een biologisch monster te meten, wat inzicht geeft in genexpressieprofielen. |
| Oligo(dT) primers | Korte stukjes enkelstrengs DNA die sequentie-specifiek binden aan de poly(A)-staart van messenger-RNA (mRNA) moleculen, gebruikt als startpunt voor de synthese van complementair DNA (cDNA) in transcriptomics-experimenten. |
| Exoom | Het deel van het genoom dat bestaat uit exonen, welke coderen voor eiwitten. Exome sequencing richt zich op deze coderende regio's, wat kosteneffectiever kan zijn dan whole genome sequencing. |
| rRNA (ribosomaal RNA) | RNA-moleculen die een structureel en katalytisch onderdeel vormen van ribosomen, essentieel voor eiwitsynthese. |
| tRNA (transfer RNA) | RNA-moleculen die aminozuren transporteren naar het ribosoom tijdens de eiwitsynthese, waarbij elk tRNA-molecuul een specifiek aminozuur bindt en correspondeert met een anticodon dat past bij een mRNA-codon. |
| mRNA (messenger RNA) | RNA-moleculen die de genetische code van DNA kopiëren en naar de ribosomen transporteren om als sjabloon te dienen voor eiwitsynthese. |
| miRNA (microRNA) | Kleine, niet-coderende RNA-moleculen die een rol spelen bij genregulatie door de expressie van doel-mRNA's te onderdrukken, voornamelijk na transcriptie. |