Cover
Jetzt kostenlos starten 6_Publieke databanken_2025_2026 (1).pdf
Summary
# Rol en structuur van publieke databanken in de levenswetenschappen
Publieke databanken spelen een cruciale rol in de levenswetenschappen door het organiseren, toegankelijk maken en duurzaam bewaren van diverse biologische en biomedische gegevens, wat essentieel is voor onderzoek en ontdekking [2](#page=2).
### 1.1 Fundamentele rol van publieke databanken
De primaire rol van publieke databanken is het mogelijk maken van het doorgeven van gegevens op lange termijn, waardoor informatie vindbaar en toegankelijk blijft voor de wetenschappelijke gemeenschap. Ze fungeren als centrale repositories voor literatuur, experimentele data, moleculaire informatie en andere biomedische gegevens. Dit bevordert de transparantie, reproduceerbaarheid en de ontwikkeling van nieuwe hypothesen, zowel in reductionistische als in systeembiologische benaderingen. De publieke beschikbaarheid van data, met name na de doorbraak van het humaan genoomproject en de implementatie van de Bermuda Principles, heeft de wetenschap in de levenswetenschappen aanzienlijk versneld [16](#page=16) [23](#page=23) [2](#page=2) [6](#page=6).
### 1.2 Organisatie en structuur van gegevens
De effectiviteit van publieke databanken wordt sterk bepaald door hun interne organisatie en structuur, die de doorzoekbaarheid van de opgeslagen informatie dicteren. Verschillende databanken hebben uiteenlopende structuren en hanteren verschillende sleutelwoorden of gecontroleerde vocabularia, wat ertoe leidt dat ze er anders uitzien en benaderd moeten worden [2](#page=2) [6](#page=6).
#### 1.2.1 Doorzoekbaarheid en vindbaarheid
Om gegevens effectief te kunnen doorzoeken en vinden, is het gebruik van een "controlled vocabulary" (gecontroleerd vocabulaire) essentieel. Dit vocabulaire wordt gedefinieerd en geïmplementeerd door de databank, in overleg met experts, om een consistente terminologie te garanderen. "Key words" of sleutelwoorden worden zowel door auteurs gebruikt om hun werk aan te leveren als door gebruikers om informatie te zoeken. Het gebruik van sleutelwoorden dateert van voor het digitale tijdperk, maar gecontroleerde vocabularia zoals MeSH werden later geïmplementeerd (vanaf 1997 voor MedLine) [3](#page=3) [7](#page=7).
Het "controlled vocabulary" en de "key words" overlappen slechts gedeeltelijk en evolueren onafhankelijk van elkaar in de tijd. Nieuwe concepten in de biomedische wetenschappen vereisen constante aanpassingen in de gecontroleerde vocabularia, waaronder toevoegingen, wijzigingen en verwijderingen van termen, met bijbehorende aanpassingen in hiërarchische boomstructuren [10](#page=10) [4](#page=4) [8](#page=8).
#### 1.2.2 MeSH (Medical Subject Headings)
MeSH is een gecontroleerd vocabulaire van de U.S. National Library of Medicine, gebruikt voor het indexeren van artikelen in MEDLINE/PubMed. Het doel is om informatie te kunnen ophalen, zelfs wanneer er verschillende terminologieën voor hetzelfde concept worden gebruikt. MeSH-termen zijn dynamisch en continu in ontwikkeling, met toevoeging van nieuwe termen en revisies van bestaande, zoals synoniemen en verfijningen [7](#page=7) [8](#page=8).
MeSH-termen zijn georganiseerd in een boomstructuur, waarbij elke term minimaal één uniek hiërarchisch nummer heeft. Een interessant aspect is dat MeSH-termen in verschillende bomen kunnen voorkomen, en dat er meerdere nummers kunnen zijn voor dezelfde entry. De MeSH-boomstructuur omvat 16 hoofdcategorieën die niet alleen medische maar ook andere gebieden omvatten, waaronder biomoleculen [11](#page=11) [12](#page=12).
#### 1.2.3 Databanken met experimentele gegevens
Databanken met experimentele gegevens zijn divers en bevatten "entries" (de feitelijke gegevens), annotaties (tekstuitleg bij een entry) en links naar andere databanken, inclusief PubMed. Het is belangrijk te beseffen dat elke databank onvolledig kan zijn en fouten kan bevatten, zowel door de oorspronkelijke indiener (depositor) als door de curator. Niet alle informatie in een databank is even betrouwbaar; automatische annoteringen kunnen bijvoorbeeld leiden tot extrapolaties en fouten, terwijl handmatige annotaties door experts, gebaseerd op degelijke publicaties, betrouwbaarder zijn [13](#page=13) [29](#page=29).
#### 1.2.4 Relationele databanken
Hoewel het document de structuur van relationele databanken later in detail behandelt, wordt aangegeven dat dit een oorzaak is van de verschillen tussen databanken [6](#page=6).
### 1.3 Belang van sleutelwoorden en vocabularia
#### 1.3.1 Zoeken en vinden van informatie
Sleutelwoorden en gecontroleerde vocabularia zijn de ruggengraat van effectief zoeken in publieke databanken. Ze stellen onderzoekers in staat om met precisie de relevante literatuur, experimentele data en moleculaire informatie te vinden [3](#page=3) [6](#page=6).
> **Tip:** Maak je vertrouwd met de verschillende zoekstrategieën en de rol van zowel zelfgekozen "key words" als gestructureerde "controlled vocabulary" om efficiënt informatie te kunnen opvragen [3](#page=3).
#### 1.3.2 Evolutie van terminologie
De levenswetenschappen zijn dynamisch, met voortdurend nieuwe ontdekkingen en concepten die zich manifesteren. Dit vereist dat de terminologie binnen gecontroleerde vocabularia continu wordt bijgewerkt om de nieuwste wetenschappelijke ontwikkelingen te weerspiegelen. De evolutie van termen, zoals "actin" (KW 1946, CV 1997) en "COVID-19" (KW 2020, CV 2021), illustreert dit dynamische proces [4](#page=4) [8](#page=8).
### 1.4 Diverse types publieke databanken in de levenswetenschappen
Er is een breed spectrum aan publieke databanken, elk met een specifieke focus, wat hen onderscheidt in hun inhoud en structuur [6](#page=6).
#### 1.4.1 Literatuur databanken
* **PubMed:** Een database met citaties en abstracten van biomedische literatuur uit MEDLINE en andere life science tijdschriften. Biedt links naar volledige tekstversies wanneer beschikbaar via PubMed Central of andere websites. Gekoppeld aan het National Center for Biotechnology Information (NCBI) [7](#page=7).
* **PubMed Central (PMC):** Een digitaal archief van volledige biomedische en life science literatuur, inclusief klinische geneeskunde en volksgezondheid [7](#page=7).
* **Web of Science (WoS), Google Scholar:** Bredere literatuurdatabases [6](#page=6).
* **Embase:** Gericht op biomedische en medische literatuur [6](#page=6).
#### 1.4.2 Experimentele data databanken
Deze databanken zijn vaak "molecule centric" en bevatten ruwe of verwerkte experimentele data. Ze kunnen links bevatten naar literatuurdatabases zoals PubMed [6](#page=6).
#### 1.4.3 Specifieke databanken en hun focus
* **Image Data Resource (IDR):** Bevat geannoteerde data en "images" (foto's en filmpjes van biologische data) [16](#page=16) [31](#page=31).
* **cBioportal:** Gericht op kankergenomica, biedt informatie per gen, per patiënt en per kanker (sub)type, inclusief type mutatie. Informatie uit cBioportal kan gecombineerd worden met data uit andere bronnen zoals PDB en PubMed om nieuwe hypothesen te formuleren [16](#page=16) [32](#page=32) [33](#page=33).
* **Online Mendelian Inheritance in Man (OMIM):** Gecentreerd op moleculen gekoppeld aan ziektebeelden [16](#page=16).
* **UniProt:** Een portaal voor eiwit-informatie, gericht op eiwitsequenties en annotaties (lokalisatie, functie, modificaties). Bevat kruisreferenties naar andere databanken voor interacties, histologie, massaspectrometrische data, varianten en structuren (PDB) [29](#page=29) [30](#page=30).
* **NCBI Protein:** Vergelijkbaar met UniProt, biedt eiwitsequenties en annotaties [29](#page=29).
* **PDB (Protein Data Bank):** Bevat structurele informatie over eiwitstructuren [29](#page=29).
* **ZFIN (Zebrafish Information Network), XENBASE (Xenopus tropicalis), HUPO (Human Proteome Organisation):** Databanken met focus op modelorganismen en hun respectievelijke moleculen [17](#page=17).
#### 1.4.4 Databanken met focus op interacties
Deze databanken richten zich voornamelijk op interacties tussen moleculen, met name eiwitten [15](#page=15).
### 1.5 Publiek delen van data en commerciële belangen
Het publiek delen van data is niet altijd vanzelfsprekend en is discipline-afhankelijk. Commerciële belangen, zoals patenten op chemische syntheses van geneesmiddelen, kunnen een strijdpunt vormen bij het openstellen van informatie. De strijd om informatie open te maken is vaak moeizaam vanwege concurrentie [23](#page=23).
De doorbraak van het sequencen van het humane genoom was cruciaal, waarbij The Human Genome Project (THGP) het plan had om het genoom gratis open te stellen (Bermuda Principles, 1997). Dit plan ondermijnde de commerciële plannen van Celera Corporation, wat resulteerde in de gratis beschikbaarheid van niet alleen het humane genoom, maar ook van alle andere genomen en data in de levenswetenschappen [23](#page=23).
#### 1.5.1 Patenten en biologische sequenties
Begin 21e eeuw werden er veel patenten aangevraagd op biologische sequenties, wat leidde tot veel rechtszaken. Een patent is bedoeld om informatie publiek te maken en commercieel te beschermen, maar de reikwijdte van deze bescherming is aan discussie onderhevig. Er is ook discussie of biologische sequenties uitvindingen of ontdekkingen zijn. Het Hooggerechtshof in de VS besloot in 2013 dat de sequentie van een gen of genoom niet patenteerbaar is, maar cDNA wel, omdat dit een kunstmatig gemaakt product is dat enkel exonen bevat [28](#page=28).
### 1.6 Praktische toepassing en oefening
Het practicum over publieke databanken is ontworpen om studenten te leren biomedische gegevens op te zoeken via sleutelwoorden en filters. De oefeningen omvatten het gebruik van databanken zoals Ensembl, OMIM, UniProt, en NCBI Protein. Het doel is het ontwikkelen van vaardigheden in het omgaan met databanken, niet enkel kennisreproductie. Vragen over databanken die in het hoorcollege zijn behandeld maar niet in het practicum gebruikt, kunnen ook op het examen voorkomen [34](#page=34) [35](#page=35) [36](#page=36).
> **Tip:** Oefen zelfstandig met de databanken en vergelijk je resultaten met de oplossingen voordat je de begeleidende video raadpleegt. Dit helpt bij het ontwikkelen van probleemoplossend vermogen bij het omgaan met databanken [36](#page=36).
---
# Types databanken en hun inhoud
Dit deel van de analyse focust op de diverse databanken die informatie bevatten over literatuur, experimentele data, moleculen zoals genomen en eiwitten, interacties, en specifieke focusgebieden zoals kanker en modelorganismen.
### 2.1 Overzicht van databankinhoud
Data in de levenswetenschappen is vaak publiek beschikbaar en kan gecategoriseerd worden op basis van de inhoud. Deze databanken kunnen aanzienlijk variëren in structuur en gebruikte terminologie (keywords/controlled vocabulary) [5](#page=5) [6](#page=6).
### 2.2 Literatuurdatabanken
Literatuurdatabanken bevatten wetenschappelijke publicaties en zijn essentieel voor het vinden van reeds gepubliceerde kennis.
* **Voorbeelden:** Pubmed en Embase zijn gericht op biomedische en medische literatuur. Web of Science (WoS) en Google Scholar bieden een breder scala aan wetenschappelijke disciplines [6](#page=6).
### 2.3 Databanken voor experimentele data
Deze databanken slaan experimentele data op, zowel in ruwe als verwerkte vorm, en zijn vaak "molecule-centric". Ze bevatten doorgaans links naar literatuurdatabanken zoals Pubmed [6](#page=6).
### 2.4 Databanken gefocust op moleculen
Deze categorie omvat gespecialiseerde databanken die gedetailleerde informatie verstrekken over specifieke moleculen.
#### 2.4.1 Eiwitstructuren en nucleïnezuren
* **Protein Data Bank (PDB):** Bevat 3D-structuren van eiwitten en nucleïnezuren. Het begon met 3D-structuren van eiwitten, zoals myoglobine, waarvoor John Kendrew en Max Perutz in 1962 de Nobelprijs ontvingen. De groei van het aantal structuren in de PDB is significant. Elk item in de PDB heeft een unieke code (PDB ID). De PDB bevat niet alleen kristalstructuren, maar ook structuren verkregen via nucleaire magnetische resonantie (NMR), evenals nucleïnezuren (DNA, RNA) en complexen daarvan [14](#page=14) [18](#page=18) [20](#page=20) [22](#page=22).
#### 2.4.2 Genoomdata
* **Ensembl:** Een databank die publieke genomen bevat, georganiseerd op genbasis. Ensembl richt zich primair op vertebraten, maar bevat ook genomen van diverse andere organismen, waaronder gist, insecten en wormen. De kwaliteit van de data in Ensembl is hoog tot zeer hoog, met name voor mens en belangrijke modelorganismen zoals muis, zebravis en *Xenopus tropicalis*. Vanaf Release 112 (mei 2024) bevat Ensembl meer dan 340 partiële of bijna volledige genomen [25](#page=25) [26](#page=26) [27](#page=27).
* **UCSC Genome Browser:** Een andere belangrijke bron voor genoomdata [14](#page=14).
#### 2.4.3 Chemische entiteiten en eiwitten
* **PubChem:** Een uitgebreide databank voor chemische structuren [14](#page=14).
* **NCBI Protein:** Bevat informatie over eiwitsequenties en annotaties [14](#page=14).
* **UniProt:** Een centraal portaal voor eiwitgerelateerde informatie (#page=14, 30). Naast eiwitsequenties biedt UniProt annotaties over lokalisatie, functie en modificaties. Annotaties kunnen automatisch worden toegevoegd na analyse en vergelijking van sequenties, wat het proces versnelt maar fouten kan introduceren. Handmatig toegevoegde annotaties, gebaseerd op betrouwbare publicaties, worden als het meest accuraat beschouwd. UniProt bevat ook kruisreferenties naar andere databanken voor informatie over interacties, histologie, massaspectrometrische data, varianten en structuren in de PDB [14](#page=14) [29](#page=29) [30](#page=30).
* **Human Protein Atlas:** Koppelt het voorkomen van specifieke eiwitten aan weefsels en cellen, inclusief kankercellen [14](#page=14).
### 2.5 Databanken met specifieke focusgebieden
Sommige databanken richten zich op specifieke onderzoeksgebieden of toepassingen.
#### 2.5.1 Beeldmateriaal
* **Image Data Resource (IDR):** Een databank met geannoteerde (zoekbare) data en beelden (foto's en filmpjes) van biologische data (#page=16, 31) [16](#page=16) [31](#page=31).
#### 2.5.2 Kanker genomics
* **cBioportal for Cancer Genomics:** Een platform dat informatie levert over kanker genomics, georiënteerd op kanker subtypes, geassocieerde moleculen, informatie per gen, per patiënt en per type mutatie (#page=16, 32, 33). Het combineert informatie over mutaties in genen, structurele informatie van eiwitstructuren (PDB) en functionele informatie (PubMed) om nieuwe hypothesen te formuleren [16](#page=16) [32](#page=32) [33](#page=33).
#### 2.5.3 Moleculen gekoppeld aan ziektebeelden
* **Online Mendelian Inheritance in Man (OMIM):** Een databank die zich richt op moleculen die gekoppeld zijn aan ziektebeelden [16](#page=16).
### 2.6 Databanken met focus op modelorganismen
Specifieke databanken zijn gewijd aan informatie over modelorganismen, die cruciaal zijn voor biologisch onderzoek. Voorbeelden zijn:
* **ZFIN (Zebrafish Information Network):** Bevat data over *Danio rerio* (zebravissen) [17](#page=17).
* **Xenbase:** Bevat data over *Xenopus tropicalis* (tropische klauwkikker) [17](#page=17).
* **HUGO (Human Genome Organization):** Hoewel niet expliciet een databank in deze context, representeert het de menselijke genomen in vergelijking met modelorganismen [17](#page=17).
> **Tip:** Het begrijpen van de specifieke focus en data types van verschillende databanken is cruciaal voor het effectief zoeken naar informatie en het formuleren van nieuwe hypothesen [16](#page=16).
> **Tip:** Wees alert op de herkomst van annotaties in databanken zoals UniProt en NCBI Protein; automatisch gegenereerde annotaties kunnen fouten bevatten, terwijl handmatige annotaties doorgaans betrouwbaarder zijn [29](#page=29).
> **Tip:** De kruisreferenties tussen databanken zijn van onschatbare waarde voor een diepgaande analyse van biologische moleculen en hun functies [29](#page=29).
---
# Historische ontwikkeling en uitdagingen van data delen
Dit onderwerp verkent de evolutionaire reis van het delen van biologische data, de obstakels die dit proces bemoeilijken, en de opkomst van essentiële databanken zoals de Protein Data Bank (PDB).
### 3.1 De geboorte van de Protein Data Bank (PDB)
De oorsprong van het delen van biologische data kan worden teruggevoerd tot de 3D-structuren van eiwitten. Een baanbrekende ontwikkeling hierin was de bepaling van de structuur van potvis myoglobine, waarvoor John Kendrew en Max Perutz in 1962 de Nobelprijs ontvingen [18](#page=18).
#### 3.1.1 De kosten en complexiteit van structuurbepaling
Het verkrijgen van eiwitstructuren is van grote waarde, maar het proces is aanzienlijk kostbaar en tijdrovend. De stappen omvatten het kloneren van het gen, het produceren en zuiveren van het eiwit in grote hoeveelheden, en het kristalliseren ervan. Vervolgens wordt röntgendiffractie gebruikt in combinatie met complexe berekeningen om de locatie van atomen te bepalen. De benodigde procedure en infrastructuur zijn enorm kostelijk, en het proces kan decennia duren, zoals geïllustreerd door de structuurbepaling van actine die meer dan 20 jaar in beslag nam [19](#page=19).
#### 3.1.2 De oprichting van de PDB
Een belangrijke mijlpaal was de ontwikkeling van een rasterdisplay in 1968 die 3D-structuren van eiwitten op een scherm kon tonen. Dit leidde tot het idee om de verkregen 3D-structuurinformatie publiek te delen. In 1971 werd de Protein Data Bank (PDB) opgericht, met de eerste 13 structuren die in 1976 werden gepubliceerd. De groei van het aantal structuren in de PDB per jaar toont de significante toename van beschikbare data. De PDB bevat diverse interessante moleculaire machines [19](#page=19) [20](#page=20) [21](#page=21).
### 3.2 Uitdagingen bij het publiek delen van data
Het publiek delen van data is geen vanzelfsprekendheid en varieert per discipline [23](#page=23).
#### 3.2.1 Commerciële belangen en concurrentie
Delen van informatie kan een strijdpunt worden wanneer er commerciële belangen spelen, zoals bij patenten en octrooien, bijvoorbeeld bij de chemische synthese van een geneesmiddel. De strijd om informatie open te maken verloopt vaak moeizaam door concurrentie [23](#page=23).
#### 3.2.2 Het humane genoomproject en open data
Een grote doorbraak in de biologie en biomedische wereld was het sequencen van het humane genoom in 2001. Twee groepen waren hierbij betrokken: Celera Corporation, geleid door Craig Venter, en The Human Genome Project (THGP), onder leiding van Francis Collins. Het plan van THGP om het genoom gratis open te stellen, vastgelegd in de Bermuda Principles in 1997, ondermijnde de commerciële plannen van Celera. Als gevolg hiervan is niet alleen het humane genoom, maar ook alle andere genomen en data in de levenswetenschappen vandaag de dag gratis beschikbaar [23](#page=23).
> **Tip:** De Bermuda Principles van 1997 waren cruciaal voor het bevorderen van open access tot genomische data.
#### 3.2.3 De rol van wetenschappelijke journals
Ook wetenschappelijke journals speelden een rol in de competitie rond het humane genoom. Celera publiceerde hun resultaten in Science, terwijl The Human Genome Project hun bevindingen publiceerde in Nature [24](#page=24).
### 3.3 Patenten en biologische sequenties
Aan het begin van de 21e eeuw werden er aanzienlijk veel patenten aangevraagd op biologische sequenties, waardoor sequencen bijna synoniem werd met patenteren. Dit leidde tot vele juridische geschillen [28](#page=28).
#### 3.3.1 De functie van patenten en de discussie rond biologische sequenties
Een patent is bedoeld om informatie publiek te maken en tegelijkertijd te beschermen voor commerciële doeleinden. Echter, de bescherming moet gedefinieerd zijn en men kan niet zomaar alle mogelijke toepassingen van een uitvinding patenteren. Er is ook een discussie gaande over de vraag of biologische sequenties uitvindingen dan wel ontdekkingen zijn [28](#page=28).
#### 3.3.2 Jurisprudentie rond genoom-patenten
In 2013 besloot het Hooggerechtshof van de Verenigde Staten dat de sequentie van een gen of genoom niet patenteerbaar is. Echter, cDNA (complementair DNA), dat alleen de exonen van een gen bevat en kunstmatig wordt gemaakt, wordt wel als patenteerbaar beschouwd omdat het geen natuurlijk product is [28](#page=28).
---
## Veelgemaakte fouten om te vermijden
- Bestudeer alle onderwerpen grondig voor examens
- Let op formules en belangrijke definities
- Oefen met de voorbeelden in elke sectie
- Memoriseer niet zonder de onderliggende concepten te begrijpen
Glossary
| Term | Definition |
|------|------------|
| Publieke databanken | Gegevensbanken die voor iedereen toegankelijk zijn en een breed scala aan informatie bevatten, vaak met een focus op specifieke wetenschappelijke disciplines zoals de levenswetenschappen. Hun structuur moet doorzoekbaar zijn om data vindbaar te maken voor onderzoekers. |
| Controlled vocabulary (CV) | Een gestandaardiseerde set termen die wordt gebruikt om informatie te indexeren en te doorzoeken. Het doel is om consistentie te waarborgen en het vinden van informatie te vergemakkelijken, ook wanneer verschillende terminologieën voor hetzelfde concept worden gebruikt. |
| Key words (KW) | Individuele woorden of zinsdelen die gebruikt worden om de inhoud van documenten of datasets te beschrijven. Ze helpen onderzoekers bij het zoeken naar relevante informatie en worden door auteurs gebruikt om hun werk aan te leveren. |
| MeSH (Medical Subject Headings) | Het gecontroleerde vocabulaire van de U.S. National Library of Medicine, gebruikt voor het indexeren van artikelen in MEDLINE/PubMed. MeSH biedt een consistente terminologie om informatie te ontsluiten, zelfs als er verschillende termen voor hetzelfde concept worden gebruikt. |
| Boomstructuur (in MeSH) | Een hiërarchische organisatie van termen binnen MeSH, waarbij bredere concepten boven specifiekere concepten staan. MeSH-termen kunnen echter in meerdere bomen voorkomen, wat de complexiteit van de structuur illustreert. |
| Entry | Het daadwerkelijke stuk data of gegeven dat is opgeslagen in een databank. Dit kan variëren van een genoomsequentie tot een eiwitstructuur of een abstract van een artikel. |
| Annotaties | Tekstuele toelichtingen of beschrijvingen die bij een 'entry' in een databank worden verstrekt. Deze annotaties bieden aanvullende context, zoals de functie, lokalisatie of modificaties van een molecuul. |
| PDB (Protein Data Bank) | Een internationaal archief van de driedimensionale structuren van eiwitten en nucleïnezuren. Het is een van de oudste en meest fundamentele databanken voor structurele biologie, opgericht om structurele gegevens publiek te delen. |
| Sequentie | De opeenvolgende volgorde van bouwstenen, zoals nucleotiden in DNA of RNA, of aminozuren in een eiwit. Biologische sequenties zijn fundamentele gegevens in de levenswetenschappen en vormen de basis voor veel onderzoek. |
| cDNA (complementair DNA) | Een DNA-molecuul dat wordt gesynthetiseerd uit messenger-RNA (mRNA) via reverse transcriptie. cDNA bevat alleen de exonen van een gen en is geen natuurlijk product, wat implicaties heeft voor patentering. |
| UniProt | Een uitgebreide, gratis en openbare database die gedetailleerde informatie over eiwitsequenties en hun functies biedt. UniProt functioneert als een portaal voor eiwitgerelateerde informatie en bevat kruisreferenties naar andere databanken. |
| cBioportal | Een platform voor het verkennen en visualiseren van genomische en moleculaire gegevens, met een specifieke focus op kankergenomica. Het koppelt informatie over genen, patiënten en kankersubtypes aan elkaar. |
| Modelorganismen | Organismen die worden gebruikt in wetenschappelijk onderzoek vanwege hun relatieve eenvoud, snelle voortplanting, of genetische manipulatie-eenvoud, om biologische processen te bestuderen die ook relevant zijn voor de mens. |