
RADar PhD-positie Machine Learning for Rare Disease Data Integration and Embedding Techniques
- Rumbeke, Flandre-Occidentale
- CDI
- Temps-plein
- Data-exploratie & Analyse: Diepgaande analyse van klinische gegevens, met name van AZ Delta en IMA, inclusief prestatie-indicatoren en het ontwikkelen van inzichten.
- Gegevensintegratie: Integratie van datasets van IMA, Sciensano en AZ Delta in een uniforme cloudgebaseerde omgeving.
- Machine Learning Onderzoek: Toepassen van geavanceerde ML-technieken op klinische datasets, met focus op feature embeddings, dimensionaliteitsreductie en omgaan met imbalanced data.
- Samenwerking met Clinici: Nauw samenwerken met klinische experts om uitdagingen in de diagnose van zeldzame ziekten te begrijpen en hun inzichten te integreren.
- Wetenschappelijke Publicaties: Origineel onderzoek uitvoeren, onderzoeksvragen formuleren en resultaten publiceren in toonaangevende tijdschriften.
- Peter De Jaeger– Promotor (AZ Delta / Universiteit Hasselt)
- Sofie De Broe– Co-promotor (Universiteit Maastricht)
- Sofie Vanassche– Co-promotor (Universiteit Leuven)
- Ward Schrooten– Co-promotor (Universiteit Hasselt)
- Machine Learning: Grondige kennis van supervised/unsupervised learning, classificatie, clustering, dimensionaliteitsreductie (PCA, t-SNE, UMAP), en evaluatiemetrics (precision, recall, F1-score, AUROC, AUPRC), vooral bij onevenwichtige datasets.
- Deep Learning: Ervaring met neurale netwerken, vooral embedding-architecturen (autoencoders, variational autoencoders, contrastive learning). Kennis van TensorFlow of PyTorch vereist.
- Data Voorverwerking: Ervaring met het opschonen, transformeren en normaliseren van klinische data, omgaan met ontbrekende waarden en verschillende featuretypes.
- Biomedische Kennis: Inzicht in klinische contexten, vooral zeldzame ziekten. Basiskennis van medische terminologie en datatypes (labresultaten, genetische data, symptomen).
- Statistische Analyse: Vaardigheid in experimenteel ontwerp, hypothesetoetsing en interpretatie. Kennis van technieken voor imbalanced data (oversampling, undersampling, cost-sensitive learning).
- Programmeren: Sterke ervaring met Python en libraries zoals scikit-learn, pandas, NumPy, matplotlib, seaborn.
- Onderzoeksmethodologie: Vermogen om experimenten te ontwerpen, literatuur kritisch te evalueren en bij te dragen aan publicaties.
- Kritisch Denken: Methoden kunnen aanpassen aan de specifieke uitdagingen van zeldzame ziekten en klinische diagnostiek
- Embedding-technieken: Expertise in het genereren van feature embeddings uit klinische data, kiezen van gepaste architectuur, loss functions en optimalisatiestrategieën.
- Onevenwichtige Data: Aantoonbare ervaring met technieken voor class imbalance in embedding learning.
- Interpretatie (Gewenst): Ervaring met het interpreteerbaar maken van ML-modellen, zoals visualisatie van embeddings of identificatie van belangrijke features.
- Ervaring met Zeldzame Ziekte Datasets (Gewenst): Achtergrond in werken met bestaande datasets of samenwerking met klinische datapartners.
- 2 dagen per week bij IMA
- 1 dag per week bij Sciensano
- 1 dag per week bij AZ Delta
- Peter De Jaeger (Promotor, Universiteit Hasselt): 051 23 76 50