Generative Reinforcement Learning for de novo Drug Design

LIPN – Université Sorbonne Paris Nord

StageSur site4 à 6 moisRémunéréDate limite : 25 mars 2026

Data Science & Machine Learningdeep reinforcement learninggenerative modelsdrug discoverycheminformaticsIntelligence Artificielle & Data ScienceExplainable AI (XAI)Bioinformatics

Postuler

Description

Stage M2 (rémunéré) au LIPN visant la génération de molécules actives contre l’enzyme NDM-1 via des modèles génératifs et l’apprentissage par renforcement.

Objectifs principaux

Concevoir un modèle génératif efficace produisant des molécules valides, actives, nouvelles et diversifiées.
Améliorer les performances par rapport à des approches existantes (ex. ReLeaSE).

Deux postes (2 stagiaires), chacun sur un volet distinct:

Task 1: Conception, implémentation et évaluation d’un modèle RL basé sur la Cross Entropy Method (CEM), avec une politique de type RNN/GRU et une fonction de récompense simple (classifieur d’activité + validité). Sélection d’«élites» diversifiées via du clustering à chaque époque pour éviter les minima locaux et accroître la diversité des molécules générées.
Task 2: Conception d’une fonction de récompense avancée, guidée par l’analyse XAI d’un classifieur d’activité afin d’identifier les facteurs expliquant l’activité biologique et d’enrichir la récompense pour orienter la génération.

Profil recherché

Étudiants M2 en Informatique, motivés, avec de bonnes bases en apprentissage supervisé/non supervisé et en Python. Aucune expérience préalable en chimi-informatique requise.

Infos clés

Localisation: LIPN (Université Sorbonne Paris Nord)
Durée: 6 mois
Gratification: oui (stage rémunéré)

Dossier de candidature

CV
Lettre de motivation
Relevés de notes M1 et M2
Contacts de 1–2 référents (poste, email, téléphone)

📧 Pour postuler: thomas.papastergiou@univ-paris13.fr