Logo de LIPN – Université Sorbonne Paris Nord

Generative Reinforcement Learning for de novo Drug Design

LIPN – Université Sorbonne Paris Nord

StageSur site4 à 6 moisRémunéréDate limite : 25 mars 2026
Data Science & Machine Learningdeep reinforcement learninggenerative modelsdrug discoverycheminformaticsIntelligence Artificielle & Data ScienceExplainable AI (XAI)Bioinformatics

Postuler

Description

Stage M2 (rémunéré) au LIPN visant la génération de molécules actives contre l’enzyme NDM-1 via des modèles génératifs et l’apprentissage par renforcement.

Objectifs principaux

  • Concevoir un modèle génératif efficace produisant des molécules valides, actives, nouvelles et diversifiées.
  • Améliorer les performances par rapport à des approches existantes (ex. ReLeaSE).

Deux postes (2 stagiaires), chacun sur un volet distinct:

  • Task 1: Conception, implémentation et évaluation d’un modèle RL basé sur la Cross Entropy Method (CEM), avec une politique de type RNN/GRU et une fonction de récompense simple (classifieur d’activité + validité). Sélection d’«élites» diversifiées via du clustering à chaque époque pour éviter les minima locaux et accroître la diversité des molécules générées.
  • Task 2: Conception d’une fonction de récompense avancée, guidée par l’analyse XAI d’un classifieur d’activité afin d’identifier les facteurs expliquant l’activité biologique et d’enrichir la récompense pour orienter la génération.

Profil recherché

  • Étudiants M2 en Informatique, motivés, avec de bonnes bases en apprentissage supervisé/non supervisé et en Python. Aucune expérience préalable en chimi-informatique requise.

Infos clés

  • Localisation: LIPN (Université Sorbonne Paris Nord)
  • Durée: 6 mois
  • Gratification: oui (stage rémunéré)

Dossier de candidature

  • CV
  • Lettre de motivation
  • Relevés de notes M1 et M2
  • Contacts de 1–2 référents (poste, email, téléphone)

📧 Pour postuler: thomas.papastergiou@univ-paris13.fr