Logo de Orange Tunisie

DSI 007 Implémentation d’un agent RAG multimodal pour la recherche et la consultation intelligente de documents PFE

Orange Tunisie

StageHybride4 à 6 moisDate limite : 25 nov. 2025
Intelligence Artificielle / GenAIDéveloppement Web & MobileData / Ingénierie documentaire

Postuler

Description

Contexte et objectif

  • Déployer un agent RAG (Retrieval-Augmented Generation) multimodal pour la recherche et la consultation intelligente de contenus hétérogènes (texte, tableaux, images, audio/voix).
  • L'agent doit ingérer et indexer des documents, extraire l'information (OCR, extraction de tableaux, transcription, traduction), retrouver les passages pertinents et générer des réponses précises et sourcées.

Missions principales

  • Implémenter les pipelines d'ingestion et d'indexation pour formats variés : texte, PDF, tableaux, images, fichiers audio (transcription via Whisper ou équivalent).
  • Développer les composants de recherche (vector search), récupération de passages pertinents, et génération avec LLMs (RAG) incluant attribution de sources et formats de sortie : réponses, résumés, extraction de faits.
  • Concevoir un mode conversationnel supportant questions/réponses, résumé multi-document, extraction structurée de faits et historique de dialogue.
  • Intégrer le système via une interface web et/ou mobile moderne et conviviale (UX/UI), avec API (FastAPI/REST) et conteneurisation (Docker) pour déploiement.

Technologies et compétences requises

  • Compétences attendues : AI/GenAI, prompt engineering, LLM, RAG, OCR, parsing, transcription (Whisper), traitement de tableaux et images.
  • Compétences de développement : Python, frameworks web/API (FastAPI/REST), front-end (Angular/React/Flutter), Docker, Git, bonnes pratiques CI/CD et tests.
  • Niveau d'études : Bac +5 (Cycle ingénieur ou master). Autonomie, rigueur, sens du produit et capacité à travailler en mode itératif/UX.

Modalités, livrables et encadrement

  • Entité d’accueil : Data et IA Factory - Systèmes d’information décisionnel. Nombre de stagiaires requis : 1. Durée du stage : 6 mois.
  • Livrables attendus : prototype fonctionnel de l’agent RAG multimodal, documentation technique, procédures d’ingestion/indexation, démonstration web/mobile et rapport de stage.
  • Déploiement attendu en conteneurs avec API exposée, tests de qualité des réponses et exemples d’intégration front-end.
  • Pour postuler : Postuler ici.