Ce projet vise à développer un assistant intelligent capable d’extraire, analyser et résumer automatiquement les informations issues des documents internes (PDF, Word, etc.) et des vidéos d’entreprise (réunions, formations, présentations).
L’objectif est de permettre aux employés de poser des questions sur le contenu de ces sources et d’obtenir des réponses précises, quel que soit le format du support ou la langue utilisée, tout en respectant la confidentialité des données internes.
Missions principales
Concevoir et implémenter des pipelines d’ingestion et de prétraitement pour documents et vidéos (OCR, segmentation, transcription, indexation).
Développer des modules de traitement du langage naturel (NLP) et d’analyse vidéo pour l’extraction d’informations, le résumé automatique et la recherche sémantique.
Intégrer un assistant conversationnel capable de répondre aux requêtes des employés en s’appuyant sur les contenus indexés et les modèles d’IA.
Mettre en place des mécanismes de gestion de la confidentialité et des accès pour assurer la sécurité des données internes.
Profil recherché et compétences
Profil : Ingénieur / stagiaire Data & IA (stagiaire Data & IA 6 mois mentionné dans l’offre).
Compétences requises : Python, expérience avec des frameworks et bibliothèques IA, compréhension des techniques NLP et de traitement audio/vidéo.
Soft skills : capacité à travailler en équipe, rigueur sur la gestion des données sensibles, bonnes capacités d’analyse et de documentation.
Travaux attendus : prototypage rapide d’API/GUI (Streamlit possible), intégration de modèles de transcription (Whisper) et de chaines de traitement documentaire (LangChain), gestion de code via Git.
Modalités de candidature
Durée du stage : 6 mois (référence dans l’annonce).