Logo de VAERDIA Solutions

8 GED INTELLIGENTE PFE

VAERDIA Solutions

StageHybride4 à 6 moisDate limite : 19 nov. 2025
Traitement automatique du langage (NLP)Intelligence Artificielle / OCRRecherche sémantique

Postuler

Description

Contexte et objectif

  • Thème : Gestion électronique des documents avec IA. Objectif principal : concevoir une GED cognitive capable de reconnaître, classer, résumer et traduire automatiquement les documents scannés.
  • Cas d'usage : traitement de documents scannés (factures, contrats, courriers) pour extraction d'information, recherche sémantique, génération de résumés et traduction automatique.

Compétences ciblées et technologies

  • Compétences techniques visées : NLP, OCR, classification, recherche sémantique et intégration full-stack.
  • Technologies proposées : FastAPI (backend), React (frontend), Tesseract (OCR), LangChain et GPT-4 (gestion des prompts et génération), FAISS (indexation d'embeddings pour recherche sémantique).

Tâches proposées et livrables

  • Implémenter une chaîne OCR robuste sur documents scannés (prétraitement d'images, Tesseract, nettoyage du texte) et pipeline de classification automatique des documents.
  • Construire des modules de résumé et de traduction automatique en s'appuyant sur LangChain et GPT-4 ; intégrer une recherche sémantique via embeddings et FAISS.
  • Développer une API (FastAPI) exposant les services (upload, OCR, classification, résumé, traduction, recherche) et un prototype frontend en React démontrant l'usage.
  • Livrables attendus : code source complet (containerisé), API documentée, frontend démo, rapport technique et métriques d'évaluation (précision/F1 pour classification, ROUGE/BLEU pour résumé/traduction, latence/robustesse pour l'OCR).

Environnement et attentes

  • Langages et outils : Python, JavaScript/React, Docker, tests unitaires, gestion de versions (Git). Connaissances en modèles de language, embeddings, et évaluation NLP fortement recommandées.
  • Critères d'évaluation : pertinence des classifications, qualité des résumés et traductions, performance de la recherche sémantique, ergonomie du prototype et qualité du rapport.

Modalités de candidature

  • Pour postuler, envoyer votre candidature par e‑mail à l'adresse : pfe2026@vaeerdia.com.
  • Objet recommandé pour l'e‑mail : "Candidature PFE 2026 – SUJET 8 GED INTELLIGENTE". Inclure CV, lettre de motivation et éventuellement exemples de projets ou code.