Contexte et objectif
- Développer une application intelligente capable de reconnaître, d’extraire et d’analyser automatiquement les informations contenues dans des CV (PDF ou images numérisées).
- Optimiser le travail du département RH en automatisant le matching entre profils et fiches de poste pour accélérer la présélection et améliorer la précision du tri.
Missions principales
- Implémenter des modules OCR et de parsing (Tesseract, EasyOCR, LayoutLMv3) pour extraire texte, structure et informations contextuelles des CV.
- Concevoir et entraîner des modèles NLP (CamemBERT, spaCy) pour la reconnaissance d’entités, la classification de compétences et le matching profil-fiche de poste.
- Développer une API backend (Python, FastAPI) et, si nécessaire, une interface front-end (Angular / Java) pour visualiser les résultats de parsing et les recommandations de matching.
- Intégrer pipelines de déploiement et d’intégration continue (Docker, GitLab CI/CD) pour assurer reproductibilité et mise en production.
Livrables attendus
- Prototype fonctionnel capable de traiter CV en PDF et images, avec extraction structurée des champs (nom, contact, expériences, compétences, formations).
- Module de matching automatique entre CV et fiches de poste avec métriques d’évaluation (précision, rappel, F1) et rapports d’analyse.
- Documentation technique, scripts de déploiement Docker et pipeline CI/CD pour intégration en environnement COMAR.
Compétences et outils requis
- Compétences : IA, OCR, NLP, DevOps; bonnes pratiques en ingénierie logicielle.
- Langages et frameworks : Python (FastAPI), Java, Angular.
- Outils et modèles : Tesseract, EasyOCR, LayoutLMv3, CamemBERT, spaCy.
- Infrastructure : Docker, GitLab CI/CD.
Conditions et informations pratiques
- Type du Diplôme : Ingénierie en informatique.
- Nombre de stagiaire : 1.
- Durée : 6 mois.
- Lieu : Siège COMAR, Avenue Habib Bourguiba, Tunis.
📧 Pour postuler: recrutement@comar.tn