Stage PFE – Data engineering & vectorisation (PostgreSQL, pgvector, embeddings)
Harington
StageSur site4 à 6 moisRémunéréDate limite : 30 nov. 2025
Data Engineering / Web ScrapingVector DatabasesAdministration PostgreSQLpgvectorEmbeddings
Description
Contexte
- Harington construit des briques techniques autour des LLM et de l’agentique, nécessitant une infrastructure de données adaptée.
- Le stage vise à mettre en place des pipelines de données et des mécanismes de vectorisation pour la recherche et le RAG.
Missions principales
- Conception et implémentation de flux de data engineering pour ingestion, traitement et indexation d’embeddings.
- Mise en œuvre de solutions de vectorisation et stockage avec PostgreSQL et pgvector, optimisation des requêtes de similarité.
Compétences & profil recherché
- Étudiant(e) en dernière année d’ingénierie informatique / IA / Data.
- Maîtrise de Python ; connaissances en bases de données (PostgreSQL) et en embeddings.
- Intérêt pour l’IA générative/NLP et les architectures de recherche vectorielle.
Environnement technique & équipe
- Travail sur embeddings, pgvector, et intégration avec les composants agentiques pour les flux RAG.
- Collaboration avec l’équipe IA/Harington pour production et mise en place de monitoring des pipelines.
Informations pratiques
- Lieu : Tunis.
- Durée : 4-6 months.
- Encadrement : Équipe IA de Harington.
Candidature
- Commentez « Intéressé(e) » et envoyez CV + GitHub/portfolio à mlaifa@harington.fr.
- Adresse e-mail pour candidature : mlaifa@harington.fr