Contexte et objectifs
- Mettre en place une plateforme interne de gestion des connaissances basée sur l'approche RAG (Retrieval-Augmented Generation) exploitant les documents internes de l'entreprise.
- Garantir une solution fiable, sécurisée et évolutive intégrée à l'infrastructure on-premises de l'entreprise.
Environnement technique
- Plateforme : OpenShift (on-premises) avec mise en place d'un cluster interne.
- Langages & frameworks : Python (ex. LangChain), Spring Boot, Quarkus ; conteneurisation Docker et orchestration OpenShift.
- Base vectorielle : Qdrant / ChromaDB / Weaviate ; modèles LLM : OpenAI ou Llama-3 selon contraintes internes.
- Caching & performance : Redis ; Observabilité : Grafana et Prometheus.
Missions principales
- Installer et configurer un cluster OpenShift dans l’environnement interne de l’entreprise.
- Concevoir et développer un système de gestion des connaissances RAG : ingestion des documents, vectorisation, indexation et pipeline de requêtage.
- Intégrer et orchestrer des LLMs (OpenAI ou Llama-3) via LangChain ou équivalent pour la génération augmentée par récupération.
Automatisation & opérations
- Automatiser le cycle de vie complet de l’application RAG : construction (build), déploiement (CI/CD), mises à jour et rollback.
- Implémenter des mécanismes de monitoring et d’alerte avec Prometheus et Grafana, ainsi que des bonnes pratiques de logging et traçabilité.
- Assurer la sécurité (authentification, contrôle d’accès, chiffrement des données au repos/en transit) et la scalabilité de la plateforme.
Livrables attendus
- Cluster OpenShift opérationnel et documenté dans l’environnement interne.
- Application RAG déployée et démonstrable (pipeline d’ingestion, recherche vectorielle, génération assistée).
- Automatisation CI/CD complète, scripts/deployments pour Docker/OpenShift, et tableaux de bord d’observabilité.
- Documentation technique, guide d’exploitation et plan de montée en charge.
Profil recherché et compétences
- Compétences en Python et/ou Java (Spring Boot, Quarkus) et expérience avec Docker/OpenShift.
- Connaissance des bases vectorielles (Qdrant/ChromaDB/Weaviate), des workflows RAG et des APIs LLM (OpenAI/Llama-3).
- Notions de CI/CD, monitoring (Prometheus/Grafana), caching (Redis) et sécurité applicative.
- Autonomie, rigueur, capacité à documenter et à travailler dans un environnement on-premises.
📧 Pour postuler: internship@linsoft.com