Développer une plateforme d’ingénierie du chaos pilotée par l’IA pour simuler des pannes sur des clusters Kubernetes et évaluer automatiquement l’impact.
Tester la résilience applicative et les défenses de sécurité (SecOps) afin d’identifier et corriger des faiblesses cachées dans l’infrastructure et les applications.
Responsabilités principales
Déploiement de la plateforme de chaos sur Kubernetes : conception des scénarios de panne, orchestration et exécution des injections de défaillance.
Mise en place d’une stack d’observabilité complète (logs, métriques, traces) pour collecter les signaux nécessaires à l’analyse automatique.
Intégration de la dimension sécurité (SecOps) pour inclure des attaques simulées, tests d’intrusion automatisés et vérification des contrôles de sécurité.
Développement d’un moteur IA d’analyse d’impact, scoring et reporting pour prioriser les vulnérabilités et proposer des remédiations.