Logo de TrendLabs

Sujet-03 - Plateforme Observabilité, Incidents, Alerting et Runbooks

TrendLabs

StageSur site4 à 6 moisDate limite : 24 févr. 2026
SRE/ObservabilityDevopsSRE/ObservabilityAIOps / ObservabilityFull-stack (Laravel/React)Monitoring/AlertingCloud/SaaSBackend (Node.js/Express)pythonLLM/IASentryCloudWatchSlack

Postuler

Description

Objectif: Créer une plateforme unique pour centraliser l'observabilité (logs, métriques), corréler les alertes et automatiser la création de runbooks via l'IA pour accélérer la résolution d'incidents.

Fonctionnalités attendues:

  • Module Observabilité & Alertes: Centralisation des flux (CloudWatch, Sentry) et génération de résumés d'alertes corrélées par LLM, diffusion sur Slack/Email.
  • Module Capitalisation & Runbooks: Regroupement intelligent des incidents passés et génération automatique de brouillons de runbooks par IA pour guider les interventions futures.

Technologies: Node.js ou Python, LLM (OpenAI/Anthropic), Sentry, CloudWatch, Webhooks, Prometheus/Grafana, Slack.

Profil recherché: Full-stack / DevOps.


📧 Pour postuler: contact@trendlabs.tn