Délégation gestion informatique
Gestion des menaces et réponses
Industrialiser vos projets
Tout voir, détecter, analyser et anticiper d’une infrastructure infogérée
De la même manière que regarder un thermomètre vous indique la température extérieure pour que vous décidiez de quoi vous vêtir, superviser vos systèmes permet de relever les valeurs d’indicateurs pertinents à votre activité pour vous guider dans vos décisions.
D’ailleurs, 90 % des managers estiment qu’il est très important d’avoir des métriques KPIs orientés sur leur métier*, mais seulement 27 % des managers se disent satisfaits de la supervision de leur infrastructure*. C’est parce que ces métriques permettent d’obtenir un regard objectif sur les systèmes que ces indicateurs sont précieux et essentiels.
Cependant, une mauvaise gestion de la supervision et de la métrologie peut entraîner des complications :
(*source Vanson Bourne)
1
2
3
4
La supervision consiste en un ensemble de sondes actionnées régulièrement pour aller vérifier le bon fonctionnement des services et des composants d’une infrastructure.
En cas de défaillance, une procédure d’alerte suivant différents critères est déclenchée.
Lorsque le composant fonctionne, la métrologie vient collecter des métriques, comme par exemple le nombre d’internautes connectés en temps réels ou encore le nombre de connexions à la base de données en simultané.
Ces métriques permettent d’élaborer des alertes plus complexes: par exemple, si le nombre d'internautes connectés dépasse tel seuil alors lancer le déploiement d’un nouveau serveur web. Les métriques ont aussi l’avantage de pouvoir être visualisées sous forme de graphiques.
Nous avons voulu aller bien plus profondément dans cette démarche, voici quelques exemples d’implémentation de services avancés :
• Détecter une variation dans le temps de génération d’une page web et déclencher un travail d’investigation avec vous pour trouver les causes de cette régression.
• Anticiper la saturation d’une ressource (espace disque, mémoire, processeur, réseau) qui ne permettra pas de passer la nuit sans une intervention permet d’éviter une intervention de nuit par l’astreinte.
• Détecter une augmentation de charge imprévue et déclencher des actions nécessaires (augmentation de ressources, ajout de serveur, …)
• Validation des éléments-clefs d’une infrastructure qui malgré des renouvellements automatiques peuvent cesser de fonctionner : expiration nom de domaine / certificat SSL LetsEncrypt ou tiers, clefs DNSSEC, renouvellement matériel auprès de Cloud public
• Corrélation entre les métriques métiers et les métriques techniques pour permettre de mesurer l’impact d’un changement sur les ventes ou la fréquentation d’une application.
En surveillant de près vos infrastructures pour anticiper les pannes et prévoir l'évolution de vos applications