Maintenance avec anticipation panne et risques

Détecter les signes d’une prochaine défaillance sur une infrastructure IT et appliquer une maintenance préventive.

Maintenance

Préventif

Prédictif

Evolutif

Machine learning

Proactif

Analyse des tendances des métriques

La supervision et la métrologie permettent d’être alerté en temps réel d’un incident, mais nous voulions aller plus loin et permettre d’agir avant que la supervision ne constate un défaut.

Un exemple très simple est l’usage des espaces disque, la métrologie récupère à intervalles réguliers l’usage des disques et dresse un graphique d’usage dans le temps. De là nous mettons une analyse de tendance sur la courbe ainsi représentée, si cette tendance conclue à un manque d’espace disque dans les prochaines heures une préalerte nous permet d’intervenir avant l’incident.

Il en va de même sur les usages de la mémoire, du CPU, de la tenue en charge de l'application ou encore d'une saturation prochaine d'une base de données. Cette méthode est aussi intéressante pour prédire la montée en charge d’un serveur dans le temps, avec une croissance de X % ce serveur manquera de ressources mémoire dans Y semaines.

1

Maintenance préventive

Planification des entretiens matériels, actions coercitives, mises à jour des systèmes pour parer aux risques connus en fonction des cycles de chaque tenant.

2

Maintenance prédictive

Surveillance continue des performances et usages de l’infrastructure pour des ajustements techniques avant le déclenchement d’incidents.

3

Maintenance évolutive

Evolution des composants matériels, système ou logiciel de l’infrastructure pour ajuster les performances, les fonctionnalités ou les services rendus.

Maintenance informatique préventive

Dans le cadre de la maintenance préventive, nous allons parer aux risques inhérents à chaque composant d’une infrastructure.

  • Pour le matériel, chaque composant a une durée de vie avant panne connue, nous surveillons les indicateurs permettant de savoir si le matériel aura besoin d’un changement anticipé ou pourra dépasser sa durée de vie prévue. Le cas présent nous faisons un remplacement du matériel en conséquence.
  • Pour les systèmes d’exploitation Linux, une mise à jour quotidienne 7 jours sur 7 pour parer aux risques de bugs, de failles de sécurité et contre l’obsolescence est le bon rythme pour garder à système d’exploitation à jour et sain.
  • Pour les logiciels, la mise à jour dans les dernières versions mineures se fait quotidiennement pour la correction des bugs et des failles de sécurité. Les versions majeures se font après validation des changements vis-à-vis des applications clients pour éviter toute régression de service.

L’infogérance préventive permet d'augmenter significativement la disponibilité des applications

Maintenance informatique prédictive

La maintenance prédictive d’un système d’informations permet d’éviter une panne avant qu’elle ne se produise, à la différence de la maintenance curative a posteriori d’une panne. A l’heure du Big Data et du Machine Learning les possibilités offertes pour la détection et l’analyse des signaux faibles annonçant une panne permettent de détecter ce qu’une analyse humaine aurait le plus grand mal à détecter.

  • Pour le matériel, la maintenance prédictive permet d’effectuer des actions sur des déclenchements de seuils. Cela permet de conserver du matériel jusqu’aux derniers instants avant renouvellement obligatoire et non sur un critère d’âge.
  • Permet une utilisation optimale des systèmes pour être au plus proche de l’usage réel, espace disque, processeur, mémoire sont ajustés en fonction des prédictions de demande basés sur l’historique des applications.
Métriques temps réels - Tout voir et savoir d’une architecture et des logiciels.

Métriques temps réels

Tout voir et savoir d’une architecture et des logiciels.

Historisation des données - Adéquation entre les métriques, les logs, la supervision dans le temps.

Historisation des données

Adéquation entre les métriques, les logs, la supervision dans le temps.

Big Data / Machine Learning - Exploitation des données et détection de signaux faibles.

Big Data / Machine Learning

Exploitation des données et détection de signaux faibles.

DevOps talentueux - Équipe compétente qui préfère agir avant qu’après un incident.

DevOps talentueux

Équipe compétente qui préfère agir avant qu’après un incident.

Maintenance informatique évolutive

Le monde bouge, vos applications et services aussi, vos clients peuvent varier d’un jour à l’autre, une architecture informatique doit suivre vos besoins. Dans ce cadre, la maintenance évolutive permet d’ajuster en partie ou complètement une infrastructure existante.

Les infrastructures que nous déployons font en sorte de s’adapter la plupart du temps à chaud. Pour cela la façon dont sont installés les serveurs est primordiale. L’anticipation de ce type de demande est un atout fort pour la vie de vos services.

  • Permet l’ajout de fonctionnalité, les ajustements de services applicatifs, la refonte de la tenue à la charge d’une infrastructure SI.
  • La migration vers une nouvelle architecture sans coupure de service ou en minimisant au maximum le temps d’interruption si cela n’est pas possible sans coupure.
Anticiper les pannes et prévoir les évolutions nécessaires des infrastructures Cloud