Le temps moyen de bon fonctionnement ou MTBF (Mean Time Between Failures en anglais) est le d¨¦lai moyen entre deux d¨¦faillances r¨¦parables d¡¯un produit ou d¡¯un syst¨¨me. C¡¯est un indicateur essentiel pour d¨¦terminer la fr¨¦quence des d¨¦faillances du syst¨¨me et donner une id¨¦e de sa fiabilit¨¦.
Le MTBF permet aussi de d¨¦terminer l¡¯efficacit¨¦ de l¡¯¨¦quipe en termes de pr¨¦vention ou de r¨¦duction des incidents potentiels. Plus le temps moyen de bon fonctionnement est ¨¦lev¨¦, plus le syst¨¨me est fiable.
Que mesure le MTBF?? Fiabilit¨¦ ou disponibilit¨¦
Le MTBF participe ¨¤ la fois au suivi de la fiabilit¨¦ et de la disponibilit¨¦ d¡¯un composant ou d¡¯un syst¨¨me.
La fiabilit¨¦ est la probabilit¨¦ qu¡¯un syst¨¨me ou un composant fonctionne comme pr¨¦vu, sans d¨¦faillance, pendant une certaine dur¨¦e. Le MTBF est une mesure ¨¦l¨¦mentaire de la fiabilit¨¦ d¡¯un syst¨¨me. Un MTBF ¨¦lev¨¦ t¨¦moigne de la fiabilit¨¦ du produit. En associant le MTBF ¨¤ d¡¯autres indicateurs de d¨¦faillance et ¨¤ des strat¨¦gies de maintenance, on peut plus facilement pr¨¦voir les d¨¦faillances des actifs, puisque les ¨¦quipes peuvent savoir quand et comment mettre en ?uvre des mesures de pr¨¦vention, sans attendre la d¨¦faillance.
La disponibilit¨¦ est la capacit¨¦ d¡¯un syst¨¨me ou d¡¯un composant de fonctionner comme pr¨¦vu au moment o¨´ l¡¯on en a besoin. Associ¨¦ au temps moyen de r¨¦paration (MTTR), le MTBF permet de d¨¦terminer la probabilit¨¦ qu¡¯un syst¨¨me connaisse une d¨¦faillance dans un certain d¨¦lai. Pour calculer la disponibilit¨¦ d¡¯un syst¨¨me, on peut diviser le MTBF par la somme du MTTR et du MTBF.
Disponibilit¨¦ = MTBF / (MTBF + MTTR)
Comment calculer le MTBF?: Formule pas ¨¤ pas
Pour calculer le MTBF, on divise le temps de fonctionnement total sur une p¨¦riode donn¨¦e par le nombre de d¨¦faillances sur cette p¨¦riode. La m¨¦thode de calcul est la suivante?:
Pour d¨¦terminer le temps de fonctionnement total d¡¯un syst¨¨me, vous devez surveiller le syst¨¨me pendant une certaine dur¨¦e.
- Le temps de fonctionnement total est la dur¨¦e totale pendant laquelle le syst¨¨me a fonctionn¨¦ sans conna?tre de d¨¦faillance.
- Le nombre total de d¨¦faillances est le nombre de fois o¨´ le syst¨¨me s¡¯est arr¨ºt¨¦ pendant la p¨¦riode sp¨¦cifi¨¦e.
Par exemple, consid¨¦rons que sur une dur¨¦e de 24?heures, un syst¨¨me soit arr¨ºt¨¦ pendant trois?heures, r¨¦parties sur trois incidents diff¨¦rents.
- Disponibilit¨¦ totale = (24 - 3) = 21?heures
- Nombre total d¡¯incidents = 3
- MTBF = disponibilit¨¦ totale / nombre d¡¯incidents
- MTBF = 21/3 = 7?heures
Comment calculer le MTBF ¨¤ partir du taux de d¨¦faillance
Comme nous venons de le voir, le MTBF peut ¨ºtre calcul¨¦ en divisant la disponibilit¨¦ totale par le nombre de d¨¦faillances enregistr¨¦es. De son c?t¨¦, le taux de d¨¦faillance, qui est l¡¯inverse du MTBF, se calcule en divisant le nombre de d¨¦faillances par la disponibilit¨¦ totale.
Le MTBF peut ¨ºtre calcul¨¦ ¨¤ partir du taux de d¨¦faillance selon la formule suivante?: MTBF = 1 / taux de d¨¦faillance
Quelques exemples?:
- Taux de d¨¦faillance = 25?d¨¦faillances / 1?000?heures de disponibilit¨¦
- Taux de d¨¦faillance = 0,025
- MTBF = 1 / 0,025
- MTBF = 40
Qu¡¯est-ce qu¡¯un MTBF correct??
Comme le temps de bon fonctionnement d¡¯un syst¨¨me ou d¡¯un composant peut d¨¦pendre de diff¨¦rents facteurs, notamment la configuration, les conditions de fonctionnement, l¡¯?ge et d¡¯autres facteurs externes, il n¡¯existe pas d¡¯indicateur MTBF ??id¨¦al??. Le MTBF doit au contraire ¨ºtre sp¨¦cifique ¨¤ chacun vos actifs, et plus vous collecterez de donn¨¦es sur ces derniers, plus l¡¯indicateur sera pr¨¦cis.
Quel est le sens d¡¯un MTBF ¨¦lev¨¦??
Bien entendu, m¨ºme si le MTBF ¨¤ cibler n¡¯est pas le m¨ºme pour tout le monde, un MTBF ¨¦lev¨¦ est toujours pr¨¦f¨¦rable. Un MTBF ¨¦lev¨¦ montre que votre syst¨¨me ou composant est hautement fiable et qu¡¯il rencontrera moins de probl¨¨mes sur sa dur¨¦e de vie. Et une r¨¦duction des incidents se traduit g¨¦n¨¦ralement par des arr¨ºts moins fr¨¦quents et une baisse des co?ts.
Quel est le sens d¡¯un MTBF bas??
Un MTBF bas signifie que votre syst¨¨me risque de conna?tre des d¨¦faillances plus fr¨¦quentes, et que sa fiabilit¨¦ doit ¨ºtre reconsid¨¦r¨¦e. Un plan de maintenance pr¨¦ventive de qualit¨¦ et la mise en ?uvre d¡¯outils de surveillance du MTBF et d¡¯autres indicateurs de d¨¦faillance peuvent am¨¦liorer la fiabilit¨¦ du syst¨¨me.
Exemples de calcul du MTBF
Examinons ¨¤ pr¨¦sent quelques exemples de MTBF bas, moyen et ¨¦lev¨¦ pour un syst¨¨me de production fonctionnant sur une p¨¦riode de 30?jours.
MTBF bas
Disons que le syst¨¨me s¡¯arr¨ºte six fois en 30?jours (720?heures), pendant quatre heures ¨¤ chaque fois, soit un temps d¡¯interruption total de 24?heures.
- Disponibilit¨¦ totale = (720 - 24) = 696?heures
- Nombre total d¡¯incidents = 6
- MTBF = disponibilit¨¦ totale / nombre d¡¯incidents
- MTBF = 696 / 6 = 116?heures (pr¨¨s de 5?jours)
Une panne tous les cinq jours signifie un syst¨¨me extr¨ºmement peu fiable qui aura un impact fr¨¦quent sur les op¨¦rations de l¡¯entreprise et sur les clients.
MTBF moyen
Imaginons maintenant que le syst¨¨me ne s¡¯arr¨ºte que deux fois sur la m¨ºme p¨¦riode de 30?jours (720?heures), pendant deux heures ¨¤ chaque fois, soit une interruption totale de quatre heures.
- Disponibilit¨¦ totale = (720 - 4) = 716?heures
- Nombre total d¡¯incidents = 2
- MTBF = disponibilit¨¦ totale / nombre d¡¯incidents
- MTBF = 716 / 2 = 358?heures (pr¨¨s de 15?jours)
M¨ºme s¡¯il ne s¡¯agit pas d¡¯un MTBF extr¨ºmement ¨¦lev¨¦, une d¨¦faillance tous les quinze jours peut, dans certains cas, ¨ºtre acceptable.
MTBF ¨¦lev¨¦
Enfin, imaginons un syst¨¨me qui ne s¡¯arr¨ºte qu¡¯une fois pendant deux heures sur une p¨¦riode de 30?jours (720?heures).
- Disponibilit¨¦ totale = (720 - 2) = 718?heures
- Nombre total d¡¯incidents = 1
- MTBF = disponibilit¨¦ totale / nombre d¡¯incidents
- MTBF = 718 / 1 = 718?heures (pratiquement 30?jours)
Par rapport aux sc¨¦narios pr¨¦c¨¦dents, on peut consid¨¦rer qu¡¯une d¨¦faillance tous les 30?jours correspond ¨¤ un MTBF ¨¦lev¨¦, ce qui signifie que le syst¨¨me est hautement fiable.
Comment calculer le MTBF?: Trois sc¨¦narios
Le MTBF est un indicateur de fiabilit¨¦ utile dans diff¨¦rents domaines technologiques. Prenons des cas dans le domaine de la cybers¨¦curit¨¦, la r¨¦ponse aux incidents et les DevOps.
Calcul du MTBF pour la cybers¨¦curit¨¦
Dans le domaine de la cybers¨¦curit¨¦, le MTBF peut indiquer que le syst¨¨me est en fin de vie et que le risque d¡¯une panne critique augmente.
Imaginons par exemple qu¡¯un syst¨¨me de cybers¨¦curit¨¦ soit observ¨¦ sur une p¨¦riode de 48?heures. Sur ce laps de temps, le syst¨¨me s¡¯arr¨ºte 5?fois pour un total de huit heures, soit un temps de fonctionnement de 40?heures.
MTBF = 40 / 5 = 8?heures
Le mois suivant, on observe ¨¤ nouveau le syst¨¨me pendant 48?heures. Cette fois, le syst¨¨me s¡¯arr¨ºte 8?fois pour un total de 12 heures, soit un temps de fonctionnement de 36?heures. Le MTBF du syst¨¨me est maintenant de 4,5?heures.
MTBF = 36 / 8 = 4,5?heures
Si le MTBF continue de baisser lors des observations suivantes, cela peut signifier qu¡¯une partie du syst¨¨me ou le syst¨¨me entier doit ¨ºtre remplac¨¦ ou renforc¨¦.
Calcul du MTBF dans le domaine de la r¨¦ponse aux incidents
Le MTBF permet ¨¦galement de d¨¦terminer le niveau d¡¯efficacit¨¦ de votre ¨¦quipe de r¨¦ponse aux incidents en mati¨¨re de r¨¦duction et de pr¨¦vention des incidents. Si le MTBF est trop bas ou qu¡¯il a tendance ¨¤ baisser, l¡¯¨¦quipe doit analyser les donn¨¦es d¡¯incident pour identifier les pannes r¨¦currentes et les tendances inqui¨¦tantes.
Calcul du MTBF dans le domaine des DevOps
Dans le domaine des DevOps, le MTBF mesure la fr¨¦quence des d¨¦faillances d¡¯une fonctionnalit¨¦ ou d¡¯un composant unique, ce qui permet aux ¨¦quipes de pr¨¦voir les niveaux de fiabilit¨¦ et de disponibilit¨¦ d¡¯un service. Il permet ainsi de mettre en lumi¨¨re les faiblesses au niveau de la conception d¡¯un composant ou du protocole de test et de maintenance.
En surveillant le MTBF, les ¨¦quipes DevOps peuvent identifier les probl¨¨mes d¡¯efficacit¨¦ et les goulets d¡¯¨¦tranglement susceptibles d¡¯entra?ner une d¨¦faillance, et les ¨¦liminer en am¨¦liorant les processus et l¡¯infrastructure syst¨¨me. ? mesure que des am¨¦liorations sont apport¨¦es, le MTBF augmente, ce qui signifie que le syst¨¨me est plus fiable.
Imaginons par exemple que la dur¨¦e totale de travail consacr¨¦ ¨¤ un pipeline d¡¯int¨¦gration de code soit de 100?heures sur 5?jours. Au cours de la semaine, quatre d¨¦faillances se produisent.
- Temps total de fonctionnement = 100?heures
- Nombre total de d¨¦faillances = 4
- MTBF = dur¨¦e totale de fonctionnement / nombre de d¨¦faillances
- MTBF = 100 / 4 = 25?heures
Quels outils sont n¨¦cessaires pour surveiller le MTBF??
Avec les bons outils, vous pouvez renforcer le MTBF et les autres indicateurs de maintenance. Ces outils sont, entre autres, les outils de surveillance de l¡¯infrastructure, de surveillance des services, de visualisation, de surveillance des performances des applications, ou encore des outils multiplateforme, des outils d¡¯agr¨¦gation des donn¨¦es et des outils de gestion de projet.
Mais tous ces outils n¨¦cessitent un stockage ultraperformant, capable de traiter d¡¯¨¦normes volumes de donn¨¦es tout en assurant une performance optimale. Avec É«¿Ø´«Ã½? FlashBlade?, vous pouvez cr¨¦er une solution de stockage haute performance solide pour les outils avanc¨¦s de surveillance et d¡¯observation qui vous sont n¨¦cessaires pour renforcer vos MTBF.
Quel indicateur utiliser apr¨¨s le MTBF??
Le MTBF et le temps moyen de fonctionnement jusqu¡¯¨¤ la panne (MTTF) sont deux indicateurs temporels qui permettent d¡¯¨¦valuer la performance d¡¯un syst¨¨me ou d¡¯un actif, mais ils sont appliqu¨¦s diff¨¦remment.
En savoir plus sur le MTTF.