É«¿Ø´«Ã½

Skip to Content

Was ist die Mean Time to Restore (MTTR)?

Die mittlere Wiederherstellungszeit (manchmal auch ?durchschnittliche Wiederherstellungszeit¡°) oder MTTR (Mean Time to Restore) beschreibt die durchschnittlich ben?tigte Zeit bis zur Wiederherstellung nach einer fehlgeschlagenen Bereitstellung, einem Vorfall oder einem Service-Ausfall. Gemessen wird die Zeit von der Erkennung eines Zwischenfalls oder Ausfalls bis zur Wiederherstellung der vollen Systemfunktionalit?t.

MTTR ist eine ¨¹bergeordnete Kennzahl, mit der Sie die Schnelligkeit Ihres Wiederherstellungsprozesses messen k?nnen und die angibt, wie schnell Ihr System nach einem Ausfall wiederhergestellt werden kann. Im Allgemeinen bezieht sich MTTR eher auf ungeplante Vorf?lle als auf Serviceanfragen.

Mean Time to Restore versus Mean Time to Resolve: Worin besteht der Unterschied?

Die mittlere Wiederherstellungszeit (Mean Time to Restore) bezieht sich auf die durchschnittliche Zeit, die ben?tigt wird, um Daten nach einem Produkt- oder Service-Ausfall wiederherzustellen, beinhaltet jedoch nicht die zus?tzliche Zeit, die ben?tigt wird, um sicherzustellen, dass sich der Vorfall nicht wiederholt.

Die mittlere Behebungszeit (Mean Time to Resolve) hingegen ist die durchschnittliche Zeit, die f¨¹r die vollst?ndige Wiederherstellung eines Systems ben?tigt wird, einschlie?lich der Zeit f¨¹r die Behebung des Problems und die Durchf¨¹hrung zus?tzlicher Arbeiten, die erforderlich sind, um zu verhindern, dass das Problem erneut auftritt. Dies kann die Erkennung von Fehlern, die Diagnose, die Wiederherstellung und proaktive Ma?nahmen umfassen, die ergriffen werden, um das System in Zukunft vor ?hnlichen Fehlern zu sch¨¹tzen.

Die mittlere Behebungszeit gibt Aufschluss ¨¹ber den gesamten f¨¹r die Problembehebung ben?tigten Zeitaufwand, der ¨¹ber die eigentliche Ausfallzeit hinausgeht, und erweitert die Zust?ndigkeit des Teams ¨¹ber das Beheben des Problems hinaus auf das Verbessern der langfristigen Performance des Systems.

Mean Time to Restore berechnen

Die mittlere Wiederherstellungszeit wird berechnet, indem die gesamte Ausfallzeit ¨¹ber einen bestimmten Zeitraum addiert und durch die Gesamtzahl der Vorf?lle innerhalb dieses Zeitraums geteilt wird.

MTTR = Summe aller f¨¹r das L?sen von Problemen ben?tigten Zeitr?ume geteilt durch Anzahl der Vorf?lle

Stellen Sie sich zum Beispiel vor, dass Ihr System innerhalb von zwei Wochen dreimal ausf?llt. Wenn die Wiederherstellung f¨¹r den ersten Vorfall zwei Stunden, f¨¹r den zweiten vier Stunden und f¨¹r den dritten sechs Stunden gedauert hat, also insgesamt 12 Stunden, betr?gt die MTTR f¨¹r diesen Zeitraum von zwei Wochen:

MTTR = 12 Stunden Ausfallzeit insgesamt geteilt durch 3 Vorf?lle

MTTR = 4 Stunden

Was ist eine gute mittlere Wiederherstellungszeit?

Systemausf?lle und Ausfallzeiten wirken sich stark auf die Kundenerfahrung aus. Daher ist es wichtig, dass die MTTR so kurz wie m?glich ist. Eine h?here MTTR bedeutet, dass die Organisation und ihre Kunden mit gr??erer Wahrscheinlichkeit erhebliche und h?ufige Ausfallzeiten erleben werden, was zu Beschwerden, K¨¹ndigungen und Nichtverl?ngerungen f¨¹hren kann.

Eine gute MTTR h?ngt direkt damit zusammen, wie schnell Sie die Ursache eines Problems erkennen und identifizieren k?nnen (mittlere Erkennungszeit, Mean Time to Detect oder MTTD). Je l?nger es dauert, ein Problem zu erkennen, desto l?nger dauert es auch, das System wieder voll funktionsf?hig zu machen.

Eine niedrige MTTD ist der Schl¨¹ssel zur Verringerung der MTTR und zur Verbesserung anderer Zuverl?ssigkeitskennzahlen. Wenn Sie die f¨¹r die Erkennung eines Problems ben?tigte Zeit verk¨¹rzen, verk¨¹rzt sich auch die Zeit bis zur L?sung des Problems. Beobachtbarkeit und kontinuierliche ?berwachung spielen eine wichtige Rolle, wenn es darum geht, Teams auf Probleme aufmerksam zu machen und die MTTD schnell zu reduzieren.

Neben der ?berwachung gibt es noch einige andere M?glichkeiten, die MTTR zu verringern:

  • Entwickeln Sie einen klar dokumentierten Plan f¨¹r das Vorfallsmanagement, damit Teams wissen, wie ein Vorfall zu bew?ltigen ist, vom ersten Alarm bis zu dem Zeitpunkt, an dem das System den vollen Betrieb wieder aufnimmt.
  • Verwenden Sie automatisierte Tools, um Aufgaben zuzuweisen, Dokumente zu erstellen, Analysen zu erfassen und Konfigurationen zu verwalten.
  • Legen Sie die Rollen und Zust?ndigkeiten im Team klar fest und weisen Sie sie zu, damit jedes Teammitglied wei?, was es im Falle eines Zwischenfalls zu tun hat.
  • F¨¹hren Sie nachtr?gliche Analysen zu vergangenen Vorf?llen durch, um die Einzelheiten jedes Problems zu untersuchen und zu dokumentieren, wie es zustande kam und wie man es in Zukunft verhindern kann.

Mean Time to Resolve berechnen

Die mittlere Behebungszeit (MTTR) unterscheidet sich von der mittleren Wiederherstellungszeit, da sie die zus?tzliche Zeit einschlie?t, die daf¨¹r aufgewendet wird, ?hnliche Probleme in Zukunft zu vermeiden.

Zur Berechnung der MTTR addieren Sie die Gesamtzeit, die f¨¹r die Wiederherstellung des Systems ben?tigt wird, einschlie?lich der zus?tzlichen Zeit, um sicherzustellen, dass das Problem nicht erneut auftritt, und teilen diese Zahl durch die Gesamtzahl der Vorf?lle. Stellen Sie sich das so vor:

MTTR = Gesamtzeit f¨¹r die Wiederherstellung nach einem Vorfall + zus?tzliche Zeit, um sicherzustellen, dass das Problem nicht wieder auftritt / Anzahl der Vorf?lle

Stellen Sie sich vor, dass Ihr System innerhalb von 48 Stunden zweimal ausf?llt. Der erste Vorfall dauert eine Stunde, der zweite zwei Stunden. Dann verbringt das Team weitere drei Stunden damit, Systeme zu sichern, um zu verhindern, dass sich die Probleme wiederholen, was insgesamt sechs Stunden macht.

MTTR = (1 + 2 + 3) Stunden / 2 Vorf?lle

MTTR = 3 Stunden

Was ist eine gute mittlere Behebungszeit?

Da durch eine Verringerung der MTTD die mittlere Zeit bis zur Wiederherstellung verk¨¹rzt wird, wirken sich dieselben Ma?nahmen auch auf die Zeit bis zur vollst?ndigen Behebung (mittlere Behebungszeit) aus.

Der Schwerpunkt kann auch darauf gelegt werden, zu verbessern, wie schnell das Team vorbeugende Ma?nahmen umsetzen kann. Die nachtr?gliche Analyse aus dem MTTR-Prozess zum Beispiel wird hier besonders hilfreich sein, da eine gr¨¹ndliche Analyse des Problems hilfreiche Erkenntnisse liefern kann, die f¨¹r Folgema?nahmen genutzt werden k?nnen.

Wer sollte die MTTR verwenden und wann?

Insgesamt ist die MTTR eine gute Kennzahl f¨¹r das Bewerten der Geschwindigkeit Ihres Wiederherstellungsprozesses in verschiedenen Technologiebereichen. Sie sollten die MTTR verwenden, wenn Sie die durchschnittliche Zeit verbessern m?chten, die Ihr Team f¨¹r die Reparatur von Anlagen ben?tigt.

Verwendung der MTTR in der Cybersicherheit

Die MTTR bezieht sich im Bereich der Cybersicherheit auf die Zeit, die das Team ben?tigt, um das System nach einem Cybersicherheitsversto? wieder zum Laufen zu bringen. Auf diese Weise zeigt sich, wie schnell Ihr Sicherheitsteam das System und die betroffenen Kunden wieder zum normalen Betrieb zur¨¹ckbringen kann.

Bei Cybersicherheitsteams beginnt die MTTR-Uhr in der Regel zu ticken, wenn das Team auf einen Systemausfall aufgrund eines Cyberangriffs aufmerksam gemacht wird.

In diesem Fall kann der Wiederherstellungsprozess mehrere Schritte umfassen, darunter die Eind?mmung (um die Ausbreitung der Bedrohung zu stoppen), die tats?chliche Beseitigung der Bedrohung und die Bereinigung von Komponenten und Ressourcen, die f¨¹r die Wiederherstellung des Systems erforderlich sind. Wenn alle Schritte abgeschlossen sind, gilt das System als vollst?ndig wiederhergestellt.

Einsatz der MTTR bei der Reaktion auf einen Vorfall

Die MTTR ist eine wichtige Kennzahl bei der Reaktion auf Vorf?lle, da sie Aufschluss ¨¹ber die Schwere der Auswirkungen gibt und Organisationen dabei hilft, zu beurteilen, ob Vorf?lle mit Ausfallzeiten schnell genug behoben werden.

Bei der Reaktion auf Vorf?lle ist MTTR die durchschnittliche Zeit, die zwischen der Meldung und dem Zeitstempel der L?sung eines Problems verstreicht. Automatisierte Tools machen die Teams nicht nur auf Vorf?lle aufmerksam, sondern erleichtern ihnen auch die Zusammenarbeit und Kommunikation, was in einer verbesserten MTTR resultiert.

Service Level Objectives (SLO) und Service Level Indicators (SLI) k?nnen auch zur Messung der Systemzuverl?ssigkeit und -verf¨¹gbarkeit und der ungef?hren Kundenzufriedenheit mit einem Produkt oder einem Service verwendet werden. Wenn gegen ein SLO versto?en wird, ist die mittlere Zeit zur Wiederherstellung der Services die Gesamtzeit zur Erkennung, Eingrenzung und Behebung des Problems, bis das SLO wieder erf¨¹llt ist.

Einsatz von MTTR in DevOps

Bei DevOps kann MTTR die durchschnittliche Zeit darstellen, die zur Wiederherstellung einer Anwendung nach einem Produktionsausfall ben?tigt wird. Die Messung der MTTR hilft Teams dabei, die Ausfallsicherheit und Stabilit?t eines Systems sicherzustellen und festzustellen, wo der Reaktionsprozess verbessert werden kann.

Bei DevOps werden zur Messung der MTTR h?ufig ?berwachungssysteme eingesetzt, um den Beginn eines Vorfalls und den Zeitpunkt seiner Behebung aufzuzeichnen (z.?B. die Zeit, die f¨¹r das Rollback von ?nderungen oder Releases ben?tigt wird, nachdem sie die Produktion erreicht haben).

Mit der MTTR kann auch die Performance des DevOps-Teams bewertet werden. Je niedriger die MTTR eines DevOps-Teams ist, desto besser. Im Bericht werden vier Performance-Kategorien f¨¹r DevOps-Teams identifiziert:

  • Elite: Weniger als eine Stunde
  • Hoch: Weniger als 24 Stunden
  • Mittel: Weniger als eine Woche
  • Niedrig: Bis zu einer Woche

Eine schnellere MTTR bewirkt geringere Ausfallraten, eine schnellere Bereitstellung und eine h?here Benutzerzufriedenheit. Mit zunehmender DevOps-Reife sollte die MTTR immer niedriger werden.

Welche Tools ben?tigen Sie, um MTTRs zu ¨¹berwachen?

Um die MTTR zu verbessern, m¨¹ssen Sie in der Lage sein, Systemausf?lle schnell zu erkennen. Tools zur kontinuierlichen ?berwachung, wie Prometheus und Grafana, sowie g?ngige Tools zur ?berwachung der Anwendungs-Performance, wie Datadog, Splunk und Dynatrace, k?nnen Ihnen bei der Erfassung von MTTR-Kennzahlen helfen.

Diese Systeme nutzen eine gro?e Menge an Echtzeit- und historischen Daten, um Ihnen zu helfen, Probleme schneller zu diagnostizieren und zu analysieren. Um deren komplexe Abfragen und Echtzeitverarbeitung zu unterst¨¹tzen, ben?tigen Sie jedoch die ultraschnellen Performance-Geschwindigkeiten, die All-Flash-Storage bieten kann.

É«¿Ø´«Ã½ bietet mehrere All-Flash-Daten-Storage-L?sungen an, die enormen Durchsatz und konstante Performance bieten. FlashBlade? ist eine hochleistungsf?hige Datei- und Objekt-Storage-Plattform, die die erforderliche Geschwindigkeit und Performance f¨¹r die Anwendungs- und ?berwachungstools bietet, die eine schnellere MTTD und MTTR erm?glichen.

Was ist die n?chste Kennzahl nach der MTTR?

Die MTTR ist zwar ein aussagekr?ftiger Indikator f¨¹r Ihre F?higkeit, schnell auf Probleme zu reagieren, aber es gibt noch andere wichtige Zuverl?ssigkeitskennzahlen, die Sie ebenfalls ¨¹berwachen sollten. Erfahren Sie mehr ¨¹ber eine weitere kritische Kalkulation: die mittlere Betriebsdauer zwischen Ausf?llen (Mean Time Between Failures, MTBF).

04/2025
Efficient, Simple Data Solutions for State and Local Governments
É«¿Ø´«Ã½ partners with state and local governments to transform data into powerful outcomes whether deploying traditional workloads, modern applications, containers, or more.
L?sungsprofil
4 pages

Wichtige Ressourcen und Veranstaltungen durchsuchen

THOUGHT LEADERSHIP
Der Innovationswettlauf

Branchenf¨¹hrer, die an vorderster Front der Storage-Innovationen stehen, geben Einblicke und Ausblicke.

Mehr erfahren
ANALYSTENBERICHT
Planen Sie Ihre cyberresiliente Zukunft

Entdecken Sie Strategien zur Zusammenarbeit, um Investitionen in Cybersicherheit optimal zu nutzen und eine schnelle Reaktionsf?higkeit sowie Wiederherstellung sicherzustellen.

Bericht lesen
QUELLE
Die Zukunft des Storage: Neue Prinzipien f¨¹r das KI-Zeitalter

Erfahren Sie, wie neue Herausforderungen wie KI die Anforderungen an den Daten-Storage ver?ndern und ein neues Denken sowie einen modernen Ansatz f¨¹r den Erfolg erforderlich machen.

E-Book herunterladen
QUELLE
Kaufen Sie keinen Storage mehr, sondern setzen Sie stattdessen auf Plattformen.

Untersuchen Sie die Anforderungen, die Komponenten und den Auswahlprozess f¨¹r Storage-Plattformen in Unternehmen.

Bericht lesen
KONTAKTIEREN SIE UNS
Fragen, Kommentare?

Haben Sie eine Frage oder einen Kommentar zu Produkten oder Zertifizierungen von Pure?? Wir helfen Ihnen gerne!

Termin f¨¹r Demo vereinbaren

Vereinbaren Sie einen Termin f¨¹r eine Live-Demo und sehen Sie selbst, wie Pure Ihnen helfen kann, Ihre Daten in ¨¹berzeugende Ergebnisse zu verwandeln.?

Rufen Sie uns an:?+49 89 26200662
Presse:
?pr@purestorage.com

?

É«¿Ø´«Ã½ Germany GmbH

Mies-van-der-Rohe-Stra?e 6

80807 M¨¹nchen

Deutschland

info@purestorage.com

SCHLIESSEN
Ihr Browser wird nicht mehr unterst¨¹tzt!

?ltere Browser stellen h?ufig ein Sicherheitsrisiko dar. Um die bestm?gliche Erfahrung bei der Nutzung unserer Website zu erm?glichen, f¨¹hren Sie bitte ein Update auf einen dieser aktuellen Browser durch.