É«¿Ø´«Ã½

Skip to Content

?Qu¨¦ es el tiempo medio de restauraci¨®n (MTTR)?

El tiempo medio de restauraci¨®n (a veces llamado tiempo medio de recuperaci¨®n), o MTTR, describe el tiempo medio necesario para recuperarse de una implementaci¨®n que haya dado error, de un incidente o de una interrupci¨®n del servicio. Mide el tiempo que pasa desde la detecci¨®n de un incidente o una interrupci¨®n hasta que se restaura la plena funcionalidad del sistema.

El MTTR es una m¨¦trica de alto nivel que le ayuda a medir la velocidad de su proceso de recuperaci¨®n y que le indica lo r¨¢pido que su sistema puede recuperarse de un fallo. En t¨¦rminos generales, el MTTR suele referirse a los incidentes imprevistos y no a las solicitudes de servicio.

Tiempo medio de restauraci¨®n y tiempo medio de resoluci¨®n: ?cu¨¢l es la diferencia?

El tiempo medio de restauraci¨®n se refiere al tiempo medio que se tarda en recuperarse de un fallo en un producto o servicio, pero no incluye el tiempo adicional necesario para garantizar que el incidente no se vuelva a producir.

El tiempo medio de resoluci¨®n, por su parte, es el tiempo medio necesario para restaurar un sistema por completo, incluido el tiempo para solucionar el problema y para completar cualquier trabajo adicional que haya que realizar para evitar que dicho problema vuelva a producirse. Esto puede incluir la detecci¨®n del fallo, el diagn¨®stico, la restauraci¨®n y las medidas proactivas que se tomen para hacer que el sistema sea m¨¢s resistente a fallos similares en el futuro.

Debido a ello, el tiempo medio de resoluci¨®n proporciona informaci¨®n sobre el tiempo total necesario para resolver el problema, m¨¢s all¨¢ de la propia interrupci¨®n, y ampl¨ªa la responsabilidad del equipo, que pasa de la simple soluci¨®n del problema a incluir tambi¨¦n la mejora del rendimiento a largo plazo del sistema.

C¨®mo calcular el tiempo medio de restauraci¨®n

El tiempo medio de restauraci¨®n se calcula sumando el tiempo de inactividad total en un periodo espec¨ªfico y dividi¨¦ndolo por el n¨²mero total de incidentes dentro de dicho periodo.

MTTR = suma de todos los periodos de tiempo de resoluci¨®n / n¨²mero de incidentes

Por ejemplo, imagine que su sistema se desactiva tres veces en dos semanas. Si el primer incidente ha tardado dos horas en restaurarse, el segundo ha tardado cuatro horas y el tercero ha tardado 6 horas, lo que da un total de 12 horas, el MTTR para ese periodo de dos semanas ser¨¢:

MTTR = 12 horas de tiempo de inactividad total / 3 incidentes

MTTR = 4 horas

?Qu¨¦ es un buen tiempo medio de restauraci¨®n?

Las interrupciones y los tiempos de inactividad del sistema afectan gravemente a la experiencia del cliente, as¨ª que es importante que el MTTR sea lo m¨¢s corto posible. Un MTTR m¨¢s alto significa que es m¨¢s probable que la organizaci¨®n y sus clientes sufran periodos de inactividad importantes y frecuentes, lo que puede generar quejas, cancelaciones y no renovaciones.

Un buen MTTR est¨¢ relacionado directamente con la rapidez para detectar e identificar la causa subyacente de un problema (el tiempo medio de detecci¨®n o MTTD). Cuanto m¨¢s tarde en identificar un problema, m¨¢s tiempo le costar¨¢ restaurar el sistema para que est¨¦ plenamente operativo.

Un MTTD bajo es la clave para reducir el MTTR y mejorar otras m¨¦tricas de fiabilidad. Si reduce el tiempo necesario para detectar un problema, tambi¨¦n disminuye el tiempo que transcurre hasta su resoluci¨®n. La observabilidad y la supervisi¨®n continua desempe?an un papel importante para avisar a los equipos de los problemas y reducir r¨¢pidamente el MTTD.

Aparte de la supervisi¨®n, aqu¨ª tiene otras maneras de reducir el MTTR:

  • Desarrollar un plan de gesti¨®n de los incidentes claramente documentado, que permita que los equipos sepan c¨®mo gestionar un incidente, desde la primera alerta hasta el momento en que el sistema recupera su pleno funcionamiento.
  • Usar herramientas automatizadas para asignar responsabilidades, crear documentos, capturar anal¨ªticas y administrar las configuraciones.
  • Definir y asignar claramente las funciones y las responsabilidades del equipo, para que todo el mundo sepa qu¨¦ hacer cuando se produzca un incidente.
  • Realizar ex¨¢menes posteriores de los incidentes pasados para investigar y documentar los detalles de cada problema, el modo en que se ha producido y c¨®mo se puede evitar en el futuro.

C¨®mo calcular el tiempo medio de resoluci¨®n

El tiempo medio de resoluci¨®n (MTTR) difiere del tiempo medio de restauraci¨®n porque incluye cualquier tiempo adicional dedicado a evitar que en el futuro se produzcan otros problemas similares.

Para calcular el MTTR, hay que sumar todo el tiempo que se ha tardado en restaurar el sistema, incluyendo el tiempo adicional necesario para garantizar que el problema no vuelva a producirse, y dividir dicha cifra entre el n¨²mero total de incidentes. La f¨®rmula es la siguiente:

MTTR = tiempo total de restauraci¨®n del incidente + tiempo adicional dedicado a garantizar que el problema no vuelva a producirse / n¨²mero de incidentes

Imagine que su sistema se desactiva dos veces en un periodo de 48 horas. El primer incidente dura una hora y el segundo dos horas. Luego, el equipo dedica tres horas m¨¢s a reforzar los sistemas para evitar que los problemas vuelvan a producirse, lo que da un total de seis horas.

MTTR = (1 + 2 + 3) horas / 2 incidentes

MTTR = 3 horas

?Qu¨¦ es un buen tiempo medio de resoluci¨®n?

Como la disminuci¨®n del MTTD reduce el tiempo medio de restauraci¨®n, las mismas acciones tambi¨¦n afectar¨¢n al tiempo necesario para completar la resoluci¨®n (el tiempo medio de resoluci¨®n).

Tambi¨¦n es posible centrarse en mejorar la rapidez de implementaci¨®n de las medidas preventivas por parte del equipo. El examen posterior del proceso del tiempo medio de restauraci¨®n, por ejemplo, ser¨¢ especialmente ¨²til en este caso, ya que un an¨¢lisis en profundidad del problema puede proporcionar informaci¨®n importante que puede aplicarse a las actividades de seguimiento.

?Qui¨¦n deber¨ªa usar el MTTR y cu¨¢ndo?

En general, el MTTR es una buena m¨¦trica para evaluar la velocidad de su proceso de recuperaci¨®n en varios ¨¢mbitos tecnol¨®gicos. Deber¨ªa usar el MTTR cuando quiera mejorar el tiempo medio que su equipo tarda en reparar los recursos.

C¨®mo usar el MTTR en la ciberseguridad

El MTTR en la ciberseguridad se refiere al tiempo que un equipo tarda en lograr que un sistema est¨¦ de nuevo activo y en funcionamiento despu¨¦s de una vulneraci¨®n de la ciberseguridad. Es decir, le indica la rapidez con que su equipo de seguridad puede hacer que el sistema y los clientes afectados est¨¦n de nuevo operando normalmente.

Para los equipos de ciberseguridad, el reloj del MTTR suele ponerse en marcha cuando el equipo recibe el aviso de que se ha producido un fallo en el sistema debido a un ciberataque.

En este caso, el proceso de restauraci¨®n puede comprender varios pasos, incluidos la contenci¨®n (para detener la expansi¨®n de la amenaza), la eliminaci¨®n efectiva de la amenaza y el saneamiento de los componentes y recursos necesarios para devolver el sistema a su estado normal. Una vez completados todos los pasos, se considera que el sistema est¨¢ totalmente restaurado.

C¨®mo usar el MTTR en la respuesta a incidentes

El MTTR es una m¨¦trica clave para la respuesta a los incidentes, porque proporciona informaci¨®n sobre la gravedad del impacto y ayuda a las organizaciones a evaluar si los incidentes que causan un tiempo de inactividad se resuelven lo bastante deprisa.

En la respuesta a los incidentes, el MTTR es un promedio del tiempo que transcurre entre la hora de registro del aviso y la de resoluci¨®n del problema. Las herramientas automatizadas no solo avisan a los equipos de los incidentes, sino que tambi¨¦n les ayudan a colaborar y a comunicarse m¨¢s f¨¢cilmente, lo que permite una mejora del MTTR.

Los objetivos de nivel de servicio (SLO por sus siglas en ingl¨¦s) y los indicadores de nivel de servicio (SLI por sus siglas en ingl¨¦s) tambi¨¦n pueden utilizarse para medir la fiabilidad y la disponibilidad de un sistema y la satisfacci¨®n aproximada del cliente con un producto o servicio. Cuando se infringe un SLO, el tiempo medio de restauraci¨®n de los servicios es el tiempo total necesario para detectar, mitigar y resolver el problema hasta que se cumple de nuevo el SLO.

C¨®mo usar el MTTR en el DevOps

En el DevOps, el MTTR puede representar el tiempo medio necesario para restaurar una aplicaci¨®n tras un fallo de producci¨®n. La medici¨®n del MTTR ayuda a los equipos a garantizar que el sistema es resiliente y estable y adem¨¢s permite determinar d¨®nde puede mejorarse el proceso de respuesta.

En el DevOps, para medir el MTTR, con frecuencia hay que usar sistemas de monitorizaci¨®n para registrar el inicio de un incidente y el momento de su resoluci¨®n (por ejemplo, la hora de reversi¨®n de un cambio o de lanzamiento una vez que ha llegado a producci¨®n).

El MTTR tambi¨¦n puede evaluar el rendimiento del equipo de DevOps. Cuanto menor sea el MTTR de un equipo de DevOps, mejor ser¨¢ el equipo. El informe identifica cuatro categor¨ªas de rendimiento para los equipos de DevOps:

  • ?lite: menos de una hora
  • Alto: menos de 24 horas
  • Medio: menos de una semana
  • Bajo: m¨¢s de o igual a una semana

Un MTTR m¨¢s r¨¢pido supone un menor ¨ªndice de fallos, unos plazos de entrega m¨¢s r¨¢pidos y una mejora de la satisfacci¨®n del usuario. A medida que aumenta el nivel de madurez del DevOps, el MTTR tiene que ir cayendo.

?Qu¨¦ herramientas necesita para supervisar los MTTR?

Para mejorar el MTTR tiene que ser capaz de detectar los fallos del sistema r¨¢pidamente. Las herramientas de supervisi¨®n continua, como Prometheus y Grafana, as¨ª como las herramientas populares de monitorizaci¨®n del rendimiento de las aplicaciones, como Datalog, Splunk y Dynatrace, pueden ayudarle a recopilar las m¨¦tricas del MTTR.

Estos sistemas utilizan una gran cantidad de datos en tiempo real e hist¨®ricos, para ayudarle a diagnosticar y analizar los problemas m¨¢s r¨¢pidamente. Sin embargo, para soportar sus consultas complejas y su procesamiento en tiempo real, necesitar¨¢ unas velocidades de rendimiento ultrarr¨¢pidas, que solo el almacenamiento totalmente flash puede proporcionar.

É«¿Ø´«Ã½ le ofrece varias soluciones de almacenamiento de datos totalmente flash que proporcionan un caudal enorme y un rendimiento constante y adecuado. FlashBlade? es una plataforma de almacenamiento de archivos y objetos de alto rendimiento, que proporciona la velocidad y el rendimiento que necesitan las herramientas de las aplicaciones y de supervisi¨®n que le permitir¨¢n lograr un MTTD y un MTTR m¨¢s r¨¢pidos.

?Cu¨¢l es la m¨¦trica siguiente despu¨¦s del MTTR?

El MTTR es un indicador potente de su capacidad para reaccionar a los problemas con rapidez, pero existen otras m¨¦tricas importantes de la fiabilidad que tambi¨¦n deber¨ªa controlar. Obtenga m¨¢s informaci¨®n sobre otro c¨¢lculo cr¨ªtico: el tiempo medio para un fallo (MTBF).

10/2025
Simplified Fleet-wide Cyber Resilience | Veeam
Discover how É«¿Ø´«Ã½ and Veeam deliver a comprehensive unified cyber resilience solution fleet-wide.
Resumen de la soluci¨®n
3 pages

Explore los recursos y eventos clave

V?DEO
Ver: El valor de Enterprise Data Cloud.

Charlie Giancarlo explica por qu¨¦ la gesti¨®n de los datos ¡ªy no del almacenamiento¡ª es el futuro. Descubra c¨®mo un enfoque unificado transforma las operaciones de TI de la empresa.

Ver ahora
RECURSO
El almacenamiento tradicional no puede impulsar el futuro.

Las cargas de trabajo modernas exigen velocidad, seguridad y escala preparadas para la IA. ?Su stack est¨¢ listo?

Realice la evaluaci¨®n
DEMOS DE PURE360
Explore, aprenda y experimente É«¿Ø´«Ã½.

Acceda a v¨ªdeos y demostraciones bajo demanda para ver lo que É«¿Ø´«Ã½ puede hacer.

Ver las Demos
LIDERAZGO INTELECTUAL
La carrera por la innovaci¨®n

Las ¨²ltimas ideas y puntos de vista de los l¨ªderes del sector que est¨¢n a la vanguardia de la innovaci¨®n en almacenamiento.

M¨¢s informaci¨®n
Your Browser Is No Longer Supported!

Older browsers often represent security risks. In order to deliver the best possible experience when using our site, please update to any of these latest browsers.