Los humanos estamos programados para acumular más cosas: dinero, bienes físicos, amigos, etc.
Muchas personas se centran en la cantidad de cosas que poseen y en las relaciones que entablan frente a la calidad, pero más no siempre es mejor. Este principio también se aplica a la supervisión informática.
La supervisión no es un juego de quién tiene más puntos: quién puede supervisar más, quién puede cuantificar más alertas.
Más bien, los equipos de TI de éxito se centran en la calidad de las métricas. Si alguien dice que su solución tiene más de 600 métricas que pueden supervisar una aplicación o componente en particular, ¿qué significa eso en realidad? ¿Cuántas de esas métricas son relevantes y, francamente, a quién le importan? ¿A un administrador de TI realmente le importa ver el total de segundos de CPU utilizados por un servidor desde la última vez que se reinició? Probablemente no, pero sí le importaría un índice, como el número de milisegundos de CPU utilizados en el último minuto o un porcentaje.
Hay muchas soluciones de monitorización que recopilan, grafican, proporcionan alertas e informan de métricas sin sentido que no ofrecen valor, sólo por el hecho de añadir más métricas a la lista de beneficios. ¿No preferiría ver un producto que rastrea e informa sólo las métricas que proporcionan datos cruciales a los administradores de TI, gerentes y el negocio, que tener una solución con una miríada de métricas que usted tiene que vadear a través para encontrar el valor (si existe)? Lo que importa es comprender por qué una métrica es importante y saber qué acción debe llevarse a cabo si la métrica supera un determinado umbral. Sin este propósito, no tiene sentido recopilar o informar sobre las métricas.
Las métricas pueden parecer básicas para un experto en la materia, pero en muchos casos un miembro del personal de operaciones de TI de nivel 1 o 2 puede ser la primera persona que vea una alerta. Si comprende los detalles de la métrica y las posibles acciones a tomar para abordar la causa subyacente, acelerará su evaluación y ayudará a determinar la necesidad de escalar un descubrimiento. Por ejemplo, saber si la utilización de la CPU de una máquina virtual (VM) es alta es importante y procesable en muchos casos, pero ir un paso más allá e identificar las 10 principales VM en función de la utilización de la CPU es aún más valioso y potente.
Hemos lanzado un paquete de gestión de SCOM (MP) para Nutanix que proporciona una vista de panel de control.
En esta vista, puede seleccionar un clúster y se le mostrarán las principales máquinas virtuales por utilización de CPU, latencia de E/S, memoria y una variedad de otras métricas. MP dispone de paneles adicionales con una visibilidad similar, que permiten a los usuarios ver información sobre el clúster, los grupos de almacenamiento, etc. y las métricas asociadas para que puedan tomar decisiones más informadas y de mayor calidad.
No se trata de un juego de números compitiendo por métricas sin sentido, sino de utilizar datos cruciales para proteger toda tu pila.
¿Tiene una disponibilidad de cinco nueves para sus aplicaciones de misión crítica? Descubra cómo puede ayudarle nuestro nuevo MP para Nutanix.