Der Mensch ist fest verdrahtet, um mehr Dinge anzuhäufen: Geld, materielle Güter, Freunde usw.
Viele Menschen konzentrieren sich auf die Quantität der Dinge, die sie besitzen, und der Beziehungen, die sie aufbauen, anstatt auf die Qualität - aber mehr ist nicht immer besser. Dieser Grundsatz zeigt sich auch bei der IT-Überwachung.
Überwachung ist kein Spiel, bei dem es darum geht, wer die meisten Punkte hat - wer am meisten überwachen kann, wer die meisten Alarme quantifizieren kann.
Erfolgreiche IT-Teams konzentrieren sich vielmehr auf die Qualität der Metriken. Wenn jemand behauptet, seine Lösung verfüge über mehr als 600 Metriken, mit denen eine bestimmte Anwendung oder Komponente überwacht werden kann, was bedeutet das eigentlich? Wie viele dieser Metriken sind relevant, und offen gesagt, wer interessiert sich für sie? Ist es für einen IT-Administrator wirklich wichtig, die Gesamtzahl der CPU-Sekunden zu sehen, die ein Server seit dem letzten Neustart verbraucht hat? Wahrscheinlich nicht - aber er würde sich für eine Rate interessieren, z. B. die Anzahl der in der letzten Minute verbrauchten CPU-Millisekunden oder einen Prozentsatz.
Es gibt viele Überwachungslösungen, die sinnlose Metriken sammeln, grafisch darstellen, Warnungen ausgeben und Berichte erstellen, die keinen Nutzen bieten, nur um mehr Metriken in die Liste der Vorteile aufzunehmen. Würden Sie nicht lieber ein Produkt sehen, das nur Metriken verfolgt und meldet, die IT-Administratoren, Managern und dem Unternehmen wichtige Daten liefern, als eine Lösung mit einer Unzahl von Metriken, durch die man sich durchwühlen muss, um den Wert zu finden (falls überhaupt vorhanden)? Es kommt darauf an, zu verstehen, warum eine Kennzahl wichtig ist, und zu wissen, welche Maßnahmen ergriffen werden sollten, wenn die Kennzahl einen bestimmten Schwellenwert überschreitet. Ohne diesen Zweck macht es keinen Sinn, Metriken zu sammeln oder darüber zu berichten.
Metriken mögen einem Fachmann einfach erscheinen, aber in vielen Fällen ist ein Mitarbeiter der IT-Betriebsstufe 1 oder 2 die erste Person, die eine Meldung sieht. Wenn er oder sie die Details der Metrik und die möglichen Maßnahmen zur Beseitigung der zugrunde liegenden Ursache versteht, kann er oder sie seine/ihre Beurteilung beschleunigen und die Notwendigkeit einer Eskalation einer Entdeckung bestimmen. Beispielsweise ist es in vielen Fällen wichtig und sinnvoll zu wissen, ob die CPU-Auslastung einer virtuellen Maschine (VM) hoch ist. Noch wertvoller und aussagekräftiger ist es jedoch, einen Schritt weiter zu gehen und die 10 wichtigsten VMs anhand der CPU-Auslastung zu identifizieren.
Wir haben ein SCOM Management Pack (MP) für Nutanix vorgestellt, das eine Dashboard-Ansicht bietet.
In dieser Ansicht können Sie einen Cluster auswählen, und es werden Ihnen die Top-VMs nach CPU-Auslastung, IO-Latenz, Speicher und einer Vielzahl anderer Metriken angezeigt. Das MP verfügt über zusätzliche Dashboards, die eine ähnliche Transparenz bieten und es den Anwendern ermöglichen, Informationen über den Cluster, die Speicherpools usw. und die zugehörigen Metriken zu sehen, damit sie qualitativ hochwertigere, fundiertere Entscheidungen treffen können.
Es handelt sich nicht um ein Zahlenspiel, bei dem es um bedeutungslose Metriken geht, sondern um die Nutzung wichtiger Daten zum Schutz Ihres gesamten Stacks.
Haben Sie eine fünfneunfache Verfügbarkeit für Ihre geschäftskritischen Anwendungen? Finden Sie heraus, wie unser neues MP für Nutanix helfen kann.