Monitoring everything – warum ist das sinnvoll?

Auf der come2gether Veranstaltung in Augsburg habe ich einen Flyer in die Hand bekommen, wo die Möglichkeiten der Verbindung von baramundi zu PRTG aufgezeigt werden. PRTG ist einer der Marktführer im Bereich Monitoring. PRTG selber lebt das Motto Monitoring everything!

Server + Monitoring != erforderlich? Oder?

Jedes Unternehmen sollte eine Monitoring Lösung einsetzen.

Aber warum, das kostet doch nur Geld!

Eine Monitoring Lösung ersetzt nicht den Administrator. Im Gegenteil es ist zwingend erforderlich einen Administrator zu haben, der über den Tellerrand schaut zu haben. Es geht nicht darum den freien Festplattenspeicher zu überwachen. Das können die meisten Systeme nach dem hinzufügen des zu überwachenden Windows-Gerätes meist schon selber.

Wie sieht es aber mit den Diensten aus? Hier gibt es auch eine einfache Lösung dafür. Jeder Dienst der den Starttyp Automatisch hat muss sich im Status Wird ausgeführt befinden. Ist dies nicht der Fall soll ein Alarm ausgelöst werden.

Wenn(Dienst (Automatisch) != Wird ausgeführt) Dann Fehler

Hierbei gibt es natürlich noch zu beachten, das manche Dienste als Ausnahme hinzugefügt werden sollten, das beste Beispiel ist hier der Software Protection Dienst. Je nach Monitoring Lösung kann über dieses über verschiedene Möglichkeiten erfolgen. Im PRTG kann dieses z.B. über dieses Script hier erfolgen.

Das Beispiel mit den Diensten ist nur ein Beispiel aus vielen, die eine Monitoring-Lösung erst wertvoll machen.

Meine PRTG Umgebung

Durch die tägliche Arbeit mit den Systemen lernt man immer wieder neue Fehlerbilder kennen. Dieses geht mir nicht anders, und so kommt es das ich im Monat bestimmt 1-2 komplett neue Sensoren hinzufüge. Wir verwenden selber eine PRTG Installation um unsere Serverlandschaft und alle sonstigen Netzwerkgeräten, wie z.B. Switche, Gateways, WLAN-Controller, etc. zu überwachen. Bei PRTG ist ein Sensor z.B. eine Überprüfung einer Festplatte. Der Sensor kann natürlich mehrere Werte zurückliefern, die mit einzelnen Warn- und Fehlerschwellen belegt werden können.

Monitoring everything - Kanalübersicht
Monitoring everything – Kanalübersicht

Aus Fehlern lernen = Monitoring everything

Meine Herausforderung an mich selber ist, aus Fehlern lernen. Dabei sehe ich die Herausforderung nicht, den Fehler schneller zu beheben sondern ihn früher zu erkennen. Übersetzt man dieses auf die Festplatte so macht es Sinn den Trend zu überwachen, also wie viel GB sind in den letzten Stunden dazugekommen. Dadurch kann man einen Fehler früher erkennen und es kommt nicht zum Ausfall. In PRTG wird dieses unter dem Punkt Erweiterte Analyse des Netzwerkes eingerichtet. Und beherbergt die Möglichkeit Ungewöhnliche Werte zu melden.

Ein zweites Beispiel ist zum Beispiel das überwachen einer Schnittstelle. Hier hatte ich keine Möglichkeit direkt zu überprüfen. Das System meldete zwar Fehler, die wurden aber nicht nach Außen getragen. Doch was ich überwachen konnte, sind die Dateien die sich in einem Verzeichnis aufhäufen.

Also habe ich die Dateien mir angeschaut und nehme die Erstellungszeit der ältesten Datei, diese darf nicht älter als 15 Minuten sein. Sonst gebe ich einen Fehler bzw. eine Warnung aus. Zusätzlich noch einen Dateifilter eingebaut, so dass nur bestimmte Dateiendungen überprüft werden, fertig. In der Überwachung sieht man diese Tachos, sehr hübsch.

Monitoring everything - Anzahl Dateien
Monitoring everything – Anzahl Dateien

Wartung der Systeme = Sensoren anhalten

Nach der Fleißarbeit kommt die Feinabstimmung des Systems. Das ist besonders wichtig, um < 1% Fehlmeldungen zu erhalten. Jede Fehlmeldung kostet uns ja Zeit, die wir eigentlich durch den Einsatz von diesem System sparen wollen.

Die Planung der Erreichbarkeit der Systeme ist dabei entscheidend. Wer also z.B. ein Gerät über SNMP überwacht, welches Nachts ausgeschaltet ist. Sollte dieses in einem eigenen Zeitplan definieren. Euer E-Mail Postfach oder Handy welches die Benachrichtigung empfängt wird es euch danken.

Ein vorher definiertes Wartungsfenster ist da unabkömmlich, unter der Voraussetzung das es bei Möglich ist. Wartet ihr die Server nur spontan, so müsst ihr im Prozess der Wartung den Schritt der Anpassung des Servers mit einplanen. Ihr haltet den Überwachungsprozess für eine gewisse Zeit an oder stoppt ihn komplett, wobei er dann anschließend wieder von euch gestartet werden muss.

Fazit

Ein Monitoring System muss in jedem Unternehmen vorhanden sein. Ob es PRTG oder eine andere Lösung ist, spielt dabei keine Rolle. Die Aufgaben sind klar, nur die Methoden sind unterschiedlich, wobei in der SNMP Welt es nur den einen Weg gibt.

Durch den Einsatz habt ihr mehr Zeit für die Systeme und ihr könnt pro-aktiv reagieren und nicht erst wenn das System schon steht. Also lebt das Motto … Monitoring everything!

Kommentar verfassen