Überwachen Sie schon, oder konfigurieren Sie noch?

Monitoring als Basisdisziplin im Rechenzentrums- und Datenbankbetrieb ist unerlässlich. Wie setze ich nun ein adäquates und maßgeschneidertes Monitoring auf und wie betreibe ich es? Kaufe ich ein Produkt, baue ich etwas selbst, oder soll ich mich doch in der Open-Source-Welt umschauen? Überwache ich meine gesamte IT oder nur Teile davon? Wie viel Zeit sollte ich für das Projekt veranschlagen? – Alles richtige und wichtige Fragen und ein Artikel, der auf einige dieser Fragen geeignete Antworten liefert.

Organisation ist nicht alles, aber ohne Organisation ist alles nichts

Bevor man sich auf die Suche nach einem geeigneten Werkzeug macht, ob nun gekauft oder nicht, müssen zunächst einige Hausaufgaben gemacht werden. Ziel ist es, die Rahmenbedingungen und Anforderungen nicht im Laufe des Projekts ständig neu zu definieren, sondern bereits zu Beginn wichtige Eckdaten zu setzen und Entscheidungen zu treffen.

Was möchte ich eigentlich überwachen?

Im ersten Schritt erstelle ich eine Liste von Maschinen und Komponenten, die ins Monitoring fließen sollen. An dieser Stelle mache ich mir schon vorab die Mühe und unterteile diese Komponenten nach Produktiv-, Entwicklung- und Testsystem. Die Einteilung kann bei Ihnen selbstverständlich abweichen. Es sollte unbedingt vermieden werden bereits zu Beginn in einem Organisationschaos zu versinken. Klare Strukturen machen auch später das Leben viel einfacher.

Nachdem nun die Liste der Komponenten festgelegt wurde, stellt sich die Frage, was möchte ich, oder besser gesagt, was muss ich auf diesen Komponenten überwachen? Bereits frühere Artikel und einschlägige Literatur listen eine breite Palette von Messpunkten auf, die sinnvoll erscheinen, überwacht zu werden. Bei dem Großteil ist das auch der Fall. Niemand stellt in Frage, dass z.B.  Plattenplatzverbrauch, Hauptspeicherverbrauch oder die allgemeine Netzwerkerreichbarkeit zu den zwingend notwendigen Messpunkten gehören. Doch auch hier, Konzentration auf das Wesentliche! Weniger ist manchmal mehr. Dazu auch später mehr.

Wer soll benachrichtigt werden, wann und wie?

Neben dem Überwachen ist die zweite wichtigste Aufgabe des Monitorings die Probleme zu melden. Hier kommen nun wieder Menschen ins Spiel. Im nächsten Schritt definiere ich mein Team, das später die Monitoring-Plattform bedienen und/oder betreiben soll. In diese Zusammenstellung muss unbedingt einfließen, ob im Schichtbetrieb gearbeitet wird oder eine Rufbereitschaft gewährleistet sein muss. Betreibe ich meine Produktivsysteme 7×24? Muss im Notfall jemand geweckt werden? Reichen Benachrichtigungen via Email aus oder sind hier andere Mittel notwendig? Aus diesen Fragestellungen ergibt sich ein Benachrichtigungsprofil, das später in die Konfiguration einfließen wird. Es sollte auch nicht vergessen und unterschätzt werden, dass Rufbereitschaft oder nächtliche Benachrichtigungen des Monitorings (z.B. per SMS oder Anruf) arbeitsrechtliche Themen berühren.

Welche Informationen soll mir das Monitoring zusätzlich liefern?

Eine sehr häufig unterschätzte Frage. Das Monitoring ist nicht einfach nur dazu da, einige Maschinen „anzupingen“ oder mal den verfügbaren Plattenplatz zu prüfen. Ein Monitoring-System kann sehr tiefergehende Informationen über meine IT liefern. Der obligatorische SLA-Report, eine Statistik über die Verfügbarkeit meiner Komponenten, gehört zu den ersten und wichtigsten Auswertungen. Ein Monitoring sollte aber noch viel mehr liefern können, wenn es die notwendigen Voraussetzungen erfüllt. Dann ist der steigende Verbrauch des Plattenplatzes ebenso (grafisch) auswertbar wie die Auslastung eines Prozessors oder die Paketverlustrate auf dem Netzwerk. Klar sollte sein, überall dort, wo Messpunkte überwacht werden, fallen Daten an. Diese Daten sollten gespeichert und auswertbar sein. Die Historie, der Blick in die Vergangenheit, ist für die Gegenwart und die Zukunft ein kostbarer Schatz an nützlichen Informationen. Diese intelligent ausgewertet und im besten Fall miteinander korreliert ergeben Hinweise auf Schwachstellen und möglicherweise anstehende Probleme. Das Ziel eines Monitorings sollte es nicht nur sein, aktuelle Probleme zu erkennen, sondern auch neue zu verhindern, bevor sie entstehen.

Soll ich ein Monitoring-System kaufen oder doch Open-Source einsetzen?

Die letzte Frage in diesem Kontext befasst sich nun mit dem Werkzeug selbst. Ich möchte nicht die Vor- und Nachteile von kommerziellen Werkzeugen, oder auf dem Open-Source-Markt verfügbaren Werkzeugen aufzählen. Sie sollten das Thema aus mehreren Blickwinkeln betrachten. Es gibt viele gute Gründe für kommerzielle Software, für Open-Source und natürlich auch für selbst erstellte Komponenten. Muss ich mich für die eine oder die andere Seite entscheiden? Nein! Ich verfahre nach dem Prinzip: „von allem das Richtige“.

Nagios/Icinga ist wohl das bekannteste Open-Source-Monitoring-Werkzeug auf dem Markt. Es hat inzwischen einen Status erreicht, der es beinahe zum Standard macht. Die simple Struktur von Hosts und Services ist leicht verständlich und einfach umzusetzen. Um das riesige Nagios/Icinga-Universum scharen sich inzwischen unzählige Plugin-Hersteller, die Komponenten für Nagios/Icinga anbieten, um mit dessen Hilfe nicht nur IT-Komponenten zu überwachen. Was insgesamt in dieser Betrachtung fehlt, sind u.a. folgende Fragen: Wie viel Ressourcen benötige ich, um das Monitoring aufzusetzen und zu betreiben? Wie viel Aufwand muss ich in die Konfiguration stecken? Welche Plugins setze ich am besten ein? Funktionieren die frei verfügbaren Plugins fehlerfrei? Wie viel Ressourcen sind notwendig, um das System auf einem aktuellen Stand zu halten? Was mache ich, wenn das Monitoring-System selbst ein Problem hat? Wer hilft mir?

Die Grundannahme wäre jetzt, dass ein kommerzielles Produkt nun auf alle diese Fragen eine passende Antwort bietet. Dem ist aber meistens nicht so. Auch hier befinden sich häufig versteckte Zeitfresser und Kosten. „End-to-End-Monitoring“ hört sich gut an, in der Praxis, liebevoll „Eierlegende Wollmilchsau“ genannt, ist sicherlich ein sehr anspruchsvolles und interessantes Unterfangen. Brauche ich das wirklich? Oder kann ich mich ggf. dahin entwickeln? Ein umfangreiches Rechtesystem, wer darf im Monitoring was sehen, welche Maschine, welchen Messpunkt, welchen Report, brauche ich das wirklich? Reicht nicht eine einfache Unterscheidung nach Schreib- und Leserechten und ggf. auch die Aufteilung in unterschiedliche Mandanten? Nicht selten befasst man sich allein mit diesem Thema mehrere Wochen, ehe nur eine Maschine überwacht wird. Wir verfolgen die Philosophie, Transparenz für alle. Warum soll der Datenbankadministrator nicht wissen und sehen, dass es auf dem Server oder der Netzwerkleitung Störungen gibt? So ließe sich häufig die Standardaussage von Anwendern, „die Datenbank läuft nicht“, schon frühzeitig entkräften.

Dies sollte als Fragenkatalog am Anfang reichen, um die wichtigsten Eckpunkte zu definieren. Man sollte nur nicht in den Zwang verfallen, die 100%-ige Lösung schaffen zu wollen. Das schafft man nämlich nicht. Für eine 100%-ige Lösung benötigt man unverhältnismäßig viel Ressourcen und zieht somit das Projekt unnötig in die Länge. Mit einer entsprechend akribisch erstellen Checkliste ausgestattet, sind Sie gut gerüstet, um ein erfolgsversprechendes Monitoring-Projekt zu starten.

„HL-Monitoring  Module“
als Beispiel eines Hybrids unter den Monitoring-Systemen

„HL-Monitoring Module“ wurde mit dem Ziel geschaffen, schnell und vor allem einfach eine Monitoring-Umgebung aufzusetzen. Selbstverständlich wird nicht an Funktionalität gespart. Lästiges Nachinstallieren von Komponenten oder Plugins gehört der Vergangenheit an. Der Kern erlaubt eine vollständige Server und Netzwerküberwachung, zudem ist hier eine umfassende Oracle-, SQL-Server und VMware-Überwachung in einem Werkzeug vereint. Hiermit lassen sich mehre Ebenen auf einfache Art und Weise überwachen und die gewonnenen Messdaten sind sofort grafisch auswertbar. „HL-Monitoring Module“ ist kompatibel zu Nagios-/Icinga-Plugins, die nahtlos integriert werden können. Auch eigenentwickelte Routinen lassen sich auf einfache Art einbinden. Somit müssen mühsam erstellte Programme nicht in den Papierkorb wandern.

Zu den besonderen Stärken zählt u.a. die simple Administration, mit der neue Überwachungspunkte binnen Minuten eingebunden werden können. Beispiel: Um 25 Server und 25 Oracle-Datenbanken in die Überwachung aufzunehmen, ist ein Zeitbedarf von ca. 2 Stunden zu veranschlagen. Lästiges Schreiben von Konfigurationsdateien gehört der Vergangenheit an.

Administration

Im vollständig web-basierten Cockpit können alle Messergebnisse direkt begutachtet und ausgewertet werden. Über die Archivierung der erfassten Messdaten kümmert sich
„HL-Monitoring Module“ automatisch. Hierbei sind keinerlei zusätzliche Installationen oder Aktionen seitens des Administrators notwendig. Neue Messpunkte werden automatisch gespeichert und ausgewertet.

Host_Performance

Selbstverständlich umfasst die grafische Auswertung auch Daten, die im Oracle- oder SQL-Server-Umfeld gewonnen wurden. Die Korrelation der Daten ist ein einfaches, sehr mächtiges Mittel Schwachstellen oder Trends zu erkennen.

oracle_stats

Die Anzahl der virtualisierten Systeme auf Basis von VMware steigt stetig. „HL-Monitoring Module“ wird diesem Umstand gerecht und bietet eine umfassende Überwachung von komplexen VMware-Umgebungen an. Die nahtlose Integration in die bestehende Monitoring-Landschaft schafft ungeahnte Möglichkeiten der Überwachung und Analyse.

vmware

Dies sind nur einige herausstechende Merkmale des „HL-Monitoring Modules“. Hier wird „Ganzheitliches Monitoring“ gelebt und praktiziert. Im Kern geht es darum, schnell und unkompliziert ein Monitoring-System aufzubauen und stabil zu betreiben. Die Komponenten sind 100% aufeinander abgestimmt und upgradefähig. Die Kompatibilität zu unzähligen Nagios-/Icinga-Plugins eröffnet schier unbegrenzte Möglichkeiten, wobei eigene Plugins ebenfalls ihre Verwendung finden können.

Zusammenfassung

Legen Sie gleich zu Beginn wichtige Eckpunkte und Rahmenbedingungen fest, an denen Sie sich im Projektverlauf orientieren können. Versuchen Sie nicht die „Eierlegende Wollmilchsau“ zu erschaffen, das haben schon viele versucht und sind gescheitert. Versuchen Sie, früh zu starten und früh in die Phase zu gelangen, in der schon wichtige Komponenten überwacht werden. Es müssen nicht gleich alle Komponenten sein, weniger ist mehr! Sie können kontinuierlich aufstocken und somit das System besser „kennenlernen“. Schalten Sie nacheinander die Benachrichtigungen ein, um nicht gleich zu Beginn mit einer Email- oder SMS-Flut konfrontiert zu werden. Jedes System durchläuft eine Kalibrierungsphase, in der die Schwellwerte (an die Realität) angepasst, überflüssige Messpunkte entfernt und die Benachrichtigungsprofile an die realen Gegebenheiten angepasst werden. Monitoring ist ein Langzeitvorhaben, ein lebendes Projekt, ein System, das ständig verfeinert und optimiert wird. Leben Sie das Monitoring, Sie werden den unschätzbaren Wert erkennen und Sie werden es nie mehr missen wollen.

Schreibe einen Kommentar