IT-Monitoring

Operations MonitoringProaktives Hybrid Monitoring für alle operativen Ebenen

Agieren ist besser als Reagieren...

Die isolierte Überwachung einzelner Komponenten in einer komplexen Cloud-Infrastruktur ermöglicht nur bedingt Rückschlüsse auf Verfügbarkeit und Auslastung des Gesamtsystems. Beim Hybrid Monitoring wird deshalb die Topologie und die Relation der Systemkomponenten, zusammen mit Daten und Informationen anderer Betriebsprozesse in den Analyseprozess eingebunden.

Die Einbeziehung spezieller Agenten in den Entscheidungsprozess ist eine weitere Eigenschaft unseres Hybrid Monitorings. So können Daten der Anomalie-Detection Systeme verknüpft mit Kenngrößen zur Systemauslastung wichtige Informationen über die Nutzung eines IT-Systems liefern. Ist eine illegale Nutzung wahrscheinlich, können automatisch Prozesse zur dynamischen Anpassung der konfigurierten Security Regeln ausgelöst werden. Ist der Lastanstieg durch eine höhere User Anzahl begründet, kann eine bedarfsgerechte Ressourcenanpassung erfolgen.

Klassifizierung der Messdaten und Informationen

Für die Analyseprozesse ist eine Klassifizierung der Daten wichtig. Aus diesem Grund gruppieren wir die Daten gemäß dieser drei unterschiedlichen operativen Ebenen: Infrastruktur, Software und Experience.

Monitoring auf Infrastruktur Ebene
Die Infrastruktur Ebene mit Hypervisoren, Speicher- und Netzwerksysteme liefert Metriken zur Früherkennung von Störungen
Monitoring der Software Ebene
Die Software Ebene erfasst Leistungs- und Qualitätswerte von Betriebssystem und Applikationssoftware
Monitoring auf End-User Ebene
Die Experience Ebene bewertet die Nutzbarkeit aus der Sicht des Anwenders (Page Load, Dauer von User-Transkationen)

Infrastruktur Ebene

Im Rahmen des Infrastruktur-Monitorings erfassen wir Messwerte aus Gebäudetechnik, Netzwerk, Lastverteilung, Server Hardware, Speichersystemen und Virtualisierung. Diese Messwerte werden in Ressourcegruppen zusammengefasst und in ein hierarchisches Datenmodell eingeordnet. Diese hierarchische Strukturierung ist sowohl für die Messwertanalyse als auch für die operative Steuerung von entscheidender Bedeutung.

Ohne Informationen, die die hierarchische Abhängigkeit der Systeme beschreiben, ist es oftmals schwierig den tatsächlichen Ursprung von Anomalien und Störungen zu erkennen. Nachbarschaftsbeziehungen ermöglichen die Wechselwirkung von Konfigurationen in einer komplexen Hierarchie zu bestimmen und frühzeitig Gegenmaßnahmen einzuleiten.

Software Ebene

Die Einbindung der virtuellen Infrastruktur eines Kundenprojekts in die Monitoring-Hierarchie findet auf dieser Ebene statt. Die virtuelle Kundeninfrastruktur umfasst einzelne oder geclusterte virtuelle Machinen, Betriebssysteme, Anwendungssoftware und spezielle Dienste wie IT-Security und Local Traffic Management. Messwerte aus der Infrastruktur-Ebene wie Zuteilung der CPU Power von Hypervisoren und Performanz des Speichersystems werden in diese Ebene importiert, um die Entscheidungslogik zu unterstützen.

Typischerweise werden auf Softwareebene viele Messwerte erfasst und aufgezeichnet, da hier oftmals das größte Potential für individuelles Tuning liegt. Wichtig für die Analyse sind kurze Messintervalle und die Möglichkeit der Langzeitspeicherung um Trendanalysen zu ermöglichen.

Beim System Tuning sehen wir, wie sich Änderungen auf andere Softwareschichten und Ebenen wie Anwendungsprozesse und Traffic Management auswirken. Im positiven Fall steigt die Performanz der Anwendung, verbunden mit einer höheren Anzahl an Transaktionen/Sekunde, was letztendlich zu höheren Besucherzahlen führt.

Aufgrund der anfallenden Datenmenge erfolgt die Aufzeichnung der Messwerte selektiv. Um komplexe Analysen durchführen zu können, müssen jedoch alle erfassten Messwerte zur Verfügung stehen. Dies erreichen wir mit Hilfe zyklischer Snapshots von Messdaten, die wir innerhalb eines definierbaren Zeitfensters für komplette virtuelle Infrastrukturen durchführen.

Experience Ebene

Für die User Experience ist die Website-Performance von entscheidender Bedeutung. Bei 100 Millisekunden liegt die sog. Wahrnehmungsschwelle des Users. Alles, was länger dauert, wird nicht als sofort empfunden. Mehr als 2 Sekunden empfindet der Nutzer als Wartezeit. Mehr als 10 Sekunden hält kaum ein Benutzer durch. Er bricht ab und wechselt die Seite. Messungen auf Experience-Ebene sind für unsere Kunden ein wichtiges Kriterium, weil diese Werte direkten Einfluss auf den geschäftlichen Erfolg haben.

Die verteilten Prüfagenten des Monitorings liefern uns wertvolle Daten zur Ladezeit von Webseiten und der Dauer bestimmter Transaktionen. Die detaillierten Messungen beinhalten die DNS Antwortzeit, die vergangene Zeit bis das erste Datenpacket der Rückantwort eintrifft, die Dauer bis alle Objekte im sichtbaren Bereich des Browsers vorliegen und die Zeit bis alle Objekte nachgeladen wurden. Die Prüfprogramme simulieren diesen komplexen Ladevorgang einer Website und zwar exakt nach dem Verfahren moderner Internetbrowser. Die Ergebnisse stellen wir in einer übersichtlichen Waterfall-Statistik dar.

Steuerung der Betriebsprozesse

Das Monitoring als zentrale Datendrehscheibe zur Steuerung unterschiedlicher Betriebsprozesse bringt erhebliche Vorteile. Daten aus den verschiedenen Funktionsbereichen werden zentral gespeichert, miteinander verknüpft und analysiert. Im Ergebnis werden neue Prozessworkflows getriggert und deren Ablauf überwacht.

Monitoring zur Unterstützung des Patch Managements
Im Patch Management geht es darum, welche Software ist installiert und ob Schwachstellen behoben sind. Hybrid Monitoring erinnert an Patch-Zyklen und signalisiert Ad-Hoc Patches
Monitoring zur Unterstützung des Risiko Managements
Für das Risiko Management werden Penetration Tests initiiert. Die Frequenz dieser Tests sind abhängig vom Schutzbedarf eines Assets, von Software-Changes oder Major Patches
Monitoring zur Unterstützung des Change Managements
Beim Change Management sind Workflows und Dokumentation wichtig. Der Zeitpunkt einer Änderung und deren Klassifizierung liefern wertvolle Hinweise bei der Analyse

Das nahtlose Zusammenspiel der Betriebsprozesse ist der Garant für die Informationssicherheit beim Hosting von Internet Anwendungen. Sie steuern, dass Software Patches zeitnah installiert werden, Änderungen dokumentiert, deren Wirkung analysiert, sowie das Risikomanagement laufend mit Daten aus dem Monitoring aktualisiert wird.

Remote Monitoring

Die moderne Architektur des Monitoring System ermöglicht auch die Überwachung entfernter Systeme. Die für die Erfassung von Metriken zuständigen Agenten können in unterschiedlichen Lokationen installiert werden und kommunizieren mit der Zentrale über persistente, verschlüsselte Websocket Verbindungen. Unsere Standorte in Moskau, Singapur und Shanghai werden mittels dieser Technologie von unserer Zentrale in München gesteuert.

Die Einbindung Ihrer eigenen Infrastruktur in den Überwachungs- und Steuerungsprozess ist ein weiterer Anwendungsfall für das Remote Monitoring. E-Commerce Anwendungen basieren in der Regel auf umfangreichen Back Office Prozessen die mit dem Front Office kommunizieren. Somit liegt nahe, dass ein integriertes Monitoring der beiden Welten neue Möglichkeiten zur Optimierung der Betriebsprozesse bietet.