Untersuchungen zum Beitrag von AIOps zum IT Operations Management - Teil I

Die meisten Menschen werden, wenn sie den Begriff „künstliche Intelligenz“ oder auch seine Abkürzung „KI“ hören, wohl an ihre Lieblings-Science-Fiction-Story aus einem Film oder Buch denken. Oft dreht sich die Story um eine künstliche Intelligenz, die rebelliert und der Menschheit gefährlich wird. So weit ist KI heutzutage in der Realität zum Glück noch nicht. Der Einsatz von KI treibt den menschlichen Fortschritt in der Forschung und Technik immer wieder stark an: Autos, die selbst fahren, Sprachen verarbeitende Geräte, die Gespräche mit Menschen führen können, Algorithmen, die aus Erfahrungen lernen und wichtige Entscheidungen so schnell treffen können, wie dies für einen Menschen nicht möglich wäre. Diese Liste ist nur eine kleine Auswahl an Beispielen, wie KI zum Fortschritt in diversen Feldern eingesetzt wird.

So ist es auch keine Überraschung, dass sich die Wirtschaft stark mit diesem Thema beschäftigt, um durch den Einsatz von KI in Unternehmen Vorteile zu erreichen. In der heutigen digitalen Welt ist die IT aus vielen Unternehmen nicht mehr wegzudenken und so beschäftigen viele auch eigene IT-Abteilungen, um sämtliche Prozesse und Vorgänge der IT mit der notwendigen Aufmerksamkeit und dem entsprechenden Know-how zu managen. Diese Operationen decken verschiedene Felder wie zum Beispiel das Usermanagement, das Management der gesamten Infrastruktur oder das Verwalten von digitalen Geschäftsprozessen des Unternehmens ab, sodass diese ohne Unterbrechungen durchgeführt werden können. Der erfolgreiche Umgang mit diesen Operationen kann, je nach Unternehmensgröße, sehr umfangreich gestaltet sein und ist eine Voraussetzung für die Vermeidung von Schäden und Extrakosten. Auch die Daten, mit denen dabei umgegangen wird, wachsen kontinuierlich enorm an, wodurch sich die Komplexität der IT und deren Anforderungen stetig erhöht: Hier spricht man von „Big Data“. In diesem Zusammenhang ist das Feld des AIOps entstanden. AIOps ist eine Kombination aus den Begriffen „Artificial Intelligence“ (Abkürzung: AI) und „IT Operations“, also künstliche Intelligenz und IT-Operationen. Es geht um die Anwendung von KI auf Operationen in der IT, um diese zu verbessern und effizienter zu gestalten.

AIOps ist ein relatives junges Feld, jedoch nehmen seine Beliebtheit und Bekanntheit stetig zu, da die Entwickler*innen und der Vertrieb von AIOps-Lösungen genau das versprechen, was es für Unternehmen so interessant macht: durch den Einsatz von AIOps mit den stark steigenden Anforderungen und hoher Komplexität in der IT zurechtzukommen.

AIOps ist im Allgemeinen nicht nur die Idee oder ein Lösungsansatz in der IT, sondern steht auch für die AIOps-Tools und -Plattformen, welche die Features und Lösungsansätze mit sich bringen. Der Begriff selbst existiert erst seit Kurzem. Künstliche Intelligenz half bereits seit den 1980ern, die Bedürfnisse von Unternehmen zufriedenzustellen. Ein Unterbereich der KI, Machine Learning, erhielt jedoch erst im 21. Jahrhundert mehr Aufmerksamkeit als Unterstützung für Geschäftsprozesse. Dabei entwickelte sich der Bereich der „IT Operations Analytics“, kurz ITOA. Das Problem an ITOA war, dass die Analysen auf vergangenen Daten beruhten, was es sehr statisch machte und zu Problemen mit dynamischen Infrastrukturen wie Cloud- oder Virtualisierungstechnologien (Container, virtuelle Maschinen und virtuelle Netzwerke) führte. Aus dem Bedürfnis, auch diese modernen und agilen Infrastrukturen zu überwachen und besser mit Echtzeitdaten umgehen zu können, entwickelte sich das Feld AIOps, bei dem nun auch Machine Learning mehr in den Fokus rückte.

Eines der im IT-Bereich relevantesten Forschungs- und Beratungsunternehmen, Gartner, hat den Begriff „AIOps“ zum ersten Mal im Jahr 2017 benutzt, um zu beschreiben, wie mit dazugehörigen Tools IT-Operationen – durch Anwendung von Analysen und Machine Learning auf sogenannte „Big Data“ – automatisiert und verbessert werden sollen. Gartners genaue Definition lautete: „AIOps platforms utilize big data, modern machine learning and other advanced analytics technologies to directly and indirectly enhance IT operations (monitoring, automation and service desk) functions with proactive, personal and dynamic insight. AIOps platforms enable the concurrent use of multiple data sources, data collection methods, analytical (real-time and deep) technologies, and presentation technologies“.

Im Market Guide für AIOps erwähnt Gartner außerdem, dass das Ziel von AIOps sei, die Qualität von aufgenommenen Daten zu verbessern, sodass Infrastruktur- und Operationsleader diverse Use-Cases mit angemessenen Maßnahmen betreiben können. Auch stellt Gartner eine Grafik zur Verfügung, um diese Definition zu unterstützen und den Einsatz von AIOps-Plattformen im IT-Operations-Management darzustellen (siehe Abbildung 1).

 

Market Guide for AIOps Platforms

 

Im technischen Mittelpunkt der AIOps-Plattformen stehen deren drei sogenannten Säulen:

  • KI
  • Machine Learning
  • Big Data

 

Auf diese drei Säulen bauen wiederum die drei Hauptfunktionen von AIOps auf, die kontinuierlich und simultan durchlaufen werden:

Hierbei geht es darum, sämtliche Daten, die in das AIOps-Tool fließen, richtig zu analysieren und daraus den Status von überwachten Systemen abzuleiten sowie Zusammenhänge und mögliche Gefahren festzustellen. Da dies in Echtzeit passiert, kommt hierbei Machine Learning zum Einsatz. Es ist unmöglich, bei solch gewaltigen Datenmengen Anomalien, Zusammenhänge zwischen Daten oder den Kontext manuell zu erkennen. Ein wichtiges Ziel dieser Funktion ist die deren schnelle Erkennung. Dies hilft enorm bei der Feststellung der Grundursache eines Problems und ermöglicht einen effizienten Umgang damit sowie dessen zukünftige Vermeidung.

  • Beobachten (observe)

In dieser Funktion geht es um das Einbetten von AIOps in das IT-Servicemanagement (ITSM) des Unternehmens. Eine solche Plattform muss mit dem bestehenden ITSM des Unternehmens integriert und synchronisiert werden, sodass auf Änderungen, Ereignisse und Abhängigkeiten im System des Unternehmens mit entsprechenden Maßnahmen reagiert werden kann.

  • Einbetten in ITSM (engage)

Auch werden Vorgänge automatisiert, um Abhilfe bei Problemen zu schaffen, ohne dass für jedes Anliegen menschliches Eingreifen benötigt wird. So kann zum Beispiel ein bestimmtes Skript automatisch vom Tool als Antwort auf ein bekanntes Problem eingesetzt werden, um dieses schnell und effektiv zu beseitigen.

Auch werden Vorgänge automatisiert, um Abhilfe bei Problemen zu schaffen, ohne dass für jedes Anliegen menschliches Eingreifen benötigt wird. So kann zum Beispiel ein bestimmtes Skript automatisch vom Tool als Antwort auf ein bekanntes Problem eingesetzt werden, um dieses schnell und effektiv zu beseitigen.

  • Handeln und Automatisieren (act)

Durch den richtigen Einsatz von AIOps in der IT soll vor allem ermöglicht werden, mit der hohen Komplexität und den steigenden Anforderungen in der IT durch Flexibilität zurechtzukommen. Durch diese verbesserte Effizienz im Umgang mit den Daten werden auch Kosteneinsparungen entstehen (Gartner, 2022). Durch diese Vorteile wird AIOps für jedes Unternehmen zu einem interessanten Thema.

 

ITOM - IT Operations Management

AIOps soll vor allem dem IT Operations Management (ITOM) zur Seite stehen. Was genau wird jedoch unter diesem Begriff verstanden? Unternehmen und deren Kunden sind heutzutage so abhängig vom sofortigen Zugriff auf IT-Komponenten, dass selbst kürzeste Ausfälle enorme Konsequenzen und Kosten zur Folge haben können. Diese Ausfälle durch richtiges Management der IT-Komponenten zu reparieren und zu verhindern, ist Ziel von ITOM.

Nach Gartner wird ITOM-Software wie folgt definiert: „IT operations management (ITOM) software is intended to represent all the tools needed to manage the provisioning, capacity, performance and availability of computing, networking and application resources — as well as the overall quality, efficiency and experience of their delivery“.

Eine genaue Abgrenzung des Umfangs der Funktionen und Verantwortlichkeiten von ITOM existiert nicht. Viele Hersteller von ITOM-Software definieren den Umfang unterschiedlich, je nach ihrem Angebot, jedoch sind sich viele bei den drei allgemeinen Bereichen einig. Hierbei hat BMC Software ein Whitepaper von Sudip Sengupta über ITOM und ITSM veröffentlicht, das genauer auf ITOM und dessen Funktionen eingeht. BMC ist eine der größten Firmen im Bereich von IT-Service-Tools. Diese drei Funktionsbereiche und diverse Beispiele sind nach BMC:

  • Management der Netzwerkinfrastruktur des Unternehmens: effizientes Port-/Protokollmanagement, Management der gesamten internen und externen Netzwerkkommunikation, Zugangsmanagement für autorisierte Nutzer
  • Management der allgemeinen IT-Infrastruktur des Unternehmens, also von Hardware, Servern, Anwendungen und Arbeitsplatzgeräten: Bereitstellen, Konfigurieren, Management und Warten von Servern, virtuellen Maschinen, Laptops und ähnlichen relevanten Geräten der Unternehmensumgebung, Uptime von Servern, Anwendungen und Geräten sicherstellen, Verwaltung von Datenspeichern / Email- und Dateienservern, Patches und Upgrades von Servern durchführen
  • Help-Desk-Operationen: First-Level-Support, Nutzerprofile bereitstellen, Backups anfordern, Management von Wiederherstellung im Desaster-Fall

 

Diesem Whitepaper zufolge verspricht ITOM durch diese Funktionen unter anderem folgende Vorteile:

  • Verbesserte Verfügbarkeit von Services
  • Bessere Kunden- und Nutzererfahrung
  • Minimale Downtimes
  • Verringerte Kosten von Operationen durch reguläre Überwachung

 

Gartner beschreibt IT-Operationen in ihrem Market Guide genauer. So sind die Aufnahme von Metriken und Logs sowie von Analysen die primären Voraussetzungen für die zugehörigen Teams. Am Anfang steht die Eventkorrelation, erweitert auf die Analyse von Metriken und Logs, gefolgt von Analysen zum Verhalten von Systemen und Nutzern. Die Ziele hierbei sind:

  • Die Entdeckung von Anomalien
  • Die Analyse von Problemursachen
  • Diagnostische Informationen

 

Noch dazu kann es Use-Cases geben, die Automatisierungen beinhalten, wie die Durchführung von Skripten oder automatischen Workflows.

Nachdem in diesem Artikel der theoretische Hintergrund zum Thema AIOps erläutert wurde, sollen die folgenden genauer auf AIOps-Plattformen eingehen. Nicht nur, wie diese aufgebaut sind und welche Ziele mit diesen erreicht werden sollen, sondern auch, welche Anforderungen sie erfüllen müssen und welche Voraussetzungen Unternehmen für den Einsatz dieser beachten sollten – aber auch, welche Risiken dadurch entstehen.