Drei Anwendungsfälle für generative KI
Künstliche Intelligenz unterstützt Admins schon heute bei der Priorisierung wichtiger Aufgaben sowie bei der Automatisierung sich wiederholender manueller Tätigkeiten. Mit GenAI lässt sich nicht nur das Erstellen von Textbausteinen automatisieren – auch Statusupdates etwa lassen sich schneller und gezielter generieren. Es lohnt sich also für Unternehmen, über den Einsatz der Technologie nachzudenken. Der Beitrag stellt drei typische Anwendungsfälle für GenAI in IT-Ops vor.
Die Digitalisierung schreitet überall unaufhaltsam voran. Die Verantwortlichen für den IT-Betrieb (ITOps) stehen unter immer größerem Druck, die Stabilität von Diensten zu gewährleisten und Vorfälle in rasantem Tempo zu bewältigen. Künstliche Intelligenz hat hier das Potenzial, die Produktivität von ITOps zu steigern – exemplarisch nennen wir drei Anwendungsfälle.
Post-Mortem-Betrachtungen von Vorfällen
Nach Vorfällen erstellen ITOps-Teams oft umfassende Post-Mortem-Berichte. Diese retrospektive Analyse eines Vorfalls hilft, die Ursachen und Folgen des Ereignisses zu verstehen und effektive Maßnahmen zur Vermeidung weiterer Vorfälle zu ergreifen. Ein Post-Mortem umfasst typischerweise folgende Schritte:
- Sammlung von Informationen: Alle relevanten Informationen über den Vorfall werden zusammengetragen, einschließlich von Ereignisprotokollen, Analyseergebnissen und anderen relevanten Daten.
- Analyse: Die gesammelten Informationen werden analysiert, um die Ursachen und Folgen des Ereignisses zu verstehen.
- Bewertung: Die Ergebnisse der Analyse werden bewertet, um die Schwere und Auswirkungen des Ereignisses zu beurteilen.
- Lernwerte: Die Lernwerte aus dem Vorfall helfen, die Wahrscheinlichkeit von ähnlichen Ereignissen in Zukunft zu minimieren.
Eine Post-Mortem-Betrachtung trägt dazu bei, die Organisation widerstandsfähiger zu machen, indem sie Schwachstellen und Risiken identifiziert und Maßnahmen zur Verbesserung der Prozesse entwickelt. In der Vergangenheit mussten relevante Datenpunkte aber manuell gesammelt, ausgewertet, korreliert und interpretiert werden. Das ist zeitaufwendig und fehleranfällig. GenAI kann den Post-Mortem-Prozess drastisch vereinfachen. Hier sind einige Beispiele, wie GenAI die IT-Teams unterstützen kann:
- KI ermöglicht es, große Mengen an Daten effizienter zu analysieren. Relevante Informationen werden schneller extrahiert, um die Ursachen und Folgen eines Vorfalls zu verstehen.
- Mit Hilfe von KI und maschinellem Lernen lassen sich Fehler automatisch erkennen und melden. Die Reaktionszeit auf Ereignisse wird reduziert.
- KI-basierte Tools können Effizienz und Zuverlässigkeit von Prozessen verbessern, indem Lernwerte aus Vorfallen extrahiert und in eine strukturierte Form gebracht werden.
- Berichte über Vorfallanalysen lassen sich mit GenAI automatisiert erstellen und an die einzelnen Beteiligten weiterleiten.
- KI kann Vorhersagen über zukünftige Ereignisse treffen und die IT-Teams frühzeitig auf mögliche Risiken und Schwachstellen aufmerksam machen.
Die technischen Voraussetzungen für die Durchführung von Post-Mortem-Analysen variieren je nach Organisation und Umgebung. Eine geignete Plattform sollte mindestens die folgenden Anforderungen erfüllen:
- Datenmanagement und -integration: Relevante Daten sollten aus verschiedenen Quellen integriert und analysiert werden können.
- Logfile-Analyse und Ereignisprotokollierung: Eine geeignete Plattform sammelt, filtert und analysiert Logfiles automatisch. Werkzeuge zur Visualisierung, Statistik und Machine-Learning helfen bei der Interpretation der Daten.
- Automation: Die Plattform sollte Ereignisse oder Fehler automatisch identifizieren und Analysen und Berichte automatisiert erstellen können.
- Sicherheit: Eine sichere Umgebung schützt die Daten in jeder Phase des Prozesses.
- Skalierbarkeit: Eine skalierbare Lösung kann Analyse und Bewertung von Vorfällen auf große Datenmengen anwenden.
- Collaboration: Moderne Plattformen ermöglichen die Zusammenarbeit verschiedener Teams und Stakeholder bei der Analyse und Bewertung von Vorfällen.
GenAI-gestützte Post-Mortems fördern eine Kultur der kontinuierlichen Verbesserung. Neben der Zeitersparnis kann GenAI auch eine objektive Autorität für den Prozess sein, was zu weniger Reibungsverlusten führt.
Prozessautomatisierung
Oft müssen ITOps-Teams heute mit gleichen oder sogar weniger Ressourcen deutlich mehr leisten. Routineaufgaben wie das Neustarten und Zurücksetzen einer Komponente oder die Bereitstellung neuer Systeme oder das Abrufen von Fehlerdiagnosen bei nachlassender Systemleistung lassen sich ohne weiteres automatisieren. Das erfordert allerdings, eine Vielzahl von Skripten beziehungsweise Runbooks für alle Arten sich wiederholender Aufgaben zu erstellen.
GenAI kann als Co-Autor bei der Prozessautomatisierung helfen und Runbooks selbst für komplexe Prozessabläufe in Sekundenschnelle erstellen. ITOps-Teams profitieren bei diesem Low-Code-Ansatz von flachen Lernkurven. Mit GenAI können auch Nicht-Experten und Junior-Entwickler neue Runbooks erstellen. Organisationen begegnen dem Fachkräftemangel damit insgesamt gelassener.
Wenn Unternehmen GenAI für sich einsetzen möchten, sollten sie allerdings einige Aspekte beachten:
- Datenqualität: GenAI-Modelle benötigen hohe Qualität und Menge an Trainingsdaten, um effektiv zu funktionieren. Unternehmen sollten sicherstellen, dass ihre Daten sauber, relevant und repräsentativ sind.
- Datenintegration: Generative KI benötigt eine integrierte Datenquelle, um die notwendigen Informationen zu extrahieren. Unternehmen sollten sicherstellen, dass ihre Datenquellen miteinander integriert sind und dass die Daten korrekt formatiert und strukturiert sind.
- Modelltraining: GenAI muss trainiert werden, um ihre Fähigkeiten zu verbessern. Unternehmen sollten sicherstellen, dass sie genug Trainingsdaten haben und dass das Modell regelmäßig trainiert wird, um die Ergebnisse zu verbessern.
- Modellvalidierung: Es ist wichtig, dass Unternehmen das GenAI-Modell validieren, um sicherzustellen, dass es die erwarteten Ergebnisse liefert. Dies kann durch die Überprüfung von Beispiel-Runbooks oder durch die Auswertung von Metriken wie Genauigkeit und Präzision erfolgen.
- Modellinterpretation: GenAI-Modelle können komplexe Entscheidungen treffen, die für Unternehmen schwierig zu verstehen sind. Unternehmen sollten die Ergebnisse des Modells verstehen und interpretieren können, um sicherzustellen, dass die Entscheidungen sinnvoll sind.
- Datenschutz und -sicherheit: KI kann sensible Daten verarbeiten, die geschützt werden müssen. Unternehmen sollten die notwendigen Maßnahmen zum Schutz der Informationen ergreifen und sicherstellen, dass das Modell nur auf autorisierte Daten zugreift.
- Regulierung: GenAI-Modelle können unter bestimmte Gesetzen und Vorschriften fallen, wie zum Beispiel der DSGVO. Unternehmen müssen die notwendigen Maßnahmen ergreifen, um die Regulierung einzuhalten.
- Mitarbeiterausbildung: KI kann neue Fähigkeiten und Prozesse erfordern. Unternehmen sollten sicherstellen, dass ihre Mitarbeiter ausreichend ausgebildet sind, um das entsprechende Modell zu verstehen und zu nutzen.
Wenn Unternehmen diese Aspekte beachten, können sie GenAI erfolgreich einsetzen und die Vorteile nutzen, die es bietet.
Automatisierung von Statusupdates
Bei Vorfällen und Unterbrechungen im IT-Betrieb ist eine effiziente Kommunikation wichtig. ITOps müssen sich sowohl untereinander koordinieren als auch die Unternehmensleitung sowie externe Interessengruppen auf dem Laufenden halten. Statusupdates bieten eine Zusammenfassung der aktuellen Situation und des Fortschritts im Incident Management. Sie schaffen Transparenz und ermöglichen es, schneller die notwendigen Maßnahmen zu ergreifen.
Statusmeldungen lassen sich mit GenAI automatisiert erstellen. Dazu durchforsten große Sprachmodelle (LLMs) die Rohdaten von Vorfällen, werten die Information aus und formulieren nahezu in Echtzeit umfassende Meldungen. GenAI kann Statusupdates für verschiedene Personas anpassen und optimal auf die Bedürfnisse unterschiedlicher Stakeholder abstimmen.
GenAI ermöglicht es den Teams, sich auf die eigentliche Arbeit der Problemlösung zu konzentrieren. Kontinuierliches Training und maschinelles Lernen helfen den Modellen, den Kontext einer Statusaktualisierung zu verstehen.
Es gibt jedoch auch Risiken bei der automatisierten Erstellung von Statusupdates:
- Falsche oder ungenaue Informationen: Automatisierte Systeme können Fehler machen oder ungenaue Informationen liefern, was zu Fehlentscheidungen führen kann.
- Überlastung: Automatisierte Plattformen können das System überlasten, wenn zu viele Statusupdates erstellt werden. Das kann zu weiteren Ausfällen oder Verzögerungen führen.
- Datenschutz: Automatisierte Systeme können sensible Daten verarbeiten, die geschützt werden müssen. Gelangen solche Daten in die falschen Hände, kann das verheerende Folgen für das Unternehmen haben.
Um diese Risiken zu minimieren, sollte ein Unternehmen die automatisierten Systeme regelmäßig überprüfen, um sicherzustellen, dass sie korrekt funktionieren und keine Fehler machen. Automatisiert verarbeitete Daten müssen kontinuierlich überwacht werden, um sicherzustellen, dass sie korrekt und sicher sind. Regelmäßige Aktualisierungen der Automatisierungsebene stellen sicher, dass sie die neuesten Funktionen und Sicherheitsupdates erhalten. Regelmäßige Schulungen der Mitarbeiter helfen ihnen, die automatisierten Systeme korrekt nutzen und die Risiken minimieren zu können.
Fazit
GenAI hat das Potenzial, die Produktivität nicht nur von ITOps-Teams auf ein neues Niveau zu heben und nahtlose digitale Prozesse zu schaffen. Je mehr Beispiele auftauchen, desto mehr wird die Technologie zu einem Muss für Organisationen aller Branchen. Und je weiter die Technologie ausreift, desto mehr Möglichkeiten wird es geben, Lernprozesse zu beschleunigen und die Produktivität zu steigern.
ln/Mandy Walls, DevOps-Advocate bei PagerDuty