Ein Weckruf für das Risikomanagement von Drittparteien?

Wir befassen uns mit der Unvermeidbarkeit von IT-Ausfällen und deren Auswirkungen auf die Widerstandsfähigkeit von Unternehmen. Anhand einer Fallstudie über den jüngsten CrowdStrike-Vorfall untersuchen wir verschiedene Störungen - von menschlichen Fehlern bis hin zu Cyberangriffen - und bieten Strategien zur Stärkung der Abwehrbereitschaft Ihres Unternehmens.

Geschrieben von
Andy Fernandez
Veröffentlicht am
25. Juli 2024
Auf sozialen Netzwerken teilen

CrowdStrike-Vorfall erklärt

Bei CrowdStrike-Kunden, die einen Falcon-Sensor für Windows (Version 7.11 und höher) einsetzen, kam es zu einem Systemabsturz. Dies geschah, nachdem CrowdStrike ein Update der Sensorkonfiguration für Windows-Systeme veröffentlicht hatte, das einen Systemabsturz und einen blauen Bildschirm des Todes (BSOD) auf den betroffenen Systemen auslöste. Dies hatte erhebliche Auswirkungen auf die Systeme weltweit und betraf große Fluggesellschaften, die Reisebranche, das Hotel- und Gaststättengewerbe, Krankenhäuser, den elektronischen Handel und vieles mehr. Dabei handelte es sich nicht um einen kriminellen Cyberangriff, sondern um einfaches menschliches Versagen. Einer von vielen, die sich mit dem jüngsten Ausfall befasst haben, ist Chris Evans von Architecting IT, der den folgendenKommentar veröffentlicht hat:Kritische Infrastrukturen und kollektive Verantwortung".  

Bild des Zitats des CEO und Gründers von HYCU Simon Taylor

Microsoft hat außerdem einen Leitfaden zur Behebung desCrowdStrike-Ausfallsfür die betroffenen Kunden veröffentlicht: "Helping Our Customers Through the CrowdStrike Outage".  

Größter IT-Ausfall der Geschichte" durch menschliches Versagen verursacht  

Menschliches Versagen ist unvermeidlich und betrifft alle Organisationen. Es ist nur so, dass dies bei einem kritischen Dienst eines Drittanbieters geschah, der weltweit Millionen von PCs und Systemen abdeckt. Dies ist jedoch weder der erste noch der letzte Ausfall oder Vorfall eines Drittanbieters, von dem Unternehmen weltweit betroffen sein werden. Die Lektion, die man hier lernt, ist, dass man gegen jeden Ausfall eines Drittanbieters gewappnet sein muss. Hier sind drei Schritte, die jedes Unternehmen unternehmen sollte:  

Schritt 1: Sofortige Abhilfe schaffen

CrowdStrike hat bereits einen Leitfaden zur Behebung des Problems und ein Video für Remote-Benutzer veröffentlicht, die von dem BSOD betroffen sind. Microsoft hat außerdem ein neues Recovery Tool mit zwei Reparaturoptionen veröffentlicht, um den Reparaturprozess zu beschleunigen. Bitte stellen Sie jedoch sicher, dass Sie nur den Anleitungen und Abhilfemaßnahmen von CrowdStrike und Microsoft folgen, da wir bereits beobachten, dass Cyberkriminelle aus diesem Vorfall Kapital schlagen und CrowdStrike-Kunden direkt angreifen.  

Schritt 2: Sicherstellung der Ausfallsicherheit Ihrer Produktionssysteme vor Ort

Die meiste Energie für das Risikomanagement von Drittanbietern wurde so sehr auf öffentliche Cloud- und SaaS-Anwendungen verwendet, dass wir unsere Rechenzentrumsdienste oft als selbstverständlich ansehen. Unabhängig davon, ob es sich um einen Systemabsturz eines Drittanbieters oder einen Cyberangriff handelt, sollte jedes Unternehmen, das kritische Anwendungen vor Ort betreibt, die folgenden Maßnahmen ergreifen:

  • Disaster Recovery Lösungen mit der Möglichkeit der Ausfallsicherung an einem anderen Standort oder in der öffentlichen Cloud
  • Umfassende Backups mit Punkt-zu-Punkt- oder Massenwiederherstellung, die anwendungsbezogen ist. Dies bedeutet die Möglichkeit einer punktuellen Wiederherstellung und einer schnellen Wiederherstellung.  
  • Unveränderliche Backups, die logisch getrennt sind, um eine sichere Kopie außerhalb des Unternehmens zu gewährleisten, die im Falle einer Massenkorruption oder eines Cyberangriffs zugänglich ist.  
  • Regelmäßige Ausfallsicherheitstests und Wiederherstellungen von DR- und Backup-Lösungen mit dokumentierten Protokollen und Runbooks, die mehreren Mitgliedern des IT-Teams zugänglich sind.

Schritt 3: Bewerten Sie Ihre Widerstandsfähigkeit und Bereitschaft für den Fall einer Störung durch Dritte bei SaaS und Cloud  

Ihre Cloud-Infrastruktur und SaaS-Anwendungen sind vollständig von Drittanbietern abhängig, die diese Dienste bereitstellen, die Verfügbarkeit aufrechterhalten und Ihre Daten auf Systemebene schützen. Diese Dienste sind jedoch auch dem Risiko von Ausfällen, Beschädigungen und Datenverlusten ausgesetzt. Diese Unternehmen bieten zwar eine solide Verfügbarkeit und Sicherheit, aber durch menschliches Versagen besteht immer ein Risiko für Dritte, das zu Ausfallzeiten, Datenverlust oder -beschädigung führt.  

Egal, ob Cloud-Kunden einen Datenverlust erleiden (z. B. ein Pensionsfonds, dessen Konto versehentlich von einem Anbieter gelöscht wurde) oder ob ein Cybersecurity-Unternehmen und seine Mieter von einem Angriff auf die Lieferkette betroffen sind - es wird immer wieder vorkommen, selbst bei Best-of-Breed-Lösungen.  

Um sich entsprechend vorzubereiten, müssen Sie das richtige Risikomanagement für Dritte sicherstellen. Die Europäische Union hat den Digital Operations Resilience (DORA)-Gesetzesentwurf veröffentlicht, der ausdrücklich fordert, dass Organisationen einen Rahmen für das Risikomanagement von Drittanbietern für IKT (z. B. SaaS- und Cloud-Anwendungen) haben müssen. Dieses umfassende Rahmenwerk unterstreicht die Notwendigkeit, Ihre Anwendungen vor den Risiken Dritter zu schützen. Einige der Anforderungen umfassen:  

  • Kontinuierliche Entdeckung von Vermögenswerten
  • Sicherungsrichtlinien  
  • Offsite-Datenaufbewahrung  
  • Belastbarkeitstests  
  • Dokumentierte Runbooks und Protokolle für Business Continuity und Incident Response  

Sehen Sie sich dieses On-Demand-Webinar über DORA-Compliance am Beispiel von Atlassian Cloud an. Hier wird die Verantwortung des Kunden gegenüber dem Anbieter hervorgehoben. Die in diesem Video besprochenen Grundsätze gelten für alle Ihre Cloud- und SaaS-Anwendungen.  

Schlussfolgerung: Seien Sie bereit, seien Sie widerstandsfähig.  

Die Teams von CrowdStrike und Microsoft tun alles in ihrer Macht Stehende, um Abhilfe zu schaffen und sicherzustellen, dass alle Unternehmen über die erforderlichen Tools verfügen, um zu einem unterbrechungsfreien Betrieb zurückzukehren und eine maximale Betriebszeit zu erreichen. Dieses Szenario kann und wird jedoch bei vielen Anbietern auftreten, von Sicherheits- und Cloud-Lösungen bis hin zu Ihren Geschäftsanwendungen.  

Das Wichtigste ist, dass Sie sich darüber im Klaren sind, dass dieser Fall eintreten wird und dass Ihr Unternehmen die notwendigen Maßnahmen ergriffen hat, um Ihre Daten zu schützen und wiederherzustellen, wenn es soweit ist.  

Weitere Informationen:  

Shive Raja Kopfsprung

Direktorin für Produktmanagement

Andy Fernandez ist Direktor für Produktmanagement bei HYCU, einem Unternehmen von Atlassian Ventures. Andys gesamte berufliche Laufbahn konzentrierte sich auf Datensicherung und Disaster Recovery für kritische Anwendungen. Zuvor hatte er Produkt- und GTM-Positionen bei Zerto und Veeam inne. Jetzt konzentriert sich Andy darauf, sicherzustellen, dass Unternehmen kritische SaaS- und Cloud-Anwendungen über ITSM und DevOps schützen. Wenn er nicht gerade an der Datensicherung arbeitet, besucht Andy gerne Live-Konzerte, erkundet die lokalen kulinarischen Orte und geht an den Strand.

Erleben Sie die SaaS-Datenschutzplattform Nr. 1

Testen Sie HYCU selbst und werden Sie überzeugt.