Disaster-Recovery (DR)-Test

Ein Disaster-Recovery-Test (DR-Test) ist die Prüfung jedes Schrittes in einem Disaster-Recovery-Plan, wie er im Planungsprozess für Business Continuity/Disaster Recovery (BCDR) einer Organisation beschrieben ist. Die Evaluierung des DR-Plans hilft sicherzustellen, dass ein Unternehmen Daten wiederherstellen, geschäftskritische Anwendungen wiederherstellen und den Betrieb nach einer Unterbrechung der Dienste fortsetzen kann.

In vielen Unternehmen werden DR-Tests vernachlässigt, da die Erstellung eines Plans für die Notfallwiederherstellung Ressourcen bindet und teuer werden kann. Unternehmen können einen DR-Plan als ausreichend erachten, auch wenn es keine Beweise dafür gibt, dass der Plan im Katastrophenfall durchgeführt werden kann. Aus dem Grund sind Notfallübungen mit Praxisbezug regelmäßig durchzuführen. Ein Plan der nur theoretisch vorliegt, kann im Notfall zu noch mehr Problemen führen.

Wenn eine Organisation keine Zeit und Ressourcen in das Testen ihres Notfallwieder-herstellungsplans investiert, besteht die reale Chance, dass der Plan nicht wie erwartet ausgeführt werden kann, wenn er wirklich benötigt wird. Kommunikation, Datenwiederherstellung und Anwendungswiederherstellung stehen normalerweise im Mittelpunkt der Disaster Recovery-Tests. Andere Bereiche für Tests variieren je nach den Zielen der Organisation in Bezug auf den Wiederherstellungspunkt (RPO) und die Wiederherstellungszeit (RTO).

Experten empfehlen, das ganze Jahr über regelmäßig Disaster Recovery-Tests durchzuführen und diese in alle geplanten Wartungs- und Personalschulungen einzubeziehen. Nach Abschluss eines Tests sollten Audit-Protokolle und andere Daten analysiert werden, um festzustellen, was wie erwartet funktioniert hat, was nicht wie erwartet funktioniert hat, welche Änderungen am Design des DR-Plans vorgenommen werden müssen und welche Aufgaben für erneute Tests eingeplant werden müssen.

Ziele der Disaster Recovery-Tests

Eines der Hauptziele eines Disaster-Recovery-Tests ist es, festzustellen, ob ein DR-Plan funktionieren und die vorgegebenen RPO/RTO-Anforderungen einer Organisation erfüllen kann. Darüber hinaus gibt er den Unternehmen Feedback, damit sie ihren DR-Plan ändern können, falls unerwartete Probleme auftreten sollten.

IT-Systeme bleiben selten statisch, so dass neue und aktualisierte Produkte erneut getestet werden müssen. Speichersysteme und Server können hinzugefügt oder aufgerüstet worden sein, seit eine Organisation ihren Notfallwiederherstellungsplan entwickelt hat, neue Anwendungen bereitgestellt und ältere Anwendungen aktualisiert wurden. Oder die Cloud - privat, öffentlich oder hybrid - kann beginnen, eine größere Rolle in der IT-Infrastruktur eines Unternehmens zu spielen. Ein Disaster Recovery-Test hilft sicherzustellen, dass ein DR-Plan in einer IT-Welt, die sich ständig ändert, aktuell bleibt.

Arten von Disaster-Recovery-Tests

Es gibt drei grundlegende Arten von Disaster Recovery-Tests. Dazu gehören eine Plan review, eine Tabletop exercise und ein Simulation.

Plan review:  Hier überprüfen der Eigentümer des Katastrophenschutzplans und andere Mitglieder des Teams, das hinter der Entwicklung und Umsetzung des Plans steht, den Plan genau und untersuchen ihn im Detail, um eventuelle Inkonsistenzen und fehlende Elemente zu finden.

Tabletop exercise:  Hierbei handelt es sich um Übungen, bei denen die Beteiligten zusammenkommen, um Schritt für Schritt durch alle Komponenten eines Notfallwiederherstellungsplans zu gehen. Dies hilft festzustellen, ob alle wissen, was sie im Notfall zu tun haben, und deckt Inkonsistenzen, fehlende Informationen oder Fehler auf.

Simulation:  Die Simulation von Katastrophenszenarien ist eine gute Möglichkeit, um zu sehen, ob die Verfahren und Ressourcen - einschließlich der Backup-Systeme und Wiederherstellungsstandorte -, die für die Notfallwiederherstellung und Business Continuity vorgesehen sind, in einer Situation funktionieren, die der realen Welt so nahe wie möglich kommt. Bei einer Simulation werden verschiedene Katastrophenszenarien durchgespielt, um zu sehen, ob die am DR-Prozess beteiligten Teams die Technologien und Geschäftsabläufe rechtzeitig wieder aufnehmen können. Durch diesen Prozess kann festgestellt werden, ob genügend Personal zur Verfügung steht, um die DR-Arbeit ordnungsgemäß durchzuführen.

Wichtige Aspekte eines DR-Tests

Effektive Disaster Recovery-Tests sollten Folgendes berücksichtigen:

Zeitplanung:  Wann wurde eine Anwendung oder ein System das letzte Mal getestet? Je länger die Zeitspanne zwischen den Tests ist, desto größer ist das Risiko, dass Änderungen oder Wachstum - bei Daten, Hardware oder Software - zum Scheitern des DR-Plans führen. Es ist auch wichtig zu messen und zu wissen, wie lange eine vollständige Wiederherstellung aus der RTO-Perspektive als Teil Ihres DR-Tests dauert.

Änderungen:  Testen Sie, um sicherzustellen, dass Backup-/Wiederherstellungsprozesse von Änderungen unbeeinflusst bleiben. Führen Sie nach größeren Änderungen an der Infrastruktur - z. B. an der Speicherhardware oder der Aufrüstung eines Hypervisors - immer einen DR-Test durch, da diese dazu führen können, dass die Disaster Recovery-Prozesse neu geschrieben werden müssen.

Auswirkung:  Sie müssen wissen, ob sich die Disaster Recovery-Tests auf Ihre Produktionsumgebung auswirken oder nicht. Beispielsweise können Tests zu Ausfallzeiten führen, weil eine Anwendung oder Hardware heruntergefahren werden müssen oder die Live-Daten beeinträchtigt werden. Alle Daten- und Software-Updates sollten in eine Simulation einbezogen werden, um sicherzustellen, dass es sich um einen gültigen Durchlauf handelt und die Auswirkungen der Tests die gleichen sind, wie wenn der DR-Plan in einer realen Katastrophe implementiert würde.

Menschen:  Verwenden Sie einen DR-Test, um das Potenzial für menschliche Fehler im Disaster Recovery-Prozess zu minimieren oder vollständig zu beseitigen. Stellen Sie außerdem sicher, dass Sie eine Vielzahl von Personen einsetzen - nicht nur Mitarbeiter, die mit der direkten Unterstützung einer bestimmten Anwendung befasst sind -, um die Gültigkeit aller Schritte eines DR-Plans besser bestimmen zu können, entweder auf einem Live-System oder während einer Papierübung.

Test-Checkliste für die Wiederherstellung im Katastrophenfall

- Legen Sie einen detaillierten DR-Testplan vor, wenn Sie versuchen, eine Genehmigung und Finanzierung für die Durchführung von Tests zu erhalten.

- Identifizieren Sie in Ihren Analysen nach den Tests klar die Ziele, Vorgaben, Verfahren und das, wonach Sie suchen.

- Stellen Sie ein Testteam zusammen - einschließlich Fachexperten - und stellen Sie sicher, dass alle zum geplanten Testtermin verfügbar sind.

- Legen Sie genau fest, was getestet werden soll - zum Beispiel Backup und Wiederherstellung, Wiederaufnahme des Systems und der Netzwerke oder das Benachrichtigungssystem für Mitarbeiter.

- Dokumentieren Sie sorgfältig und bereiten Sie sich darauf vor, Ihre DR-Plan- und Notfallwiederherstellungs-Testskripte zu bearbeiten.

- Überprüfen und bestätigen Sie, dass der gesamte Code in den Testskripten korrekt ist.

- Nehmen Sie alle relevanten Technologieelemente und Prozesse, die getestet werden, in den Plan auf - egal, wie unbedeutend sie erscheinen mögen.

- Stellen Sie vor Beginn der Tests sicher, dass die Testumgebung bereit und verfügbar ist und die Produktionssysteme nicht beeinträchtigt. Stellen Sie sicher, dass das Testen nicht mit anderen Aktivitäten oder Tests in Konflikt gerät.

- Planen Sie einen DR-Test, der Stunden dauern kann, weit im Voraus; benachrichtigen und erinnern Sie andere IT-Manager an den kommenden Test.

- Führen Sie einen Probelauf - oder eine Übungsübung - durch, bevor der Disaster Recovery-Test live geht, um potenzielle Probleme aufzudecken und zu beheben.

- Stoppen und überprüfen Sie den Test, wenn Probleme auftreten. Fahren Sie fort, wenn das Problem umgangen werden kann; verschieben Sie den Test gegebenenfalls.

- Benennen Sie einen Zeitnehmer, der die Start- und Endzeiten aufzeichnet, und einen Schreiber, der Notizen macht, um den Nachbereitungsbericht für den Test vorzubereiten, in dem beschrieben wird, was während des Tests geschah, was funktionierte und was nicht und was gelernt wurde.

- Aktualisierung der Notfallwiederherstellungs- und Geschäftskontinuitätspläne (BCP) und anderer Dokumente auf der Grundlage der Erkenntnisse aus dem DR-Test.

Über den Autor: Uwe Poltoranin
Datenschutzbeauftragter (DGI / bitkom) Datenschutzbeauftragter (TüV Rheinland Akademie) IT-Sicherheitsbeauftragter (TüV Rheinland Akademie)
BSI Grundschutz Praktiker (DGI), ISMS-Prüfer / leitender Prüfer nach ISO / IEC 27001 ( ISACA), IT-Risikomanager (DGI)
Projektmanagement IPMA® Level C, ITIL®Foundation Level, PRINCE2® Foundation Level, Certified Scrum Master - Scrum Product Owner
Nach oben scrollen