Was ist Disaster Recovery?
Disaster Recovery (DR) bezeichnet die gezielte Wiederherstellung von IT-Systemen, Anwendungen und Daten nach schwerwiegenden Störungen oder Katastrophen. Als operativer Teilbereich des Notfallmanagements konzentriert sich DR auf technische Maßnahmen zur Sicherstellung der IT-Verfügbarkeit. Der Fokus liegt auf der Minimierung von Ausfallzeiten (Recovery Time Objective, RTO) und Datenverlusten (Recovery Point Objective, RPO) nach unvorhersehbaren Ereignissen wie Naturkatastrophen, Cyberangriffen oder Hardwaredefekten.
Aufbau & Wiederherstellungsstrategien
Disaster-Recovery-Konzepte bestehen in der Regel aus mehreren Stufen:
- Backup & Restore:
Regelmäßige Datensicherungen auf Offline- oder Cloud-Systeme mit dokumentierten Wiederherstellungsverfahren. - Cold, Warm & Hot Sites:
Alternative Ausweichstandorte mit unterschiedlichem Vorbereitungsgrad (z. B. Server-Hardware, Systemimages). - Failover & Redundanzkonzepte:
Automatisierte Umschaltung auf sekundäre Systeme bei Ausfällen (z. B. Cluster, Load Balancer, DNS-Switching). - Recovery-Tests & Dokumentation:
Wiederkehrende Notfallübungen, Test-Restores und Betriebsdokumentationen.
Relevanz in der Praxis
Disaster Recovery ist entscheidend für:
- Geschäftskontinuität:
Schnelle Rückkehr in den regulären IT-Betrieb nach einem Störfall. - Risikoreduktion:
Reduzierung wirtschaftlicher Schäden durch Ausfallzeiten, Datenverlust oder Vertragsverletzungen. - Regulatorische Anforderungen:
DR ist Bestandteil vieler Standards wie ISO 27001, BSI 200-4 und wird u. a. in der NIS-2- und DORA-Verordnung gefordert. - Reputation & Vertrauen:
Kunden erwarten Ausfallsicherheit – besonders in KRITIS-Sektoren und digitalen Geschäftsmodellen.
Standards & Tools
- ISO/IEC 27031 – Guidelines for ICT Readiness for Business Continuity
- BSI 200-4 – Notfallmanagement
- Veeam, Rubrik, Commvault – Enterprise Backup & Recovery
- DRaaS-Lösungen: Acronis, Azure Site Recovery, Zerto
Verwandte Begriffe
- Business Continuity Management (BCM)
- IT Service Continuity Management (ITSCM)
- Failover
- RTO (Recovery Time Objective)
- RPO (Recovery Point Objective)
- Offsite-Backup
- Notfallhandbuch
- Wiederanlaufstrategie
Beispiel aus der Praxis
Nach einem Brand im Rechenzentrum eines Finanzdienstleisters griff das Unternehmen auf eine Hot Site im Ausland zurück. Dank eines vorher getesteten Disaster-Recovery-Plans inklusive automatischer Datenreplikation war der Online-Service innerhalb von vier Stunden wieder voll funktionsfähig. Der vollständige Produktionsbetrieb wurde innerhalb von 24 Stunden wiederhergestellt.