====== Disaster Recovery (DR) ====== **Disaster Recovery (Obnova po havárii)** je soubor politik, nástrojů a postupů, které umožňují obnovu nebo pokračování vitální technologické infrastruktury a systémů po přírodní nebo člověkem způsobené katastrofě. Zatímco vysoká dostupnost (HA) se zaměřuje na předcházení výpadkům, DR se zaměřuje na to, jak se vrátit do provozu, když už k výpadku došlo. Základem DR je existence sekundární lokality (DR Site), která je geograficky oddělená od hlavní lokality. ===== Klíčové metriky DR: RPO a RTO ===== Úspěšnost strategie Disaster Recovery se měří dvěma parametry, které určují, kolik dat a času si firma může dovolit ztratit. * **RPO (Recovery Point Objective):** Maximální přípustné stáří dat, která mohou být ztracena. Pokud zálohujete jednou za 24 hodin, vaše RPO je 24 hodin. * **RTO (Recovery Time Objective):** Maximální přípustný čas, za který musí být služby po havárii opět funkční. Pokud obnovení trvá 4 hodiny, vaše RTO je 4 hodiny. ===== Typy Disaster Recovery lokalit ===== Podle toho, jak rychle je záložní lokalita schopna převzít provoz, rozlišujeme: * **Cold Site (Studená):** Záložní prostor s infrastrukturou (elektřina, chlazení), ale bez nainstalovaného hardwaru a dat. Obnova trvá dny až týdny. (Nejlevnější) * **Warm Site (Teplá):** Hardware je připraven a nakonfigurován, ale data nejsou aktuální (obnovují se např. jednou denně ze záloh). Obnova trvá hodiny. * **Hot Site (Horká):** Plně funkční kopie produkčního prostředí. Data jsou synchronizována v reálném čase. Přechod je téměř okamžitý. (Nejdražší) ===== Strategie přenosu dat ===== Aby bylo možné v záložní lokalitě začít pracovat, musí tam být data. Toho se docílí pomocí: 1. **Zálohování (Backup):** Pravidelné kopírování dat na pásky, disky nebo do cloudu. 2. **Replikace:** Kontinuální kopírování dat mezi úložnými systémy ([[san|SAN]]). * **Synchronní:** Každý zápis musí být potvrzen v obou lokalitách (nulové RPO, ale vyžaduje extrémně rychlé spojení a malou vzdálenost). * **Asynchronní:** Data se posílají s mírným zpožděním (vhodné pro velké vzdálenosti). 3. **Cloud DR (DRaaS):** Využití cloudového poskytovatele jako záložní lokality, což eliminuje potřebu vlastnit druhý fyzický serverový sál. ===== DR Plán (DRP - Disaster Recovery Plan) ===== DR není jen o technologiích, ale především o procesech. Kvalitní plán musí obsahovat: * **Analýzu dopadů (BIA):** Které systémy jsou nejdůležitější? * **Krizové kontakty:** Kdo má pravomoc spustit DR proces? * **Postupy krok za krokem:** Jak nastartovat servery v záložní lokalitě v určitém pořadí (např. nejdřív databáze, pak aplikace). * **Pravidelné testování:** Neotestovaný DR plán je neexistující plán. ===== Moderní trendy v DR ===== * **Immutable Backups:** Zálohy, které nelze změnit ani smazat (ochrana proti Ransomware). * **Orchestrace:** Nástroje (např. VMware SRM nebo Veeam), které automaticky provedou stovky kroků k oživení datacentra po stisknutí jediného tlačítka. --- **Související termíny:** [[failover|Failover]], [[high_availability|High Availability]], [[backup|Zálohování]], [[iaas|IaaS]], [[iscsi|iSCSI]].