Jak sdělil v blogu Azure DevOps manažér Microsoftu Eric Mattingly, databáze Azure byly omylem odstraněny v polovině května. Chybu zavinil zaměstnanec, který ochromil databáze v regionu Jižní Brazílie. Podle Mattinglyho jednoduše stiskl špatnou klávesu.
K incidentu došlo, když chtěl zaměstnanec zahájit každodenní rutinní čištění databází. To spočívá v mazání starých záznamů, které již nejsou potřeba, aby cloudová aplikace fungovala nadále rychle.
Během pravidelného snímkování databází byl zadán požadavek na stažení (pull request) s překlepem. To mělo za následek, že byl smazán celý server Azure SQL, nikoliv jedna databáze Azure SQL.
Výpadek databáze Azure trval téměř jedenáct hodin
Zaměstnanec Microsoftu omylem odstranil databáze Azure. Zdroj: Unsplash/Tadas Sar
Porucha byla zaznamenána do 20 minut po zahájení mazání databáze a pohotovostní technici na ni okamžitě zareagovali. Pustili se do obnovy serveru SQL a postižených databází.
Jedním z důvodů, proč to trvalo tak dlouho, bylo, že obnovu bylo možné provést pouze ručně. Pro takové případy totiž neexistuje žádný automatický systém zálohování a obnovy.
Mattingly se omluvil všem uživatelům Azure za incident, který se stal 24. května, a za následné výpadky. Ke ztrátě dat naštěstí nedošlo. Microsoft nyní pracuje na řešení, aby k podobným problémům již nemohlo docházet.
Zdroj: Azure DevOps