Brak tolerancji na jakikolwiek przestój. Zarządzanie ciągłością działania w oparciu o rozwiązanie HyperMetro firmy Huawei.
Kwestia dostępności danych jest coraz bardziej kluczowa dla firm jak również klientów korzystających z ich usług. Często wdrożenie odpowiedniego systemu jest kosztowne i skomplikowane z powodu integracji produktów wielu producentów, a zarządzanie z dnia na dzień zajmuje coraz więcej czasu. W dalszym ciągu jednym ze sposobów na backup jest wykorzystanie biblioteki taśmowej. Taśmy, jako nośniki danych, charakteryzują się długą żywotnością i odpornością na uszkodzenia mechaniczne. Backup jest jednak tylko częścią procesu pozwalającego zachować ciągłość działania w przypadku awarii. Druga, ważniejsza część dotyczy kwestii odtworzenia danych po wspomnianej awarii. Jak dużo czasu zajmuje? Czy w ogóle jest możliwa? Praktyka pokazuje wiele przypadków, w których backup z wykorzystaniem bibliotek taśmowych nie okazał się wystarczający po wystąpieniu awarii. Tłumaczy Konrad Tutak, IT Product Manager, Huawei Polska.
Dwa najważniejsze pytania, jakie każda firma musi sobie zadać brzmią następująco:
- Jaki jest maksymalny akceptowalny czas od wystąpienia awarii, po której usługa musi być ponownie uruchomiona (parametr RTO – Recovery Time Objective) ?
- Jaki jest maksymalny akceptowalny czas wstecz od wystąpienia awarii, który tolerujemy jako utratę danych (parametr RPO – Recovery Point Objective)? Innymi słowy, powrót do którego punktu w czasie z danymi pozwoli nam w dalszym ciągu kontynuować dostarczanie usług na akceptowalnym poziomie?
Poniższy wykres ilustruje przedstawione wcześniej parametry:
Rys. 1. Koncepcja RPO oraz RTO
Jeśli odpowiedź na powyższe pytania brzmi 0, czyli brak tolerancji na jakikolwiek przestój, rozwiązaniem, które to zapewni jest metro klaster active-active, w Huawei nazwany HyperMetro. W takim klastrze pracują dwie macierze dyskowe w dwóch Centrach Przetwarzania Danych (CPD), które jednocześnie dostarczają te same dane i synchronizują się między sobą w czasie rzeczywistym. Dzięki temu awaria jednego ośrodka nie powoduje przestoju ani utraty danych, ponieważ drugie CPD kontynuuje dostarczanie usług bez jakiejkolwiek interwencji administratora. Przełączenie usług pomiędzy CPD jest w pełni zautomatyzowane. HyperMetro można również zastosować w obrębie jednego ośrodka, jednak wtedy występuje brak odporności na awarię całej lokalizacji, np. zanik prądu. Po wdrożeniu metro klastra utylizacja zasobów jest na znacznie wyższym poziomie, zarządzanie uproszczone dzięki wysokiemu stopniowi automatyzacji procesów oraz braku konieczności instalacji urządzenia typu getaway, a co najważniejsze zapewniona ciągłość biznesowa. Warto dodać, że wystarczy 1 licencja per macierz, niezależnie od ilości danych replikowanych pomiędzy dwoma CPD, aby skonfigurować i uruchomić HyperMetro. Więcej o zaletach i topologii tego rozwiązania można dowiedzieć się oglądając webinar na stronie: https://wiecejniztechnologia.pl/
Jeśli odpowiedź na powyższe pytania jest na poziomie minut lub godzin odpowiednim rozwiązaniem będzie replikacja asynchroniczna pomiędzy dwoma Centrum Przetwarzania Danych. W grę wchodzą dwie macierze dyskowe, z których jedna może być wyższej klasy i wydajniejsza, a druga charakteryzująca się niższym kosztem zakupu. Wszystkie macierze Huawei z rodziny OceanStor posiadają wspólny systemem operacyjny, więc replikację można skonfigurować pomiędzy dowolnymi modelami. Portfolio systemów pamięci masowych Huawei można zobaczyć wchodząc na stronę https://e.huawei.com/pl/products/cloud-computing-dc/storage.
Z kolei o automatyczne przełączenie środowisk z urządzenia podstawowego na zapasowe zadba BCManager, czyli oprogramowanie Huawei, które integruje się z macierzami, zapewnia ochronę zasobów oraz ich odtworzenie w zapasowym ośrodku. Dodatkowym atutem jest jeden panel, w którym administratorzy mogą skonfigurować całą topologię i politykę ochrony. BCManager może objąć ochroną bazy danych, wolumeny macierzy, maszyny wirtualne jak również systemy plikowe po stronie serwera. W przypadku HyperMetro granularność jest na poziomie logicznych zasobów macierzy, czyli wolumenów.
W opisywanych scenariuszach bardzo ważną kwestią jest odpowiednia konfiguracja sieci, co przekłada się na wysoką przepustowość i szybką transmisję danych pomiędzy urządzeniami. Wymaganiom sprostają przełączniki Huawei z rodziny CloudEngine, które są dedykowane do CPD. Z kolei do zadań specjalnych w portfolio Huawei można znaleźć DWDM, czyli urządzenie zapewniające najszybszą transmisję danych przy najkrótszych opóźnieniach z wykorzystanym infrastruktury światłowodowej. Jeśli chodzi o wdrożenie HyperMetro lub rozwiązania opartego o replikację synchroniczną/asynchorniczną wyróżniamy parę modeli:
- HyperMetro/Replikacja w obrębie pojedynczego ośrodka.
- HyperMetro/Replikacja w obrębie dwóch ośrodków.
- Kaskadowe 3DC – dwa ośrodki działające w trybie active-active oraz trzeci ośrodek, jako centrum Disaster Recovery, połączony replikacją z jednym z dwóch ośrodków active-active. Przykład takiej topologii przedstawia poniższy rysunek.
Rys. 2. Schemat Kaskadowego 3DC
- Równoległe 3DC – dwa ośrodki działające w trybie active-active oraz trzeci ośrodek, jako centrum Disaster Recovery, połączony replikacją z obydwoma ośrodkami active-active, co przedstawia poniższy rysunek.
Rys. 3. Schemat Równoległego 3DC
Dzięki atrakcyjnemu licencjonowaniu HyperMetro, funkcjonalności replikacji jak również oprogramowania BCManager całościowe rozwiązanie oparte o produkty Huawei jest atrakcyjną propozycją dla firm szukających technologii, którym mogą powierzyć swoje dane. Celem głębszego poznania i przetestowania najnowszych rozwiązań z dziedziny systemów pamięci masowych, zachęcamy do kontaktu ze specjalistami Huawei Polska poprzez dedykowany adres storagePL@huawei.com lub autoryzowanymi partnerami handlowymi.