Količina podatkov vseskozi narašča, čemur ni videti konca. Informatiki se vse od začetkov shranjevanja digitalnih podatkov srečujejo z dilemo, kako se na učinkovit način spopadati z vse večjimi bazami podatkov, kako zaščititi poslovno-kritične informacije in ob tem ohraniti stroške na razumni ravni. Kot učinkovito orožje se je pred časom pojavila tehnologija deduplikacije, ki predstavlja enega izmed najhitreje rastočih segmentov na področju hrambe
podatkov.
Zakaj HPE StoreOnce?
Potreba po zmogljivih sistemih za shranjevanje podatkov bo naraščala tudi v prihodnje, učinkovito arhiviranje in restavriranje (»data recovery«) pa bosta nepogrešljiva procesa pri zagotavljanju varnosti in kontinuitete poslovanja. Hitrost teh procesov bo pri tem ključen parameter in njeno vrednost bistveno izboljšuje ravno deduplikacija podatkov. Le-ta datoteke razbije na manjše dele (»chunks«, »blocks«), kar pomeni, da jih je potrebno ponovno sestaviti, ko do njih dostopamo oziroma na
kakršenkoli način z njimi manipuliramo. Pri HPE StoreOnce rešitvah je dinamika restavriranja podatkov le nekoliko počasnejša, kot največja hitrost pisanja (za koli 20%), pri večini konkurenčnih rešitev pa je upočasnitev delovanja večja, saj proces zahteva določeno procesorsko moč in čas. Zakaj pa so HPE rešitve v prednosti?
Uporaba “chunking” deduplikacije
Obstajata dva pristopa k deduplikaciji, pri prvem gre za variabilni »chunking«, pri drugem pa za fiksni »chunking«. Pri slednjem se podatki delijo v segmente enake velikosti, kar pomeni, da če zaženemo proces arhiviranja, podatki pa so le malo spremenjeni, se le-ti v celoti na novo zapišejo. To se zgodi ne glede na dejstvo, da je recimo 99% neke datoteke ostalo popolnoma enake. Na ta način je delež dedupliciranih podatkov (podatkov, ki so zapisani samo enkrat) zelo skromen, diskovno polje pa
precej bolj obremenjeno. Ponudniki, ki v okviru svojih rešitev zagovarjajo fiksno deduplikacijo, lahko obljubijo samo okoli 35-odstotni prihranek prostora. HPE je ubral drugačen pristop in sicer uporablja variabilno deduplikacijo, ki podatke razbije na manjše kose, ko jih primerja s starejšimi verzijami. V tem zgornjem primeru bi se tako na novo zapisal zgolj 1 odstotek spremenjenih podatkov, 99% pa bi se jih dedupliciralo. Na ta način lahko dosežemo tudi do 20-krat učinkovitejšo
deduplikacija in seveda bistveno nižji TCO rešitve, saj potrebujemo za enako količino podatkov precej manj diskovnega prostora.
Segmenti velikosti 4k
Kot že omenjeno, uspešnost deduplikacijskih algoritmov merimo glede na zmožnost doseganja visokih deduplikacijskih razmerij. Manjši segmenti podatkov so, večji odstotek ujemanja enakih podatkov najdemo in večje je deduplikacijsko razmerje. To je seveda logično, saj lahko uspešneje iščemo ujemanje med manjšimi segmenti podatkov, kot pa velikimi. StoreOnce tehnologija uporablja 4k velike segmente, kar je najnižja vrednost med vsemi tekmeci. Za primerjavo, drugi ponudniki uporabljajo segmente
velikosti 8k, 16k ali celo 32k, zato še zdaleč v povprečju ne dosegajo tako dobrih rezultatov, saj že zelo majhno izboljšanje uspešnosti iskanja ujemanja podatkov prinese veliko boljšo stopnjo deduplikacije. Če vzamemo za primer, da se 95 odstotkov segmentov podatkov ujema, to pomeni, da smo dosegli 20x deduplikacijsko razmerje (1/(1–0,95) = 20). Če bi lahko s te osnove dosegli zgolj za 3% višje ujemanje podatkov, bi se deduplikacijsko razmerje dvignilo kar na 50x (1/(1–0,98) = 50).
Inteligentno branje in primerjanje podatkov
HPE-jeva deduplikacija ima v rokavu še dve orožji in sicer algoritma, ki jih imenujemo »Sparse Indexing« in »Contained Matching« in dodatno pripomoreta k zmogljivosti deduplikacijskih rešitev. Velja namreč splošno pravilo, da manjše, kot je potrebno število branj dejanskih podatkov, da bi ugotovili, ali se ujemajo, bolj je proces učinkovit. Z drugimi besedami, nespremenjena procesorska moč in količina spomina naprave za shranjevanje podatkov bo ob manjšem potrebnem številu branj in primerjanj
podatkov rezultirala v večjih zmogljivostih. Namesto, da bi naprava prebrala celoten segment, da bi ugotovila morebitno ujemanje podatkov, ti algoritmi zagotovijo, da se pregledujejo zgolj posamezni deli segmenta in se primerjajajo z informacijami, shranjenimi v “Sparse Index” tabeli. Iskanje po spominu je seveda veliko hitrejše, kot branje z diska. Če se ugotovi ujemanje podatkov, se ne zgodi nič, v naprotnem primeru se podatki zapišejo na disk, istočasno pa se informacija doda v indeks. To
je eden izmed pomembnejših prijemov, ki HPE rešitvam omogočajo tako dobro razmerje med ceno in zmogljivostjo. Zmogljivost rešitve je namreč vedno treba tehtati v luči cene, ki jo plača kupec. Večina organizacij tako ob planiranih investicijah vrednoti oba kriterija oziroma odnos med njima. Ena izmed HPE StoreOnce D2D rešitev se je pri tovrstnem vrednotenju izkazala z 80 odstotkov
boljšim rezultatom, kot neposredni konkurent (rezultati neodvisne raziskave Evaluator Group).
Prilagodljiva programska arhitektura
StoreOnce programska platforma je prilagodljiva in uporablja standardne protokole. Je neodvisna od datotečnega sistema, operacijskega sistema ali strojne opreme, zato jo lahko implementiramo na množico HPE strojnih in programskih produktov. Pravzaprav lahko o StoreOnce platformi govorimo kot o strategiji deduplikacije. Pri večini ostalih ponudnikih sorodne tehnologije tečejo zgolj na zaprtih oziroma specifičnih produktih in o odprtem ekosistemu sploh ne moremo govoriti.
Enostavni model licenciranja
Ena izmed primarnih namembnosti deduplikacijskih tehnologij je replikacija podatkov z namenom, da se konsolidirajo arhivske operacije in da se izboljša možnost okrevanja po katastrofičnih dogodkih. Ob tem velja omeniti Replication Manager programsko opremo za upravljanje, nadziranje in terminiranje izvedbe postopkov arhiviranja in repliciranja podatkov. Da bi bile tovrstne rešitve čimbolj enostavne in
poceni tudi za organizacije, ki so lokacjisko razpršene in podatke iz poslovnih enot replicirajo na centralno lokacijo, HP licencira omenjeno programsko orodje samo za ciljne lokacije. Replication Manager je za lokacije, od koder podatki pravzaprav izvirajo, brezplačen.
Za več informacij ali svetovanje o najprimernejši rešitvi arhiviranja ali replikacije podatkov nam pišite ali nas pokličite!