logo-print

HP StoreOnce deduplikacija podatkov

Količina podatkov vseskozi narašča, čemur ni videti konca. Informatiki se vse od začetkov shranjevanja digitalnih podatkov srečujejo z dilemo, kako se na učinkovit način spopadati z vse večjimi bazami, kako zaščititi poslovno-kritične informacije in ob tem ohraniti stroške na razumni ravni. Kot učinkovito orožje se je v zadnjem času pojavila tehnologija deduplikacije, ki predstavlja enega izmed najhitreje rastočih segmentov na področju shranjevanja podatkov. Izsledki raziskave, ki jo je nedavno izvedel portal SearchStorage, kažejo, da več kot polovica poslovnih uporabnikov vrednoti rešitve različnih ponudnikov in razmišlja o njihovi uvedbi.

Zakaj HP StoreOnce?

Potreba po zmogljivih sistemih za shranjevanje podatkov bo naraščala tudi v prihodnje, učinkovito arhiviranje in restavriranje (»data recovery«) pa bosta nepogrešljiva procesa pri zagotavljanju varnosti in kontinuitete poslovanja. Hitrost teh procesov bo pri tem ključen parameter in njeno vrednost bistveno izboljšuje ravno deduplikacija podatkov. Le-ta datoteke razbije na manjše dele (»chunks«, »blocks«), kar pomeni, da jih je potrebno ponovno sestaviti, ko do njih dostopamo oziroma na kakršenkoli način z njimi manipuliramo. Pri HP StoreOnce rešitvah je dinamika restavriranja podatkov le nekoliko počasnejša, kot največja hitrost pisanja (za koli 20%), pri večini konkurenčnih rešitev pa je upočasnitev delovanja večja, saj proces zahteva določeno procesorsko moč in čas. Zakaj pa so HP rešitve v prednosti?

Uporaba “chunking” deduplikacije

Obstajata dva pristopa k deduplikaciji, pri prvem gre za variabilni »chunking«, pri drugem pa za fiksni »chunking«. Pri slednjem se podatki delijo v segmente enake velikosti, kar pomeni, da če zaženemo proces arhiviranja, podatki pa so le malo spremenjeni, se le-ti v celoti na novo zapišejo. To se zgodi ne glede na dejstvo, da je recimo 99% neke datoteke ostalo popolnoma enake. Na ta način je delež dedupliciranih podatkov (podatkov, ki so zapisani samo enkrat) zelo skromen, diskovno polje pa precej bolj obremenjeno. Ponudniki, ki v okviru svojih rešitev zagovarjajo fiksno deduplikacijo, lahko obljubijo samo okoli 35-odstotni prihranek prostora. HP je ubral drugačen pristop in sicer uporablja variabilno deduplikacijo, ki podatke razbije na manjše kose, ko jih primerja s starejšimi verzijami. V tem zgornjem primeru bi se tako na novo zapisal zgolj 1 odstotek spremenjenih podatkov, 99% pa bi se jih dedupliciralo. Na ta način lahko dosežemo tudi do 20-krat učinkovitejšo deduplikacija in seveda bistveno nižji TCO rešitve, saj potrebujemo za enako količino podatkov precej manj diskovnega prostora.

Segmenti velikosti 4k

Kot že omenjeno, uspešnost deduplikacijskih algoritmov merimo glede na zmožnost doseganja visokih deduplikacijskih razmerij. Manjši segmenti podatkov so, večji odstotek ujemanja enakih podatkov najdemo in večje je deduplikacijsko razmerje. To je seveda logično, saj lahko uspešneje iščemo ujemanje med manjšimi segmenti podatkov, kot pa velikimi. StoreOnce tehnologija uporablja 4k velike segmente, kar je najnižja vrednost med vsemi tekmeci. Za primerjavo, drugi ponudniki uporabljajo segmente velikosti 8k, 16k ali celo 32k, zato še zdaleč v povprečju ne dosegajo tako dobrih rezultatov, saj že zelo majhno izboljšanje uspešnosti iskanja ujemanja podatkov prinese veliko boljšo stopnjo deduplikacije. Če vzamemo za primer, da se 95 odstotkov segmentov podatkov ujema, to pomeni, da smo dosegli 20x deduplikacijsko razmerje (1/(1–0,95) = 20). Če bi lahko s te osnove dosegli zgolj za 3% višje ujemanje podatkov, bi se deduplikacijsko razmerje dvignilo kar na 50x (1/(1–0,98) = 50).

Inteligentno branje in primerjanje podatkov

HP-jeva deduplikacija ima v rokavu še dve orožji in sicer algoritma, ki jih imenujemo »Sparse Indexing« in »Contained Matching« in dodatno pripomoreta k zmogljivosti deduplikacijskih rešitev. Velja namreč splošno pravilo, da manjše, kot je potrebno število branj dejanskih podatkov, da bi ugotovili, ali se ujemajo, bolj je proces učinkovit. Z drugimi besedami, nespremenjena procesorska moč in količina spomina naprave za shranjevanje podatkov bo ob manjšem potrebnem številu branj in primerjanj podatkov rezultirala v večjih zmogljivostih. Namesto, da bi naprava prebrala celoten segment, da bi ugotovila morebitno ujemanje podatkov, ti algoritmi zagotovijo, da se pregledujejo zgolj posamezni deli segmenta in se primerjajajo z informacijami, shranjenimi v “Sparse Index” tabeli. Iskanje po spominu je seveda veliko hitrejše, kot branje z diska. Če se ugotovi ujemanje podatkov, se ne zgodi nič, v naprotnem primeru se podatki zapišejo na disk, istočasno pa se informacija doda v indeks. To je eden izmed pomembnejših prijemov, ki HP rešitvam omogočajo tako dobro razmerje med ceno in zmogljivostjo. Zmogljivost rešitve je namreč vedno treba tehtati v luči cene, ki jo plača kupec. Večina organizacij tako ob planiranih investicijah vrednoti oba kriterija oziroma odnos med njima. Ena izmed HP StoreOnce D2D rešitev se je pri tovrstnem vrednotenju izkazala z 80 odstotkov boljšim rezultatom, kot neposredni konkurent (rezultati neodvisne raziskave Evaluator Group).

StoreOnce D2D rešitve

StoreOnce D2D rešitve je mogoče aplikacijam za arhiviranje podatkov predstaviti kot virtualne tračne enote ali pa kot NAS diskovje, pri tem pa podpirajo tako Fibre Channel (FC) kot iSCSI protokola. Pri vsem tem je ključnega pomena enostavnost upravljanja, zato StoreOnce D2D rešitve tako kot strežniško opremo brez težav upravljamo kar s HP Systems Insight Manager (SIM) in Integrated Lights-Out 2 (iLO2) orodji. Čeprav se to morda zdi nekaj samoumevnega, lahko to ponudijo le redki ponudniki.

Prilagodljiva programska arhitektura

StoreOnce programska platforma je prilagodljiva in uporablja standardne protokole. Je neodvisna od datotečnega sistema, operacijskega sistema ali strojne opreme, zato jo lahko implementiramo na množico HP strojnih in programskih produktov. Pravzaprav lahko o StoreOnce platformi govorimo kot o strategiji deduplikacije. Pri večini ostalih ponudnikih sorodne tehnologije tečejo zgolj na zaprtih oziroma specifičnih produktih in o odprtem ekosistemu sploh ne moremo govoriti.

Enostavni model licenciranja

Ena izmed primarnih namembnosti deduplikacijskih tehnologij je replikacija podatkov z namenom, da se konsolidirajo arhivske operacije in da se izboljša možnost okrevanja po katastrofičnih dogodkih. Ob tem velja omeniti HP Replication Manager programsko opremo za upravljanje, nadziranje in terminiranje izvedbe postopkov arhiviranja in repliciranja podatkov. Da bi bile tovrstne rešitve čimbolj enostavne in poceni tudi za organizacije, ki so lokacjisko razpršene in podatke iz poslovnih enot replicirajo na centralno lokacijo, HP licencira omenjeno programsko orodje samo za ciljne lokacije. Replication Manager je za lokacije, od koder podatki pravzaprav izvirajo, brezplačen.

Za več informacij ali svetovanje o najprimernejši rešitvi arhiviranja ali replikacije podatkov nas kontaktirajte preko kontaktnega obrazca.

 

Vprašajte nas!

Kontaktirajte nas, zahtevajte ponudbo ali servisni zahtevek prek kontaktnega obrazca in odgovorili vam bomo kar najhitreje!

Prejmite obvestila