Zálohovanie údajov

z Wikipédie, slobodnej encyklopédie
(Presmerované z Záložná kópia)

V informačných technológiách je zálohovanie alebo záloha údajov kópia počítačových údajov, ktorá sa vytvorí a uloží na inom mieste, aby sa mohla použiť na obnovenie originálu po strate údajov. Slovesný tvar, ktorý sa vzťahuje na proces tohto postupu, je "zálohovať", zatiaľ čo podstatný a prídavný tvar je "zálohovanie". Zálohovanie sa môže použiť na obnovu údajov po ich strate v dôsledku vymazania alebo poškodenia údajov alebo na obnovu údajov z predchádzajúceho obdobia. Zálohovanie poskytuje jednoduchú formu obnovy po havárii; nie všetky zálohovacie systémy však dokážu obnoviť počítačový systém alebo inú zložitú konfiguráciu, ako je napríklad počítačový klaster, server Active Directory alebo databázový server.

Zálohovací systém obsahuje aspoň jednu kópiu všetkých údajov, ktoré sa považujú za hodné uloženia. Požiadavky na ukladanie údajov môžu byť veľké. Na zabezpečenie štruktúry tohto úložiska sa môže použiť model informačného úložiska. Existujú rôzne typy zariadení na ukladanie údajov, ktoré sa používajú na kopírovanie záloh údajov, ktoré sú už v sekundárnom úložisku, do archívnych súborov. Existujú aj rôzne spôsoby usporiadania týchto zariadení, ktoré zabezpečujú geografickú rozptýlenosť, bezpečnosť údajov a prenosnosť.

Údaje sa vyberajú, extrahujú a manipuluje sa s nimi na účely ukladania. Tento proces môže zahŕňať metódy práce so živými údajmi vrátane otvorených súborov, ako aj kompresiu, šifrovanie a odstraňovanie duplikácie. Ďalšie techniky sa vzťahujú na zálohovanie podnikových klientov a serverov. Schémy zálohovania môžu zahŕňať skúšobnú prevádzku, ktorá overuje spoľahlivosť zálohovaných údajov. V každej schéme zálohovania existujú obmedzenia a ľudský faktor.

Úložisko[upraviť | upraviť zdroj]

Stratégia zálohovania si vyžaduje informačné úložisko, "sekundárny úložný priestor pre údaje", ktorý zhromažďuje zálohy "zdrojov" údajov. Úložisko môže byť jednoduché ako zoznam všetkých záložných médií (DVD atď.) a dátumov ich vytvorenia alebo môže zahŕňať počítačový index, katalóg alebo relačnú databázu.

Zálohované údaje je potrebné uchovávať, čo si vyžaduje schému rotácie záloh, čo je systém zálohovania údajov na počítačové médiá, ktorý obmedzuje počet záloh rôznych dátumov uchovávaných oddelene, a to vhodným opakovaným používaním médií na uchovávanie údajov prepisovaním už nepotrebných záloh. Schéma určuje, ako a kedy sa jednotlivé vymeniteľné pamäťové médiá používajú na zálohovanie a ako dlho sa uchovávajú po tom, ako sa na neuloží záloha údajov. Pravidlo 3-2-1 môže pomôcť pri procese zálohovania. Uvádza sa v ňom, že by mali existovať aspoň 3 kópie údajov, uložené na 2 rôznych typoch pamäťových médií, a jedna kópia by mala byť uchovávaná mimo pracoviska (offsite), na vzdialenom mieste (to môže zahŕňať aj cloudové úložisko). Mali by sa používať 2 alebo viac rôznych médií, aby sa vylúčila strata údajov z podobných dôvodov (napríklad optické disky môžu znášať pobyt pod vodou, zatiaľ čo pásky LTO nie, a disky SSD nemôžu zlyhať v dôsledku nárazu čítacej/zapisovacej hlavy alebo poškodenia motora pohonu platní, pretože na rozdiel od pevných diskov nemajú žiadne pohyblivé časti). Kópia mimo pracoviska chráni pred požiarom, krádežou fyzických médií (ako sú pásky alebo disky) a prírodnými katastrofami, ako sú záplavy a zemetrasenia. Pevné disky chránené proti katastrofám, ako napríklad tie, ktoré vyrába spoločnosť ioSafe, sú alternatívou k offsite kópii, ale majú obmedzenia, ako napríklad schopnosť odolať požiaru len na obmedzený čas, takže offsite kópia stále zostáva ako ideálna voľba.

Metódy zálohovania[upraviť | upraviť zdroj]

Neštruktúrované[upraviť | upraviť zdroj]

Neštruktúrované úložisko môže byť jednoducho hromada pások, diskov DVD-R alebo externých HDD s minimálnymi informáciami o tom, čo a kedy bolo zálohované. Táto metóda je najjednoduchšia na implementáciu, ale pravdepodobne nedosiahne vysokú úroveň obnoviteľnosti, pretože jej chýba automatizácia.

Úplný/systémový obraz disku[upraviť | upraviť zdroj]

Úložisko využívajúce túto metódu zálohovania obsahuje kompletné kópie zdrojových údajov vytvorené v jednom alebo viacerých konkrétnych časových bodoch. Túto metódu kopírovania obrazov systému často používajú počítačoví technici na zaznamenávanie známych dobrých konfigurácií. Vytváranie obrazov je však vo všeobecnosti užitočnejšie ako spôsob nasadenia štandardnej konfigurácie do mnohých systémov, a nie ako nástroj na vytváranie priebežných záloh rôznych systémov.

Inkrementálne[upraviť | upraviť zdroj]

Prírastková záloha ukladá údaje zmenené od referenčného bodu v čase. Duplicitné kópie nezmenených údajov sa nekopírujú. Zvyčajne sa raz alebo v zriedkavých intervaloch vytvorí úplná záloha všetkých súborov, ktorá slúži ako referenčný bod pre prírastkové úložisko. Následne sa vykoná niekoľko prírastkových záloh po po sebe nasledujúcich časových obdobiach. Obnova sa začína poslednou úplnou zálohou a potom sa použijú prírastkové zálohy. Niektoré zálohovacie systémy dokážu vytvoriť syntetickú úplnú zálohu zo série prírastkových záloh, čím poskytujú ekvivalent častého vykonávania úplnej zálohy. Ak sa vykonáva na úpravu jedného archívneho súboru, urýchľuje to obnovu posledných verzií súborov.

Near-CDP[upraviť | upraviť zdroj]

Nepretržitá ochrana údajov (CDP) označuje zálohovanie, ktoré okamžite ukladá kópiu každej zmeny vykonanej v údajoch. Umožňuje obnovu údajov do ľubovoľného časového bodu a predstavuje najkomplexnejšiu a najpokročilejšiu ochranu údajov. Aplikácie na zálohovanie s takmer úplnou ochranou údajov - často predávané ako "CDP" - automaticky vykonávajú prírastkové zálohy v určitom intervale, napríklad každých 15 minút, jednu hodinu alebo 24 hodín. Môžu teda umožniť obnovu len do hranice intervalu. Aplikácie na zálohovanie typu Near-CDP využívajú žurnálovanie a zvyčajne sú založené na pravidelných "snímkach", kópiách údajov zmrazených v určitom časovom okamihu len na čítanie.

Near-CDP (s výnimkou Apple Time Machine) zaznamenáva každú zmenu v hostiteľskom systéme, pričom často ukladá rozdiely na úrovni bajtov alebo blokov, a nie na úrovni súborov. Táto metóda zálohovania sa od jednoduchého zrkadlenia disku líši tým, že umožňuje spätné vrátenie záznamu, a teda obnovenie starých obrazov údajov.

Near-CDP je praktickejší pre bežné osobné zálohovacie aplikácie, na rozdiel od skutočného CDP, ktorý sa musí spustiť v spojení s virtuálnym strojom alebo ekvivalentom, a preto sa zvyčajne používa v podnikových zálohách typu klient-server.

Softvér môže vytvárať kópie jednotlivých súborov, ako sú písané dokumenty, multimediálne projekty alebo používateľské vlastnosti, aby sa zabránilo tomu, že chybný zápis spôsobený výpadkom napájania, pádom operačného systému alebo vyčerpaním miesta na disku spôsobí stratu údajov. Bežnou implementáciou je pridanie prípony ".bak" k názvu súboru.

Reverzný prírastok[upraviť | upraviť zdroj]

Metóda reverzného prírastkového zálohovania ukladá "zrkadlo" zdrojových údajov v poslednom archívnom súbore a sériu rozdielov medzi "zrkadlom" v jeho aktuálnom stave a jeho predchádzajúcimi stavmi. Metóda reverzného prírastkového zálohovania sa začína úplnou zálohou bez obrazu. Po vykonaní úplnej zálohy systém pravidelne synchronizuje úplnú zálohu so živou kópiou, pričom ukladá údaje potrebné na rekonštrukciu starších verzií. Toto sa môže vykonávať buď pomocou pevných odkazov - ako to robí Apple Time Machine, alebo pomocou binárnych rozdielov.

Rozdielová[upraviť | upraviť zdroj]

Rozdielová záloha ukladá len údaje, ktoré sa zmenili od poslednej úplnej zálohy. To znamená, že na obnovu údajov sa použijú maximálne dve zálohy z úložiska. S rastúcim časom od poslednej úplnej zálohy (a teda aj s narastajúcimi zmenami údajov) sa však predlžuje aj čas na vykonanie rozdielovej zálohy. Obnovenie celého systému si vyžaduje začať od poslednej úplnej zálohy a potom použiť práve poslednú rozdielovú zálohu.

Rozdielová záloha kopíruje súbory, ktoré boli vytvorené alebo zmenené od poslednej úplnej zálohy, bez ohľadu na to, či boli odvtedy vykonané ďalšie rozdielové zálohy, zatiaľ čo prírastková záloha kopíruje súbory, ktoré boli vytvorené alebo zmenené od poslednej zálohy akéhokoľvek typu (úplnej alebo prírastkovej). Zmeny v súboroch možno zistiť prostredníctvom novšieho atribútu dátum/čas poslednej zmeny súboru a/alebo zmien vo veľkosti súboru. Medzi ďalšie varianty prírastkového zálohovania patria viacúrovňové prírastkové zálohy a prírastkové zálohy na úrovni blokov, ktoré porovnávajú časti súborov namiesto celých súborov.

Ukladacie médiá[upraviť | upraviť zdroj]

Bez ohľadu na použitý model úložiska sa údaje musia skopírovať na médium na ukladanie archívnych súborov. Použité médium sa označuje aj ako typ cieľového miesta zálohovania.

Magnetická páska[upraviť | upraviť zdroj]

Magnetická páska bola dlho najčastejšie používaným médiom na hromadné ukladanie, zálohovanie, archiváciu a výmenu údajov. V minulosti to bola lacnejšia možnosť, ale v prípade menších objemov údajov to už neplatí. Páska je médium so sekvenčným prístupom, takže rýchlosť nepretržitého zápisu alebo čítania údajov môže byť veľmi vysoká. Hoci samotné páskové médium má nízke náklady na priestor, páskové mechaniky sú zvyčajne desiatky krát drahšie ako pevné disky a optické mechaniky.

Mnohé formáty pások boli proprietárne alebo špecifické pre určité trhy, ako sú mainframy alebo konkrétna značka osobného počítača. Do roku 2014 sa hlavnou páskovou technológiou stala LTO. Ďalším zostávajúcim životaschopným "super" formátom je IBM 3592 (označovaný aj ako séria TS11xx). V roku 2016 sa prestala vyrábať páska Oracle StorageTek T10000.

Hard disk[upraviť | upraviť zdroj]

Používanie pevných diskov sa časom rozšírilo, pretože sa postupne zlacňovali. Pevné disky sa zvyčajne ľahko používajú, sú široko dostupné a prístup k nim je rýchly. Zálohy na pevných diskoch sú však mechanické zariadenia s úzkou toleranciou a môžu sa ľahšie poškodiť ako pásky, najmä pri preprave. V polovici roku 2000 začalo niekoľko výrobcov diskov vyrábať prenosné disky využívajúce technológiu rampového zaťaženia a akcelerometra (niekedy označovanú ako "senzor nárazu") a do roku 2010 priemyselný priemer pri testoch pádu diskov s touto technológiou ukázal, že disky zostali neporušené a funkčné po páde z výšky 36 palcov vo vypnutom stave na priemyselný koberec. Niektorí výrobcovia ponúkajú aj "odolné" prenosné pevné disky, ktoré obsahujú nárazuvzdorné puzdro okolo pevného disku a uvádzajú rad vyšších špecifikácií pri páde. V priebehu niekoľkých rokov je stabilita zálohovania na pevný disk kratšia ako stabilita zálohovania na pásku.

Externé pevné disky možno pripojiť prostredníctvom lokálnych rozhraní, ako sú SCSI, USB, FireWire alebo eSATA, alebo prostredníctvom technológií na dlhšie vzdialenosti, ako sú Ethernet, iSCSI alebo Fibre Channel. Niektoré diskové zálohovacie systémy prostredníctvom virtuálnych páskových knižníc alebo iným spôsobom podporujú deduplikáciu údajov, ktorá môže znížiť množstvo kapacity diskového úložiska spotrebovanej na denné a týždenné zálohovanie údajov.

Optické úložisko[upraviť | upraviť zdroj]

Optické úložisko využíva na ukladanie a načítanie údajov lasery. Zapisovateľné disky CD, DVD a Blu-ray sa bežne používajú v osobných počítačoch a sú všeobecne lacné. V minulosti boli kapacity a rýchlosti týchto diskov nižšie ako pevných diskov alebo pások, hoci pokrok v oblasti optických médií tento rozdiel pomaly zmenšuje.

Potenciálne budúce straty údajov spôsobené postupnou degradáciou médií možno predpovedať meraním miery opraviteľných drobných chýb údajov, ktorých postupný príliš veľký počet zvyšuje riziko neopraviteľných sektorov. Podpora skenovania chýb sa u jednotlivých výrobcov optických mechaník líši.

Mnohé formáty optických diskov sú typu WORM (write once read many), čo ich robí užitočnými na archivačné účely, pretože údaje sa nedajú meniť. Okrem toho optické disky nie sú náchylné na nárazy hláv, magnetizmus, hroziace vniknutie vody alebo prepätie a chyba disku zvyčajne len zastaví otáčanie.

Optické médiá sú modulárne; radič pamäte nie je viazaný na samotné médium ako pri pevných diskoch alebo pamätiach typu flash (napr. SSD), čo umožňuje jeho odstránenie a prístup prostredníctvom inej jednotky. Záznamové médiá však môžu pri dlhodobom pôsobení svetla skôr degradovať.

Niektoré systémy optického ukladania umožňujú katalogizované zálohovanie údajov bez kontaktu človeka s diskami, čo umožňuje dlhšiu integritu údajov. Francúzska štúdia z roku 2008 naznačila, že životnosť bežne predávaných diskov CD-R je 2 až 10 rokov, ale jeden výrobca neskôr odhadol životnosť svojich diskov CD-R s vrstvou so zlatým nástrekom až na 100 rokov. Vlastný optický diskový archív spoločnosti Sony môže v roku 2016 dosiahnuť rýchlosť čítania 250 MB/s.

Solid-state drive[upraviť | upraviť zdroj]

Solid-state drive (SSD) používajú na ukladanie údajov integrované obvody. Pamäť flash, flash disky, USB flash disky, CompactFlash, SmartMedia, Memory Sticks a karty Secure Digital sú vzhľadom na svoju nízku kapacitu pomerne drahé, ale vhodné na zálohovanie relatívne malých objemov údajov. Pevný disk neobsahuje žiadne pohyblivé časti, takže je menej náchylný na fyzické poškodenie, a môže mať obrovskú priepustnosť približne 500 Mbit/s až 6 Gbit/s. Dostupné SSD disky sú stále lacnejšie a majú vyššie kapacity. Zálohy na pamäť typu flash sú stabilné menej rokov ako zálohy na pevný disk.

Služba vzdialeného zálohovania[upraviť | upraviť zdroj]

Služby vzdialeného zálohovania alebo cloudové zálohovanie zahŕňajú poskytovateľov služieb, ktorí ukladajú údaje mimo pracoviska. Toto sa využíva na ochranu pred udalosťami, ako sú požiare, záplavy alebo zemetrasenia, ktoré by mohli zničiť lokálne uložené zálohy. Zálohovanie v cloude (prostredníctvom služieb, ako je Disk Google alebo podobných službám ako Disk Google a Microsoft OneDrive) poskytuje vrstvu ochrany údajov. Používatelia však musia dôverovať poskytovateľovi, že zachová súkromie a integritu ich údajov, pričom dôvernosť sa zvyšuje použitím šifrovania. Keďže rýchlosť a dostupnosť sú obmedzené online pripojením používateľa, používatelia s veľkým množstvom údajov môžu potrebovať použiť cloudové nasadzovanie a rozsiahlu obnovu.

Manažment[upraviť | upraviť zdroj]

Na správu záložných médií možno použiť rôzne metódy, ktoré zabezpečia rovnováhu medzi dostupnosťou, bezpečnosťou a nákladmi. Tieto metódy správy médií sa navzájom nevylučujú a často sa kombinujú, aby vyhovovali potrebám používateľa. Bežným príkladom je používanie on-line diskov na odkladanie údajov pred ich odoslaním do páskovej knižnice v blízkosti linky.

Online[upraviť | upraviť zdroj]

Online záložné úložisko je zvyčajne najdostupnejším typom úložiska údajov a môže začať obnovu v priebehu milisekúnd. Interný pevný disk alebo diskové pole (napr. pripojené k sieti SAN) je príkladom online zálohovania. Tento typ úložiska je pohodlný a rýchly, ale je náchylný na vymazanie alebo prepísanie, a to buď náhodou, v dôsledku škodlivého konania alebo v dôsledku vírusov, ktoré vymazávajú údaje.

Near-line[upraviť | upraviť zdroj]

Úložisko Nearline je zvyčajne menej dostupné a lacnejšie ako online úložisko, ale stále je užitočné na zálohovanie dát. Mechanické zariadenie sa zvyčajne používa na presun jednotiek médií z úložiska na jednotku, kde možno údaje čítať alebo zapisovať. Vo všeobecnosti má podobné bezpečnostné vlastnosti ako on-line úložisko. Príkladom je pásková knižnica s časom obnovy od niekoľkých sekúnd do niekoľkých minút.

Off-line[upraviť | upraviť zdroj]

Off-line úložisko si vyžaduje určitý priamy úkon na zabezpečenie prístupu k úložnému médiu: napríklad vloženie pásky do páskovej jednotky alebo pripojenie kábla. Keďže údaje nie sú prístupné prostredníctvom žiadneho počítača okrem obmedzeného obdobia, počas ktorého sa zapisujú alebo čítajú späť, sú do značnej miery odolné voči režimom zlyhania zálohovania on-line. Čas prístupu sa líši v závislosti od toho, či sa médiá nachádzajú na mieste alebo mimo neho.

Ochrana údajov mimo lokality[upraviť | upraviť zdroj]

Záložné médiá sa môžu odoslať do trezoru mimo lokality na ochranu pred katastrofou alebo iným problémom špecifickým pre lokalitu. Trezor môže byť jednoduchý ako domáca kancelária správcu systému alebo sofistikovaný ako bunker s vysokou bezpečnosťou, ktorý je odolný voči katastrofám, s regulovanou teplotou a zariadeniami na ukladanie záložných médií. Replika údajov môže byť mimo pracoviska, ale aj on-line (napr. zrkadlo RAID mimo pracoviska). Takáto replika má ako záloha pomerne obmedzenú hodnotu.

Záložné pracovisko[upraviť | upraviť zdroj]

Záložné pracovisko alebo centrum obnovy po havárii sa používa na ukladanie údajov, ktoré môžu umožniť obnovu a správnu konfiguráciu počítačových systémov a sietí v prípade havárie. Niektoré organizácie majú vlastné centrá na obnovu údajov, zatiaľ čo iné si túto činnosť objednajú u tretej strany. Vzhľadom na vysoké náklady sa zálohovanie zriedkavo považuje za uprednostňovanú metódu presunu údajov na miesto DR. Typickejším spôsobom je vzdialené zrkadlenie diskov, ktoré udržiava údaje DR čo najaktuálnejšie.

Výber a získavanie údajov[upraviť | upraviť zdroj]

Operácia zálohovania sa začína výberom a extrakciou ucelených jednotiek údajov. Väčšina údajov v moderných počítačových systémoch je uložená v samostatných jednotkách, známych ako súbory. Tieto súbory sú usporiadané do súborového systému. Rozhodovanie o tom, čo sa má v danom čase zálohovať, zahŕňa kompromisy. Zálohovaním príliš veľkého množstva nadbytočných údajov sa úložisko informácií príliš rýchlo zaplní. Zálohovanie nedostatočného množstva údajov môže nakoniec viesť k strate kritických informácií.

Súbory[upraviť | upraviť zdroj]

  • Kopírovanie súborov : Vytváranie kópií súborov je najjednoduchší a najbežnejší spôsob zálohovania. Prostriedky na vykonávanie tejto základnej funkcie sú súčasťou všetkých zálohovacích softvérov a všetkých operačných systémov.
  • Čiastočné kopírovanie súborov: Zálohovanie môže zahŕňať len bloky alebo bajty v rámci súboru, ktoré sa v danom časovom období zmenili. To môže podstatne znížiť potrebný úložný priestor, ale vyžaduje si to vyššiu náročnosť na rekonštrukciu súborov v prípade obnovy. Niektoré implementácie vyžadujú integráciu so zdrojovým súborovým systémom.
  • Vymazané súbory : Aby sa zabránilo neúmyselnému obnoveniu súborov, ktoré boli úmyselne vymazané, musí sa uchovávať záznam o vymazaní.
  • Verziovanie súborov : Väčšina aplikácií na zálohovanie, okrem tých, ktoré vykonávajú len úplné zálohovanie/zálohovanie systému, zálohuje aj súbory, ktoré boli od posledného zálohovania zmenené. "Takto môžete obnoviť mnoho rôznych verzií daného súboru a ak ho vymažete na pevnom disku, stále ho môžete nájsť vo svojom archíve [úložisku informácií]."

Súborové systémy[upraviť | upraviť zdroj]

  • Výpis súborového systému: Je možné vytvoriť kópiu celého súborového systému na úrovni blokov. Táto funkcia je známa aj ako "zálohovanie surových oddielov" a súvisí so zobrazovaním disku. Tento proces zvyčajne zahŕňa odpojenie súborového systému a spustenie programu, ako je dd (Unix). Keďže disk sa číta sekvenčne a s veľkými vyrovnávacími pamäťami, tento typ zálohovania môže byť rýchlejší ako normálne čítanie každého súboru, najmä ak súborový systém obsahuje veľa malých súborov, je veľmi fragmentovaný alebo takmer plný. Ale pretože táto metóda číta aj voľné bloky disku, ktoré neobsahujú žiadne užitočné údaje, môže byť táto metóda tiež pomalšia ako bežné čítanie, najmä keď je súborový systém takmer prázdny. Niektoré súborové systémy, ako napríklad XFS, poskytujú nástroj "dump", ktorý číta disk sekvenčne pre dosiahnutie vysokého výkonu, pričom vynecháva nepoužívané časti. Príslušný nástroj na obnovu môže selektívne obnoviť jednotlivé súbory alebo celý zväzok podľa voľby operátora.
  • Identifikácia zmien: Niektoré systémy súborov majú pre každý súbor archivačný bit, ktorý hovorí, že bol nedávno zmenený. Niektoré zálohovacie programy sa pozerajú na dátum súboru a porovnávajú ho s poslednou zálohou, aby určili, či bol súbor zmenený.
  • Verziovanie súborového systému : Verziovací súborový systém sleduje všetky zmeny súboru. Príkladom je verzionovací súborový systém NILFS pre Linux.

Živé dáta[upraviť | upraviť zdroj]

Aktívne aktualizované súbory (napr. súbory databáz) predstavujú problém pri zálohovaní. Jedným zo spôsobov zálohovania živých údajov je ich dočasné vypnutie (napr. zatvorenie všetkých súborov), vytvorenie "snímky" a následné obnovenie živých operácií. V tomto okamihu je možné snímku zálohovať bežnými metódami." Snímka je okamžitá funkcia niektorých súborových systémov, ktorá predstavuje kópiu súborového systému, ako keby bola zmrazená v určitom časovom okamihu, často pomocou mechanizmu kopírovania pri zápise. Snímkovanie súboru počas jeho zmeny vedie k poškodeniu súboru, ktorý je nepoužiteľný. Takýto prípad sa vyskytuje aj vo vzájomne prepojených súboroch, s čím sa možno stretnúť v bežnej databáze alebo v aplikáciách, ako je napríklad Microsoft Exchange Server. Termínom fuzzy backup (rozmazaná záloha) možno označiť zálohu živých dát, ktorá sa tvári, akoby prebehla správne, ale nereprezentuje stav dát v jednom časovom bode.

Medzi možnosti zálohovania dátových súborov, ktoré sa nedajú alebo nedajú utíšiť, patria:

  • Zálohovanie otvorených súborov: Mnohé softvérové aplikácie na zálohovanie sa zaväzujú zálohovať otvorené súbory v interne konzistentnom stave. Niektoré aplikácie jednoducho kontrolujú, či sa otvorené súbory používajú, a skúsia to neskôr. Iné aplikácie vylučujú otvorené súbory, ktoré sa veľmi často aktualizujú. Niektoré interaktívne aplikácie s nízkou dostupnosťou sa môžu zálohovať prostredníctvom prirodzeného/vyvolaného pozastavenia.
  • Zálohovanie vzájomne prepojených databázových súborov: Niektoré systémy vzájomne prepojených databázových súborov ponúkajú prostriedky na vytvorenie "horúcej zálohy" databázy, kým je online a použiteľná. To môže zahŕňať snímku dátových súborov plus snímku denníka zmien vykonaných počas zálohovania. Pri obnove sa použijú zmeny v súboroch denníka, aby sa kópia databázy dostala do časového bodu, v ktorom sa skončila pôvodná záloha." Ostatné interaktívne aplikácie s nízkou dostupnosťou sa môžu zálohovať prostredníctvom koordinovaných snímok. Interaktívne aplikácie so skutočne vysokou dostupnosťou sa však dajú zálohovať len prostredníctvom priebežnej ochrany údajov.

Metadáta[upraviť | upraviť zdroj]

Nie všetky informácie uložené v počítači sú uložené v súboroch. Presné obnovenie celého systému od začiatku si vyžaduje sledovanie aj týchto nesúborových údajov.

  • Popis systému: V prípade, že sa systém nachádza v počítači, je potrebné, aby sa v ňom nachádzali všetky súbory: Špecifikácie systému sú potrebné na obstaranie presnej náhrady po havárii.
  • Boot sektor : Boot sektor sa dá niekedy obnoviť jednoduchšie ako jeho uloženie. Zvyčajne to nie je bežný súbor a systém sa bez neho nespustí.
  • Partition: Rozloženie pôvodného disku, ako aj tabuľky oddielov a nastavenia súborového systému sú potrebné na správne obnovenie pôvodného systému.
  • Metadáta súborov : Oprávnenia každého súboru, vlastník, skupina, ACL a všetky ostatné metadáta musia byť zálohované, aby bolo možné správne obnoviť pôvodné prostredie.
  • Systémové metadáta: Rôzne operačné systémy majú rôzne spôsoby ukladania konfiguračných informácií. Systém Microsoft Windows uchováva register systémových informácií, ktorý je ťažšie obnoviť ako typický súbor.

Manipulácia s údajmi a optimalizácia súboru údajov[upraviť | upraviť zdroj]

Často je užitočné alebo potrebné manipulovať so zálohovanými údajmi s cieľom optimalizovať proces zálohovania. Tieto manipulácie môžu zvýšiť rýchlosť zálohovania, rýchlosť obnovy, bezpečnosť údajov, využitie médií a/alebo znížiť požiadavky na šírku pásma.

Automatizované spracovanie údajov[upraviť | upraviť zdroj]

Neaktuálne údaje sa môžu automaticky vymazať, ale v prípade osobných zálohovacích aplikácií - na rozdiel od podnikových zálohovacích aplikácií typu klient-server, kde sa automatické "ošetrovanie" údajov dá prispôsobiť - sa vymazávanie môže nanajvýš globálne oddialiť alebo vypnúť.

Kompresia[upraviť | upraviť zdroj]

Na zmenšenie veľkosti zdrojových údajov, ktoré sa majú uložiť, aby sa využilo menej úložného priestoru, možno použiť rôzne schémy. Kompresia je často zabudovanou funkciou hardvéru páskovej jednotky.

Deduplikácia[upraviť | upraviť zdroj]

Redundanciu spôsobenú zálohovaním podobne nakonfigurovaných pracovných staníc možno znížiť, a tak uložiť len jednu kópiu. Túto techniku možno použiť na úrovni súborov alebo surových blokov. Toto potenciálne veľké zníženie objemu Môže k nej dôjsť na serveri pred presunom akýchkoľvek údajov na záložné médium, niekedy sa označuje ako deduplikácia na strane zdroja/klienta. Tento prístup tiež znižuje šírku pásma potrebnú na odoslanie záložných údajov na cieľové médium. Tento proces môže prebiehať aj na cieľovom úložnom zariadení, niekedy sa označuje ako inline alebo back-end deduplikácia.

Duplikácia[upraviť | upraviť zdroj]

Niekedy sa zálohy duplikujú na druhú sadu pamäťových médií. Môže sa to urobiť s cieľom zmeniť usporiadanie archívnych súborov, aby sa optimalizovala rýchlosť obnovy, alebo aby sa druhá kópia nachádzala na inom mieste alebo na inom pamäťovom médiu - ako je to v prípade možnosti zálohovania z disku na pásku v systéme Enterprise client-server.

Šifrovanie[upraviť | upraviť zdroj]

Veľkokapacitné vymeniteľné pamäťové médiá, ako sú záložné pásky, predstavujú riziko pre bezpečnosť údajov v prípade ich straty alebo krádeže. Šifrovanie údajov na týchto médiách môže tento problém zmierniť, avšak šifrovanie je proces náročný na procesor, ktorý môže spomaliť rýchlosť zálohovania, a bezpečnosť šifrovaných záloh je len taká účinná, aká je bezpečnosť politiky správy kľúčov.

Multiplexing[upraviť | upraviť zdroj]

Ak je počítačov, ktoré sa majú zálohovať, oveľa viac ako cieľových úložných zariadení, môže byť užitočná možnosť použiť jedno úložné zariadenie s niekoľkými súčasnými zálohami. Avšak preplnenie okna plánovaného zálohovania prostredníctvom "multiplexovaného zálohovania" sa používa len pre páskové cieľové zariadenia.

Refactoring[upraviť | upraviť zdroj]

Proces zmeny usporiadania súborov záloh v archívnom súbore sa nazýva refaktorovanie. Ak napríklad zálohovací systém používa každý deň jednu pásku na uloženie prírastkových záloh pre všetky chránené počítače, obnovenie jedného z počítačov by mohlo vyžadovať mnoho pások. Refaktorizácia by sa mohla použiť na konsolidáciu všetkých záloh pre jeden počítač na jednu pásku, čím by sa vytvorila "syntetická úplná záloha". To je užitočné najmä pre zálohovacie systémy, ktoré robia prírastkové zálohy v štýle forever.

Staging[upraviť | upraviť zdroj]

Niekedy sa zálohy pred kopírovaním na pásku kopírujú na záložný disk. Tento proces sa niekedy označuje ako D2D2T, čo je skratka pre Disk-to-disk-to-tape. Môže byť užitočný, ak je problém so zladením rýchlosti konečného cieľového zariadenia so zdrojovým zariadením, s čím sa často stretávame v sieťových zálohovacích systémoch. Môže tiež slúžiť ako centralizované miesto na použitie iných techník manipulácie s údajmi.

Ciele[upraviť | upraviť zdroj]

  • Cieľ bodu obnovy (RPO): Bod v čase, ktorý bude reflektovať reštartovaná infraštruktúra, vyjadrený ako "maximálna cieľová doba, počas ktorej by mohlo dôjsť k strate údajov (transakcií) zo služby IT v dôsledku závažného incidentu". V podstate ide o spätný nábeh, ku ktorému dôjde v dôsledku obnovy. Najžiadanejším RPO by bol bod tesne pred udalosťou straty údajov. Aby bolo možné dosiahnuť novší bod obnovy, je potrebné zvýšiť frekvenciu synchronizácie medzi zdrojovými údajmi a záložným úložiskom.
  • Cieľ času obnovy (RTO): Čas, ktorý uplynie medzi haváriou a obnovením firemných funkcií.
  • Bezpečnosť údajov: Okrem zachovania prístupu k údajom pre ich vlastníkov je potrebné obmedziť prístup k údajom pred neoprávneným prístupom. Zálohovanie sa musí vykonávať spôsobom, ktorý neohrozí podnik pôvodného vlastníka. To sa dá dosiahnuť šifrovaním údajov a správnymi zásadami zaobchádzania s médiami.
  • Doba uchovávania údajov: Predpisy a politiky môžu viesť k situáciám, keď sa očakáva, že zálohy sa budú uchovávať počas určitého obdobia, ale nie ďalej. Uchovávanie záloh po uplynutí tohto obdobia môže viesť k neželanej zodpovednosti a neoptimálnemu využívaniu pamäťových médií.
  • Overenie kontrolného súčtu alebo hashovacej funkcie: Aplikácie, ktoré zálohujú archívne súbory na pásku, potrebujú túto možnosť na overenie, či boli údaje presne skopírované.
  • Monitorovanie procesu zálohovania: Podnikové aplikácie na zálohovanie typu klient-server potrebujú používateľské rozhranie, ktoré umožňuje správcom monitorovať proces zálohovania a preukázať súlad s predpismi regulačným orgánom mimo organizácie; napríklad poisťovňa v USA môže byť podľa zákona HIPAA povinná preukázať, že údaje jej klientov spĺňajú požiadavky na uchovávanie záznamov.
  • Zálohovanie a obnovenie iniciované používateľom : Aby sa predišlo menším katastrofám, ako je neúmyselné vymazanie alebo prepísanie "dobrých" verzií jedného alebo viacerých súborov, alebo aby sa z nich zotavil, môže používateľ počítača - a nie správca - iniciovať zálohovanie a obnovu (nie nevyhnutne z poslednej zálohy) súborov alebo priečinkov.

Referencie[upraviť | upraviť zdroj]

Tento článok je čiastočný alebo úplný preklad článku Backup na anglickej Wikipédii.