Bloková, objektová a souborová storage: rozdíly, výběr a případy užití

Tři varianty úložišť, které nejčastěji soupeří o přízeň uživatelů. Každá z nich mé své výhody i limity. Proč jsou bloky nejlepší pro databáze, objekty pro zálohy a soubory ke sdílení dat? Shrnujeme v tomto článku.

Knihovna se šanony
VERONIKA JAKUBOVÁ
  • VERONIKA JAKUBOVÁ

  • 12. 01. 2022
  • 8 min čtení
Zkopirovat do schránky

Podrobný rozbor externích datových úložišť najdete v článku NAS, SAN a DAS: Čím se od sebe liší datová úložiště. Jednotlivé typy storage se ale rozlišují i podle formátu, v jakém data ukládají.

V tomto ohledu se lze poslední dobou často setkat s pojmem cloud storage, což je v podstatě označení pro virtuální variantu úložiště, která je flexibilnější, lépe se škáluje a díky redundanci a distribuci dat je rovněž odolnější vůči selhání. De facto jde o podobné benefity, jakými se chlubí i samotný cloud.

Varianty úložišť, rozlišené podle formátu ukládaných dat, jsou tři: bloková, objektová a souborová (file) storage. Každá se přitom hodí pro jiné účely a některé jde i dost dobře kombinovat.

Flexibilní úložiště Ceph

Široké možnosti konfigurace a eliminaci rizika nedostupnosti poskytuje softwarově definované úložiště Ceph, které se vyznačuje vysokou durabilitou dat. V rámci pronájmu od MasterDC navíc neplatíte za requesty. Využít ho můžete jako blokovou RBD storage nebo objektovou storage s Amazon S3.

Více o Ceph storage

Bloková storage

Bloková storage představuje nejsyrovější formu úložiště. Data ukládá ve formě bloků, z nichž každý nese vlastní identifikátor, který slouží k zapisování a zpětnému čtení dat. Jednotlivé bloky přitom neobsahují metadata.

Systém blokových úložišť je nakonfigurovaný tak, že bloky dat zcela odděluje od uživatelského prostředí. Díky tomu s nimi může nakládat podle potřeb a umisťovat je nezávisle na sobě do různých prostředí, jeden např. do Linuxu a druhý do Windows. K datovým blokům pak nevede pouze jedna cesta, jako je tomu u souborových úložišť (viz níže). Když si uživatel vyžádá zobrazení dat, software úložiště je znovu sestaví do původní podoby právě na základě identifikátoru.

Nezávislost na jediné přístupové cestě zajišťuje i snadnou správu a téměř neomezené možnosti konfigurace dat. Bloková forma ukládání dat zobrazuje data na vyžádání uživatele rychle a s nízkou latencí, což je důležité např. pro aplikace klíčové pro provoz firmy. Blokového úložiště je výchozí pro pevný disk a obvykle se nasazuje v SAN (Storage Area Network), přičemž musí být vázáno na funkční server.

Vhodná využití blokové storage

  • Databáze – data uložená v blocích se rychle aktualizují a díky nízké latenci k nim lze dobře přistupovat.
  • Business-critical aplikace – bloková storage se vyznačuje spolehlivostí a vysokým výkonem, proto je ideální právě k ukládání aplikačních dat, bez kterých se firma neobejde.
  • Mail servery – i pro ty je důležitý vysoký výkon úložiště, a tak je pro ně bloková storage častým řešením.
  • Úložiště VMFS svazků – vysoce výkonný proprietární souborový systém VMFS je určený k provozu virtuálních strojů ve škálovatelném prostředí a umožňuje sdílet soubory pomocí nativního operačního systému. K nasazení VMFS se právě často využívá bloková storage, k datům se pak přistupuje přes protokoly SCSI, Fibre Channel nebo FCoE.

Bloková storage se hodí pro práci s velkými datovými objemy, nejde v ní ale detailně vyhledávat. To může být pro někoho nevýhodou. Tou další jsou omezené schopnosti zpracování metadat, jimiž se pak musí zabývat vývojáři nebo administrátoři už na aplikační úrovni, což je práce navíc. Minus blokového úložiště představuje i vyšší cena.

Objektová storage

Objektové úložiště je naopak ideální pro práci s metadaty. Data rozděluje do samostatných jednotek, objektů, které jsou uloženy nestrukturovaně bez jakékoli organizace a hierarchie. Objekty jsou navíc uchovávány na jednom místě, nejsou tedy rozdistribuovány do složek (jako je tomu u souborových úložišť) nebo mezi servery (případ blokové storage).

V takto „neuspořádaném“ systému není jednoduché objekty najít, proto mají, podobně jako bloky u blokové storage, svůj vlastní identifikátor v podobě 128bitového čísla. Identifikátor se označuje jako UUID (Universally Unique Identifier) nebo GUID (Globally Unique Identifier). Číselné kombinace univerzálního identifikátoru jsou natolik složité, že pravděpodobnost jejich duplicity je velmi nízká, a proto je lze považovat za jedinečné.

Každý objekt se svým identifikátorem obsahuje na rozdíl od blokového úložiště i všechna metadata (např. kde a kdy byla pořízena fotka), která daný soubor specifikují a pomáhají při jeho zpracování. Díky kombinaci ukládání metadat a unikátního identifikátoru jde v objektové storage detailně vyhledávat a spravovat i nestrukturovaná data.

Data ve formě objektů mohou být ukládána lokálně, na pevných discích nebo v cloudovém úložišti. Nepřistupuje se k nim přes operační systém jako v případě souborové a blokové storage, ale prostřednictvím HTTP REST API (Application Programming Interface). API umožňuje správu v grafickém rozhraní s několika typy úkonů – nahrávání dat, jejich stažení, úprava nebo odstranění. Pro objektovou storage se ještě kromě nativního API typu HTTP používá i S3 API od Amazonu a podporuje ho většina dostupných objektových úložišť.

Vhodná využití objektové storage

  • Zálohování – nevyžaduje vysoký výkon, přitom nabízí široké možnosti škálování. Je proto ideální pro ukládání dat, k nimž je potřeba přistupovat nepravidelně či ojediněle.
  • Multimediální soubory – ukládání a zejména archivace těchto typů dat rovněž nejsou závislé na výkonu. Při obnově některých částí dat se ale může hodit robustnější systém vyhledávání, který objektové úložiště poskytuje.
  • Archivace dat – struktura úložiště, cenová dostupnosti, možnosti šlákování a oba výše zmíněné use-case napovídají, že objektová storage je ideální právě i pro uchování dat, k nimž se běžně nepřistupuje.

Kvůli pomalejšímu výkonu si objektová storage příliš nerozumí s tradičními databázemi. Data totiž zapisuje pomalu, a navíc je v souvislosti s typem přístupu přes API nedokáže uzamknout. Přístup přes API komplikuje i fakt, že napsat aplikaci k tomuto účelu není tak jednoduché, jako je třeba použití souborového úložiště. Nevýhodu představuje i neměnnost již vytvořených objektů. Část souboru z jednoho svazku nejde upravit a musí se vytvořit zcela nový objekt.

Souborová storage

Souborovou, neboli file storage, používá denně téměř každý. Je to systém ukládání dat známý z osobních počítačů. Data se ukládají do různých složek, jsou odlišeny typem přípony (.txt, .png,…) v logické hierarchii a přistupuje se k nim pouze jedinou cestou. Ta může být leckdy dlouhá v závislosti na stupni zanoření. Jde tedy o zcela odlišný systém organizace dat než u blokové či objektové storage.

Schéma blokového, souborového a objektového ukládání dat
Schéma architektury blokového, souborového a objektového ukládání dat. Zdroj: blog.scaleway.com

Souborové úložiště pracuje s metadaty, ale jen do jisté míry. Vyhledávání není natolik komplexní jako u objektové storage, přesto se v něm dá dobře orientovat pomocí názvů složek a podsložek. Většina uživatelů používá k ukládání a manipulaci se soubory jednoduché nástroje, kupříkladu Správce souborů (File Manager).

Struktura úložiště a přístup k němu umožňuje práci na jednotlivých souborech několika uživatelům najednou. Souborový systém si poradí s různými verzemi a aktualizacemi podle toho, jaká oprávnění k provádění změn mají přidělena různí uživatelé.

K ukládání souborů na server i jejich sdílení s dalšími zařízeními dochází přes protokoly SMB (Server Message Block) ve Windows a NFS (Network File System) v Linuxu. Souborovou storage jde využít na pevných discích, pro NAS, cloudové systémy úložišť, síťové disky nebo flash disky.

Vhodná využití souborové storage

  • Zálohování a obnova – cloudová úložiště a externí datová úložiště obvykle používají souborové systémy k uchování nejnovějších kopií dat.
  • Archivace – u souborových úložišť jde nastavit oprávnění pro různé soubory, což omezuje přístup k určitým datům. Hodí se proto pro archivaci dat citlivé povahy, na něž jsou kladeny specifické požadavky třeba z hlediska legislativy.
  • Sdílení souborů – při využití v cloudu nebo v rámci úložiště v místní síti (LAN) lze na dokumentech a souborech spolupracovat hned z několika zařízení. Při takové spolupráci může docházet k vzájemnému přepisování upravených verzí, čemuž se dá předejít vytvořením systému verzování nebo použitím software pro tyto účely.

Organizace souborů je přehledná a praktická pro práci s malým množstvím dat, ve větším množství souborů se dá ale snadno ztratit, a o to hůř vyhledávat. Souborová storage se příliš nehodí ani pro nestrukturovaná data. Problémem je i její omezená kapacita. Úložiště jde rozšířit jen přidáním dalšího systému, nikoli škálováním.

Přehledné srovnání úložišť

Typ úložiště Výhody Nevýhody Ideální use-case
Bloková storage nezávislost na prostředí; rychlé zobrazení; vysoký výkon; široké možnosti konfigurace; škálování; zvládá větší datové objemy neumožňuje vyhledávání; nezpracovává metadata; vyšší cena databáze; aplikace klíčové pro provoz; úložiště VMFS
Objektová storage uchovává velké množství metadat; detailní vyhledávání; dobré možnosti škálování; správa nestrukturovaných dat; cenově dostupné nižší výkon a úroveň zabezpečení; neměnnost vytvořených objektů zálohování, obnova dat a archivace; úložiště pro multimediální soubory a větší datové objemy
Souborová storage snadné použití; přehledná organizace dat a vyhledávání; možnost sdílení souborů; pracuje s metadaty (ne tolik jako objektová storage) s větším množstvím dat ztrácí přehlednost; omezená kapacita (nejde škálovat); nevhodná pro nestrukturovaná data zálohování, obnova a archivace; sdílené dokumenty mezi několika uživateli/odděleními

Z tabulky je jasné, že každá storage má svá pro i proti a každá si najde jiného uživatele či zákazníka. Řídit se obecnými radami se v tomto případě, stejně jako v mnoha jemu podobných, úplně nevyplatí. Pro některé databáze třeba může být naopak vhodnější souborové úložiště než to blokové. Skutečně záleží na konkrétním případu.

Výše uvedené příklady slouží jen pro lepší představu. Pokud zrovna přemýšlíte nad novým úložištěm a nevíte, které by pro vás bylo nejpraktičtější, doporučujeme to probrat s někým, kdo už pár typů úložišť vyzkoušel, pracuje s nimi a ví, co bude nejlépe fungovat zrovna vám.

Kromě způsobu ukládání dat je pro výběr důležitá i architektura storage. V současné době nabývá na popularitě softwarově definovaná storage (SDS), která poskytuje větší flexibilitu a škálovatelnost než hardwarová řešení. V MasterDC najdete tradiční varianty v podobně storage serveru, Ceph storage, která zajišťuje vysokou durabilitu datDurabilita datDurabilita dat (data durability) znamená trvanlivost dat, respektive jejich konzistentnost a odolnost v časevíce, nebo robustní objektovou storage vSAN. V případě potřeby vám s výběrem poradíme.

Líbil se vám článek? Ano / Ne