Малий і середній бізнес у нашій країні є двигуном економіки. І часто ключову роль успішності такого бізнесу відіграє грамотна відмовостійка архітектура ІТ компаній. Іншим наріжним каменем ІТ-відділів невеликих компаній є бюджети, які, як правило, невеликі та/або постійно скорочуються. Тому ІТ-керівники мають постійно розв'язувати проблеми, пов'язані зі збільшенням обсягу роботи, скороченням людських ресурсів, зменшенням бюджетів на «залізну» і «софтверну» частини тощо. Єдиний спосіб подолати ці труднощі - обирати ефективніші рішення, тобто отримати більше за свої гроші і купувати інструменти, які дають змогу одному ІТ-ресурсу зробити більше за відведений йому робочий час.
Крім розв'язання проблем із бюджетом, сучасні ІТ-адміністратори, особливо ІТ-фахівці загального профілю, мають купувати продукти/рішення, які допоможуть їм розібратися з дедалі складнішими інфраструктурами. Багато чого з того, що зараз роблять ІТ-адміністратори, перебуває на межі можливостей фізичного адміністратора, і що більше рішення для зберігання даних може зробити для адміністратора, то краще він зможе розподілити свій час між усіма завданнями.
Таким недорогим, простим, а найголовніше продуктивним рішенням є система зберігання від компанії НРЕ-MSA. Яка нещодавно оновила свій модельний ряд і випустила вже 7-ме покоління цієї СЗД.



З 2008 року архітектура HP/HPE MSA зазнала значних змін. Однак багато її основних характеристик залишилися незмінними: два контролери, базовий корпус/шасі з дисками залишився заввишки 2U, розширення завдяки дисковим SAS-полицям 2U, співпроцесор ASIC (RAID) у кожному контролері та приголомшлива продуктивність за умови центрального процесора початкового рівня та невеликого об'єму кешу в кожному з контролерів.

При цьому основні принципи роботи HPE MSA не змінилися: простота, швидкість і доступність. Це ті самі основні принципи, яких дотримуються з моменту своєї появи.

Архітектура контролерів у HPE MSA

Системи зберігання даних HPE MSA забезпечують повне резервування в разі відмови різних компонентів. Для забезпечення високої доступності та продуктивності кожен контролер масиву HPE MSA містить свій власний набір апаратних засобів, включно з:

Фронт-енд порти: Fibre Channel, або iSCSI, або SAS.
Порти керування: Ethernet і USB.
Контролер зберігання (SC).
Контролер управління (MC).
Пам'ять/кеш.
Внутрішнє резервне живлення або суперконденсатор.
Енергонезалежна вбудована карта пам'яті (незнімна) eMMC.


Кожен контролер HPE MSA керується двома логічними субконтролерами: контролером зберігання (SC) і контролером керування (MC). Ці контролери незалежні один від одного і складаються з безлічі підсистем, що забезпечують допоміжне під'єднання і функції. SC відповідає за фізичне переміщення даних, а також за контроль їхньої цілісності. Контролер зберігання даних (SC) складається з SAS контролерів та інших подібних низькорівневих систем і містить специфічну для застосунків інтегральну схему - ASIC для використання/обчислень функцій RAID. Цей спеціалізований ASIC підтримує високий рівень продуктивності HPE MSA навіть під час опрацювання складних алгоритмів, наприклад, тих, що використовуються в RAID 6 і MSA-DP+. На контролері управління (MC) працює утиліта HPE MSA Storage Management Utility (SMU), доступ до якої здійснюється через веб-браузер за протоколом HTTP/HTTPS або через інтерфейс командного рядка (CLI), за протоколом SSH.

Контролер управління (MC) працює незалежно від основного трафіку з даними і відповідає за роботу протоколу SNMP та інших міжсистемних комунікацій. Для забезпечення відмовостійкості кожен контролер запускає свій екземпляр SMU, а міжконтролерний зв'язок (PCIe) здійснюється через пасивну сполучну панель (midplane), завдяки чому інформація про конфігурацію підтримується актуальною на обох контролерах.
Важливо! Поширена помилкова думка, що кількість кеш-пам'яті контролера безпосередньо залежить від загальної продуктивності системи. Хоча це може бути справедливо для деяких архітектур СХД, але це не так для HPE MSA, яка включає як було описано вище ASIC, призначений для RAID, щоб центральний процесор загального призначення був вільний для обробки інших завдань, наприклад, таких як відстеження метаданих та інших. Скорочення ресурсів, необхідних RAID, також зменшує обсяг кешу, який буде необхідний роботи з більш високої інтенсивністю навантаження. Тому сумарна кількість кешу у цій системі становить лише 48ГБ.

Бекенд-енд порти SAS у HPE MSA
Контролери систем зберігання HPE MSA взаємодіють з усіма внутрішніми дисками та під'єднаними дисковими полицями розширення через інтерфейс SAS 12 Гб. Отже, кожен контролер HPE MSA має одну смугу 12 Гб, виділену для кожного внутрішнього диска, і під'єднується до дискових полиць розширення через чотирьохсмугове з'єднання mini-SAS 12 Гб (4х12=48Гб). Така архітектура забезпечує високу пропускну здатність і резервування шляхів до дисків. Диски з інтерфейсом SATA в цій системі не використовуються!


Віртуальне сховище в HPE MSA

Віртуальне сховище або virtual storage - це абстракція базових підсистем зберігання даних для розширення функціональності, підвищення продуктивності та спрощення надання томів. Віртуальне сховище також дає змогу використовувати програмно-керовані сервіси даних, які підвищують доступність і загальну ефективність. В оновленій системі HPE MSA Gen7 віртуалізація відбувається у двох різних місцях: перша - на рівні дисків у вигляді RAID з апаратним прискоренням, а друга - на програмному рівні, який об'єднує групи дисків у пули.

RAID - це тип віртуалізації, який об'єднує кілька дисків (SSD або HDD) в один об'єкт. Системи HPE MSA використовували виключно класичний RAID, поки в прошивці GL200 (2014 рік) не з'явилося «віртуальне сховище» для систем зберігання MSA четвертого покоління-Gen4. По суті, RAID збільшує адресовану ємність, продуктивність і доступність для всіх томів, розташованих у дисковій групі, при цьому поєднання переваг варіюється залежно від рівня RAID. Хоча RAID відмінно справляється з цими конкретними завданнями, він також призводить до ізоляції цих же атрибутів. Тобто томи не мають доступу до ємності та продуктивності інших дисків, що не входять до їхньої групи. Ще один недолік архітектур, заснованих тільки на класичному створенні RAID, полягає в тому, що неможливо збільшити ємність або продуктивність дискової групи, не розширивши її за рахунок додаткових дисків. Для невеликих дискових груп з дисками малої ємності додавання додаткових дисків може не викликати серйозних побоювань, але що більше дисків і що більша їхня ємність, то вищий ризик одночасного виходу з ладу дисків і подальшої втрати даних. Крім того, розширення дискової групи призводить до перегрупування/перерозподілу наявних даних, що позначається на продуктивності. Нарешті, дискова група може збільшуватися тільки до кінцевого розміру, що обмежує зростання додатків і томів до місткості, яка менша, ніж може підтримувати контролер.
Віртуальне сховище використовує ті самі концепції RAID, але покращує їх, об'єднуючи не тільки диски, а й цілі групи різнотипних дисків, що дає змогу рознести дані на всіх дисках в одному рівні. Віртуальне сховище дає змогу адміністратору визначити рівень надмірності, ємності та продуктивності, який забезпечує відповідні класи обслуговування CoS для томів у пулі, усуваючи водночас складнощі, пов'язані з традиційними системами зберігання тільки RAID. Крім того, віртуальні сховища надають механізм для кількох вигідних функцій, як-от багаторівнева організація саб-LUN, розширення «кешу на читання», тонке виділення ресурсів - thin provisioning, швидка перебудова дисків та економія місця під час роботи зі снепшотами. Переваги віртуальних сховищ поширюються і на інтерфейс управління, де можна виконувати більше завдань за меншу кількість дій.

Контролери та пули в HPE MSA
Система HPE MSA постачається з двома контролерами, що підтримують по одному пулу. Пул стає відразу доступним, коли йому призначається перша дискова група.


Пул - це місце зберігання даних тому. Оскільки кожен контролер володіє певним пулом (А або В), том не може охоплювати або іншим чином використовувати пропускну спроможність і продуктивність іншого контролера. Тому доцільно розглядати кожен пул як повністю незалежний ресурс! Проте, кожен пул доступний через порти хоста контролера-партнера за допомогою механізму уніфікованого представлення LUN (ULP). У разі оновлення прошивки або відмови контролера пул залишається в працездатному стані, а контролер, що залишився, тимчасово перебирає на себе право володіння його дисковими ресурсами.

Важливо! Підтримується та потенційно вигідно надавати лише один пул на контролер, оскільки цей метод дає змогу знизити вплив на продуктивність під час оновлення прошивки або відмови контролера. Наприклад, якщо потенціал контролера в MSA Gen7 становить 391 500 IOPS, то два контролери, що працюють одночасно, можуть забезпечити 783 000 IOPS, що є загальним потенціалом системи зберігання. Коли контролер стає недоступним, потенціал масиву падає до 391 500 IOPS або навіть трохи нижче.

HPE MSA, будучи активно-активною архітектурою, підтримує 3 підходи з урахуванням резерву:
Два пули без резерву: одночасне надання обом пулам достатньої кількості дискових ресурсів, що дає змогу робочим навантаженням використовувати весь потенціал масиву з погляду продуктивності та ємності.
Один пул зі 100% запасом: створення єдиного пулу і розміщення в ньому всіх робочих навантажень, знижуючи вплив на продуктивність у разі недоступності контролера і значно спрощуючи управління конфігурацією.
Два пули зі 100% запасом: подібно до другого варіанту, цей метод спрямований на те, щоб продуктивність залишалася передбачуваною протягом часу, коли контролер недоступний. Найпоширенішим сценарієм для цього варіанта є гібридна конфігурація з двома пулами, у якій, наприклад, пул A сконфігуровано з SSD дисками, а пул B - з HDD SAS дисками.

Тиринг у HPE MSA
Цікавою і корисною можливістю віртуального сховища є автоматична багаторівнева організація зберігання, так званий sub-LUN тиринг, який дає змогу підвищити загальну продуктивність системи за менших витрат, ніж за умови використання дисків тільки одного класу, зазвичай під час порівняння йдеться про SSD диски. Тиринг дає змогу розподіляти вміст тому за кількома групами віртуальних дисків усередині пулу, а також за кількома типами дисків (SSD, SAS 10/15к, SAS 7,2к), об'єднаних у пул. Цей процес використовує переваги продуктивності певного типу диска, але тільки для тієї частини тому, яка його потребує. HPE MSA підтримує три рівні зберігання, при цьому кожен рівень відноситься до певного типу дисків.
Рівні зберігання (tier) специфічні для пулу і включають всі групи дисків певного типу, пов'язані з цим пулом. На малюнку нижче показано, як сторінки даних усіх томів у пулі можуть розподілятися за всіма трьома рівнями і всіма шістьма дисковими групами, пов'язаними з ним.


Без автоматичної багаторівневої організації або тирингу пул буде складатися тільки з одного типу дисків і не зможе економічно ефективно рости й експлуатуватися, не виходячи за рамки характеристик цієї технології. Однак пул з одним рівнем зберігання може бути правильним вибором для багатьох рішень, особливо для тих, де потрібна виняткова продуктивність і велика ємність. Системи зберігання HPE MSA, будучи системами початкового рівня, зазвичай розгортаються як єдине рішення в середовищах, що містять кілька робочих навантажень, які потребують поєднання вимогливих випадкових і послідовних операцій введення-виведення одночасно.
Для всіх і особливо випадкових (random) робочих навантажень SSD диски є ідеальним рішенням, оскільки вони забезпечують виняткове співвідношення вартості та продуктивності. Однак при цьому у цих дисків співвідношення вартості та обсягу залишається вищим, ніж у механічних HDD дисків. HPE MSA можна використовувати як all-flash систему, що може бути економічно ефективним рішенням, коли потрібен великий обсяг сховища з низькою затримкою. Але, як правило, гібридні системи зберігання, що складаються як з SSD, так і з HDD дисків, є ефективним способом досягнення більш високої продуктивності випадкових (random) і послідовних (sequential) операцій без істотного перевищення обсягу або бюджету.
Механізм тирингу в HPE MSA також відповідає за забезпечення оптимального розміщення даних, зокрема під час першого запису даних на том. Деякі подібні рішення намагаються забезпечити продуктивність, подібну до продуктивності SSD дисків, записуючи всі вхідні дані на найшвидший тип дисків у системі. Однак такий підхід не настільки ефективний, як у HPE MSA, і створює низку проблем:

Перенесення даних з одного місця в інше вимагає більшої кількості внутрішніх операцій введення-виведення (IOPS), щоб звільнити місце для нових даних.
Заплановані міграції сторінок вимагають відповідного часу спокою в неробочий час, щоб не вплинути на продуктивність програми.
Якщо найшвидший рівень буде заповнений, це призведе до посилення конкуренції за «гарячі дані» операцій читання.
Якщо операція запису не розділена, неможливо використовувати переваги різних типів дисків, які добре підходять для послідовних операцій введення-виведення.

Система HPE MSA вирішує ці проблеми, спрямовуючи вхідні записи на відповідний рівень. Такий підхід вимагає менше внутрішніх операцій введення-виведення для подальшого переміщення сторінок і вивільняє дисковий простір на більш продуктивних рівнях для більш «важливих» і «швидких» даних. Так, у разі використання багаторівневого розподілу продуктивності система може виявляти вхідні потоки даних і спрямовувати послідовно (sequentially) записані дані застосунку на найшвидший рівень, наприклад, такий, що складається з традиційних жорстких HDD дисків-standard tier. Послідовне або sequential введення-виведення добре підходить для механічних дисків, тоді як довільне (random) введення-виведення чутливе до затримок і найкраще обслуговується твердотільними SSD дисками - performance tier. Таким чином, цей підхід значно підвищує загальну продуктивність і не вимагає адміністративного втручання. В обох сценаріях, якщо цільовий рівень заповнений, замість нього використовується наступний за швидкістю рівень із доступною ємністю.

У разі використання архівного рівня (archive tier) усі вхідні записи поміщаються на стандартний рівень (standard tier), якщо тільки його ємність не вичерпано або якщо до того застосовано параметр «Належність до архівного рівня».

Дискова група MSA-DP+

MSA-DP+ - це тип пропрієтарний рівень RAID, який забезпечує чудову доступність, гнучкість і час відновлення в порівнянні з іншими типами дискових груп, особливо з тими, які використовують RAID-схеми на основі парності-R5/R6. У MSA-DP+ використовується кодування стирання або erasure coding, що дозволяє поступово збільшувати дискові групи з 12 до 128 дисків.
Проблема, через яку традиційні дискові групи обмежуються відносно невеликою кількістю дисків (до 16), полягає в тому, що що більша кількість дисків, то вища ймовірність їх виходу з ладу. RAID слугує для захисту від таких збоїв, але зі збільшенням обсягу дисків час відновлення втрачених даних збільшується лінійно. Саме поєднання об'єму дисків і їхньої кількості в групі дисків призводить до підвищення ризику при збільшенні обох змінних.


Хоча HPE MSA інтелектуально відновлює тільки виділений/заповнений обсяг, вона як і раніше вимагає, щоб були доступні сумісні диски або глобальні запасні диски, призначені для цієї ролі. Крім того, управління запасними дисками часто стає дедалі складнішим завданням, яке може призвести до незапланованого простою, як правило, тому що вони «неусвідомлено використовуються» деградованими дисковими групами. MSA-DP+ вирішує всі ці та інші проблеми. На відміну від інших типів дискових груп, у якій кожен диск бере участь у «страйпі “*, групи дисків MSA-DP+ містять кілька ”страйп зон» фіксованого розміру.

Страйп - це обсяг даних, що записуються за одну операцію введення/виведення.

Що більше дисків бере участь у RAID MSA-DP+, то більше страйп зон утворюється. Страйп зона складається з 2048 страйпів/смуг, розташованих суміжно в LBA кожного диска, що бере участь. Кожна з 2048 страйпів у зоні зберігає одну сторінку розміром 4 МБ, що загалом становить 8 ГБ даних по всій зоні.

Тонке виділення ресурсів
Тонке виділення ресурсів або thin provisioning - це технологія, що добре себе зарекомендувала, яка дає змогу витрачати менше коштів для досягнення/закупівлі необхідного дискового простору, забезпечуючи водночас більшу гнучкість і ефективність. Тонке виділення ресурсів досягається шляхом повідомлення операційній системі розміру тома і необхідної геометрії незалежно від доступних фізичних ресурсів: сторінка для даних виділяється віртуально, а фізична місткість - тільки під час запису даних у том. Крім тонкого виділення ресурсів, віртуальне сховище також надає два механізми для повернення виділеної ємності, яка більше не використовується, назад у пул для використання іншими томами і моментальними знімками. Ці механізми дають змогу пулу рости і скорочуватися в міру необхідності та призводять до консервативного підходу до виділення ресурсів сховища:

Команда SCSI UNMAP може бути запущена сучасними операційними системами для звільнення фізичної ємності після видалення об'єктів із файлової системи. Коли до безперервного діапазону секторів об'ємом 4 МБ застосовано команду UNMAP, сторінка може бути звільнена, якщо на неї не посилається моментальний знімок масиву.
Для старих операційних систем, які не підтримують UNMAP, можна використовувати програмні інструменти або повне форматування для запису нулів по всьому тому і, отже, сторінках. Сторінки, що містять нулі, виявляються і звільняються в рамках завдання обслуговування очищення диска самої СЗД.

ВАЖЛИВО! Тонке виділення вимагає моніторингу та адекватного планування, щоб фізична ємність дискового простору не була вичерпана. При досягненні певних або системних порогових значень використання за замовчуванням система зберігання HPE MSA надсилає сповіщення певним користувачам. Можна вимкнути надлишкове виділення на рівні пулу, що може допомогти в управлінні розподілом ємності для базових томів. Однак вимкнення надлишкового виділення також вимагає ретельного управління, оскільки моментальні знімки також вимагають розподілу ємності. Оскільки кількість миттєвих знімків масиву може стати великою і непередбачуваною, вимкнення надлишкового виділення пулу може легко призвести до несподіваного і загального споживання ємності.

Моментальні знімки
HPE MSA використовує технологію моментальних знімків redirect-on-write (RoW) для захисту томів. Моментальні знімки RoW перевершують механізм copy-on-write (CoW), оскільки вони гнучкі і усувають втрати продуктивності, пов'язані з копіюванням даних в інше місце системи.

При створенні миттєвого знімка система прозоро створює дублікат тому, який стає місцем усіх майбутніх записів. Однак замість копіювання даних таблиці пошуку використовуються як базовим томом, так і моментальним знімком для посилання на загальні сторінки. Система відстежує, скільки томів посилаються на сторінку, і відповідним чином знаходить нові дані. Якщо для тому немає моментальних знімків, лічильник посилань дорівнює 1, і дані записуються як зазвичай. Однак один або кілька знімків цього тому збільшують кількість посилань до двох або більше, що призводить до виділення нових сторінок із пулу, тим самим зберігаючи вихідні дані.

Підтримка ОС і гіпервізорів
На момент виходу оновленого модельного ряду MSA 7-го покоління офіційно підтримуються такі ОС і гіпервізори: Citrix Hypervisor 8, Microsoft Windows Server 2022/2025, Oracle Linux 8/9, RHEL 8/9, SUSE 15, VMware ESXi 7.0/8.0. Серед приємних несподіванок уже присутня сертифікація цієї системи з додатком SAP HANA.


Області застосування


Висновки
Функціонал системи «віртуальне сховище» забезпечує основу для безлічі важливих функцій і можливостей, які вирішують проблеми, з якими стикаються під час роботи ІТ відділи. Віртуальне сховище, як у HPE MSA Gen7, знижує накладні витрати на управління і надає передові технології для скорочення як початкових, так і поточних витрат, водночас підвищуючи доступність і продуктивність набагато вище, ніж у всіх попередніх поколінь. Наразі вже доступні до замовлення такі моделі нової системи: