Ось і дочекалися виходу чергового серверного процесора сімейства Intel Xeon 4-го покоління, випуск якого неодноразово протягом останніх років відкладався. А тепер подивимося в минуле, чому так сталося і до чого все це призвело. Ні для кого не секрет, що ті компанії, хто купує обчислювальні ресурси, системи зберігання даних та мережеві ресурси, очікують, одного в будь-якому новому пристрої - що вартість одиниці, чи це фізичний процесор, чи фізичне ядро, знизиться. А гіперскейлери, що запускають потужні програми, дивляться на вартість одиниці продуктивності на ват і хочуть, щоб вона також постійно знижувалась. А коли і те й інше не відбувається, то це, зазвичай, через монополістичну жадібність, або через технологічні бар'єри (іноді з власної ініціативи). При цьому активна конкуренція робить набагато вірогіднішим, що цього не станеться. 

Повернемося у 2009 рік. Компанія Intel випускає серверний процесор Nehalem. Відмінною рисою процесорів Nehalem було те, що вони перейняли багато конструкцій і функцій процесорів, що вже просувалися компанією AMD у своїй лінійці серверних процесорів Opteron, які так само стали популярними. Тоді ж у Intel виникли внутрішні розбіжності щодо архітектури цих процесорів. Компанія хотіла залишити серверні процесори 32-розрядними та перемістити 64-розрядність та обчислювальні робочі навантаження на архітектуру Itanium. Ринок цього не хотів і тому AMD створивши лінійку Opteron у короткі терміни, отримала чверть ринку серверів. Випуск Nehalem збігся з тим, що AMD зробила при цьому поганий вибір дизайну процесора Opteron і з початком світової рецесії ринок серверів швидко повернувся до Intel.  

Розчарована та деморалізована компанія AMD зрештою залишила поле битви за сервери, банально переставши випускати свої процесори, але через п'ять років перегрупувалася, щоб відновити довіру ринку за допомогою своїх розробок EPYC. На щастя для AMD, вона знову зайнялася серверними обчисленнями, саме тоді, коли Intel мала великі труднощі з 10-нанометровими, а потім 7-нанометровими виробничими процесами, які порушили плани Intel щодо серверів і дали AMD ще одну можливість зайняти близько чверті серверного ринку (і вони на шляху до цього), хоча відношення до компанії AMD залишається ще скептичне. 

Анонс 

10 січня 2023 компанія Intel розповіла про нові процесори 4-го покоління під кодовою назвою «Sapphire Rapids». Літографічний техпроцес процесора виконаний за класифікацією Intel7 (10 нм). Кількість моделей цього покоління процесорів 52. З повним списком процесорів та їх характеристиками можна ознайомитись тут. Не варто очікувати, що вони відразу з'являться на ринку. Основних «ходових моделей» слід чекати лише навесні. Зараз можна купити сервери з дуже дорогими, продуктивними та багатоядерними процесорами. 

Моделі процесорів Intel Xeon 4-го покоління   

Усі 52 моделі процесорів Intel Xeon можна розділити на категорії: 

  • Max 9400, абсолютно новий вид 
  • Platinum 8400 
  • Gold 6400/5400 
  • Silver 4400 
  • Bronze 3400 

Кожна з категорій позначає різні рівні масштабованості сокетів/фізичних процесорів, підтримку Intel Optane Persistent Memory, функції RAS, Reliability, availability and serviceability (технологія забезпечення максимальної надійності), можливості анклаву SGX для конфіденційності обчислень тощо. Також деякі з цих моделей можна використовувати як у найпоширенішому двосокетному варіанті серверів, так і в чотирьох і восьмисокетному. Чотирьох та восьмисокетні сервери з'являться не відразу, не раніше середини весни 2023 року. 

Так само кожна серія має різні моделі, які можна деталізувати до цільового варіанта використання цих процесорів. 

  • Прості процесори загального призначення. 
  • Продуктивні процесори загального призначення. 
  • Процесори із рідинним охолодженням загального призначення (серія «Q»). 
  • Односокетний варіант процесору загального призначення (серія «U»). 
  • Довговічне використання (IoT) процесора загального призначення (серія «T»). 
  • Процесори для великих баз даних/аналітики/оптимізації віртуалізації (серія «H» для 4-х та 8-ми сокетних варіантів). 
  • Процесори для оптимізації мереж 5G (серія «N»). 
  • Оптимізовані процесори для хмари IaaS (серії «P», «V» і «M»). 
  • Процесори для оптимізації системи зберігання даних та гіперконвергентної інфраструктури (серія «S»). 
  • Процесори для оптимізації HPC обчислень (вся серія «MAX»). 

Наприклад, потужні процесори Intel Platinum 8400 призначені для розширеної аналітики даних, штучного інтелекту та гібридних хмарних центрів обробки даних, пропонуючи високу продуктивність та прискорення робочих навантажень, а також покращену апаратну безпеку та роботу з одним, двома, чотирма та вісьма сокетами. 

Процесори Intel Xeon Gold 6400 та Gold 5400 оптимізовані для центрів обробки даних та мультихмарних робочих навантажень. Вони пропонують підвищену швидкість пам'яті, ємність, безпеку та прискорення робочих навантажень. 

Процесори Intel Xeon Silver 4400 та Bronze 3400 забезпечують необхідну продуктивність, середню швидкість пам'яті та енергоефективність для обчислювальних мережевих сховищ та ЦОД початкового рівня. 

TDP, Thermal Design Power, деяких процесорів нового покоління виріс. І наразі максимальний показник становить 350 Вт. Мінімальний теплопакет процесора – 125 Вт. 

Архітектура 

Процесори Intel Xeon діляться на варіанти XCC, MCC, MAX (HBM) або Extreme Core Count, Medium Core Count і High Bandwidth Memory. Архітектура варіантів XCC та MAX схожа і відрізняється від MCC. MCC - це монолітний процесор має один загальний кристал у якому може бути до 32 процесорних ядер. Це зазвичай процесори середнього діапазону Gold, Silver і Bronze.  

XCC і MAX це зовсім інша нова архітектура, яка складається з 4 плиток (Tile), в кожній з яких перебуває до 15 процесорних ядер. Ці 4 плитки з'єднані між собою за допомогою високошвидкісного MDF через мультиплексор Intel Embedded Multi-die Interconnect Bridge, EMIB. Відмінність полягає у тому, що у варіанті MAX є високошвидкісна HBM пам'ять, яка вбудована у процесор. 

Або додаткові характеристики цих процесорів: 

Які покращення додалися з виходом нових процесорів? 

  • Збільшився середній показник кешу 2 і 3 рівня самих процесорах. 2-го рівня з 1,25МБ на ядро до 2МБ на ядро і 3-го рівня з 1,5МБ на ядро та 1,875МБ на ядро. 
  • Шина PCIe тепер не 4.0, а 5.0. Це означає, що можна передавати ще більше даних и робити це ще швидше - 32ГТ/с, у PCIe 4.0-16ГT/с. 
  • Міжсокетне з'єднання UPI тепер стало другою версією і швидкість зросла з 11,2ГТ/с до 16ГТ/с. У старших моделях тепер таких ліній може бути до 4, раніше було максимум 3 (двосокетний варіант). 
  • Процесор тепер працює з оперативною пам'яттю (режим 1 DPC) зі швидкістю 4800МТ/с, раніше 3200МТ/с. У режимі 2 DPC, 2 планки пам'яті на канал, швидкість падає до 4400MT/c. 
  • З'явилася підтримка CXL версії 1.1. На першому етапі поки що без підтримки пристроїв «Тип 3». 
  • Збільшилося середнє значення можливості використання функціонала SGX в ГБ з 64ГБ до 128ГБ, при максимальному значенні 512ГБ. 

Прискорювачі у процесорі 

У презентаціях компанія Intel зробила наголос на нових прискорювачах, що з'явилися у процесорах, які дозволяють збільшити продуктивність тих чи інших додатків, за рахунок використання, нових або покращених попередніх інструкцій. Слід звертати увагу, що у деяких процесорах ці прискорювачі включені, а в деяких ні. 

Зазначені на слайді функції є продовженням довгої історії Intel щодо розміщення прискорювачів з фіксованими функціями на кристалі процесора. Тим не менш, потужні прискорювачі на процесорах цього покоління вимагатимуть додаткового програмного забезпечення для отримання усіх можливостей продуктивності. Intel вже працює з кількома постачальниками ПЗ задля забезпечення підтримки широкого спектра програм.  

Компанія Intel пропонує чотири типи прискорювачів для процесорів. Data Streaming Accelerator (DSA) покращує переміщення даних, розвантажуючи процесор, тобто операції копіювання та перетворення даних. Прискорювач Dynamic Load Balancer (DLB) «втручається», щоб забезпечити пріоритезацію пакетів та динамічне балансування мережевого трафіку між ядрами процесора при коливаннях навантаження системи. Також є In-Memory Analytics Accelerator (IAA), який підвищує продуктивність аналітики та розвантажує ядра процесора, тим самим покращуючи пропускну спроможність запитів до бази даних та інші функції. Також був впроваджений у серверний процесор прискорювач Quick Assist Technology (QAT). Раніше ця функція була на чипсеті. Цей апаратний прискорювач розвантаження збільшує продуктивність криптографії та стиснення/розпакування. Причому Intel давно використовує прискорювачі QAT, тому ця технологія вже має широку програмну підтримку. 

Отже процесори Intel 4-го покоління мають два типи архітектури XCC/MAX та MCC. Чіпи XCC/MAX складаються із чотирьох кристалів, і кожен кристал може мати по одному прискорювачу (IAA, QAT, DSA, DLB). Тобто на одному з таких процесорів можна активувати максимум чотири прискорювачі кожного типу, наприклад: 4 IAA, 4 QAT, 4 DSA, 4 DLB. Навпаки, у деяких процесорах використовується один кристал це MCC, тому вони можуть мати тільки один прискорювач IAA і DSA і два прискорювачі QAT і DLB або сумарно на процесор 2 QAT, 2 DLB, 1 IAA, 1 DSA. 

Intel Xeon MAX HBM 

Особливо хочеться зупинитися на новій серії процесорів Intel, якої раніше ніколи не було - це серія MAX. Моделі процесорів Intel MAX з HBM2e мають від 32 до 56 ядер, швидкість роботи до 1TБ/с, що у кілька разів швидше ніж швидкість роботи звичайної пам'яті і навіть DDR5. 

Ці процесори є першими процесорами x86, у яких використовується вбудована пам'ять HBM, що забезпечує більший пул локальної пам'яті об'ємом 64 ГБ на процесор. Пам'ять HBM допоможе «розібратися» з робочими навантаженнями, пов'язаними з пам'яттю і які не такі чутливі до кількості ядер, тому моделі MAX мають менше ядер ніж стандартні ТОП моделі. 

Процесори MAX серії можуть працювати у трьох різних конфігураціях із вбудованою пам'яттю HBM. 

  • Пам'ять HBM використовується в режимі HBM only для всіх операцій з пам'яттю (пам'ять DDR5 не потрібна). Зверніть увагу, що для 2-х процесорного сервера буде доступно лише 128ГБ HBM пам'яті. 
  • Пам'ять HBM використовується у режимі HBM Flat Mode, який представляє HBM як окрему область пам'яті, це потребує широкої підтримки програмного забезпечення. 
  • Пам'ять HBM використовується у режимі HBM Caching Mode, у цьому варіанті використовується HBM як кеш, але з підтримкою DDR5. Остання конфігурація не вимагає зміни коду і, ймовірно, буде режимом роботи, що найчастіше використовується. 

Швидше за все, цей вид процесорів Xeon MAX конкуруватиме з процесорами AMD EPYC Milan-X/Genoa-X, які поставляються з тривимірним кешем L3, названим 3D V-Cache. 

Intel Optane Persistent Memory 300 

Вже довгий час ходить багато чуток про те, що буде з її розробкою Intel Optane Persistent Memory (PMEM)? Згідно із заявою самої компанії Intel, вона згортає виробництво даного продукту. Однак нові процесори таки підтримуватимуть нову серію PMEM 300 (3-е покоління) під кодовою назвою «Crow Pass». При використанні модулів PMEM 300 знижується швидкість системи до DDR5-4400 (з DDR5-4800), проте і це чудово, оскільки друге покоління PMEM 200 підтримувала частоту 2666 або 3200МТ/с в залежності від моделі процесора і конфігурації (2, 4 або 8 сокетів).  

Приємним моментом є те, що Intel продовжує підтримувати всі три режими роботи PMEM, у другому поколінні підтримувалося 2 режими роботи. Також нові модулі PMEM матимуть більш високу пропускну здатність, менше споживання електроенергії та більш надійне та швидке шифрування, ніж попередні покоління. Об'єм модулів не змінився і так само складе 128, 256 та 512ГБ. Але нічого страшного в закритті PMEM немає, тому що на зміну цієї технології вже прийшла більш революційна і багатообіцяюча CXL. 

Підсумки 

Що можна сказати загалом? Процесор став швидшим, потужнішим і енергоефективнішим за попередні свої покоління. Однак якщо, порівнювати процесори за кількістю ядер і продуктивності з конкурентами - компанією AMD, у звичайних повсякденних робочих додатках, то процесор Intel сильно поступається багато в чому і дуже суттєво. 

та 

Щоправда, подібні тести робилися на топових моделях процесорів з максимальною кількістю ядер і кешем 3-го рівня. На «ходових моделях» такої великої різниці не буде. А якщо будуть задіяні вбудовані в процесор Intel ті чи інші прискорювачі і будуть вони використовуватися з оптимізованими додатками, то приріст продуктивності буде величезним. 

З кожним роком архітектура та можливості серверних процесорів ускладняється. І важко обрати з великого переліку моделей, який оптимально підійде під те чи інше нове завдання. Маючи уявлення про всі можливості процесора «явні» або «приховані» можна швидше зробити свій вибір. Хоча може бути так, що єдиним критерієм вибору процесора є оптимальне поєднання ціни одного ядра процесора (core/$).  

Ви завжди можете звернутися до нашої компанії за порадою, як краще та оптимальніше підібрати серверний процесор у тому чи іншому сервері під ваші завдання.