• технология
  • Електрическо оборудване
  • Материална индустрия
  • Дигитален живот
  • Политика за поверителност
  • О име
Location: Home / технология / Готов за тестване: Първият по рода си суперкомпютър, задвижван от AI чипове с заместващи символи на Intel

Готов за тестване: Първият по рода си суперкомпютър, задвижван от AI чипове с заместващи символи на Intel

techserving |
1948

Суперкомпютърният център в Сан Диего (SDSC) казва, че е готов да изпълни тестови работни натоварвания на своята експериментална система Voyager AI, която изглежда е първият суперкомпютър, базиран на Intel Habana.

Суперкомпютърът е създаден в сътрудничество с Habana Labs на Intel и Supermicro като част от петгодишна безвъзмездна помощ от 11,25 милиона долара от Американската национална научна фондация. И макар да е мощен, Вояджър не се опитва да спечели никакви сравнителни рекорди - не би трябвало да го прави.

Вояджър е предназначен да бъде изпитателен полигон за AI/ML изчислителни изследвания и разработки на специализиран хардуер – в този случай процесорите Goya и Gaudi на Habana – главният изследовател на Вояджър Амит Маджумдар каза The Register.

Представен през 2019 г., Goya на Habana Lab е проектиран да ускорява работните натоварвания на AI изводи, използвайки осем тензорни процесорни ядра с поддръжка за смесена точност от FP32 до UINT8. Междувременно Gaudi, представен няколко месеца по-късно, беше 350W чип, проектиран с мисъл за обучението на ML. Той разполагаше с 32GB вградена памет, работеща с честотна лента от 1TB/s.

Intel придоби дизайнера на чипове в края на 2019 г., след като изостави злополучното си сътрудничество Nervana с Meta (тогава Facebook). Нещо като трето късметче за Intel по отношение на AI системите.

Ускорителите на Habana AI са внедрени в 42 мрежи Supermicro X12, които съставляват Voyager. Всяка система X12 е оборудвана с чифт процесори Xeon Scalable от трето поколение на Intel и осем процесора Habana Gaudi AI. Клъстерът също така използва чифт системи SuperServer 4029GP-T на OEM с осем Goya HL-100 PCIe карти за AI изводи.

Тъй като системата е проектирана да поддържа много големи AI модели, всеки сървър е свързан в мрежа с шест 400 Gbit/sec порта, работещи през RDMA-over-converged-Ethernet протокол към голям неблокиращ превключвател на Arista.

Готово, готово, тест

С функционирането на системата Voyager, SDSC премина към фазата на тестовия стенд на проекта.

Готов за тестване: Първият по рода си суперкомпютър задвижван от AI чипове за заместващи символи на Intel

През този период суперкомпютърният център разполага с три години, за да работи директно с изследователи, за да определи производителността на системата, хардуерните странности и изискванията за софтуерна съвместимост, обясни Маджумдар.

Изследването също така ще проучи случаите на използване на чиповете на Habana, които традиционно са насочени към компютърно зрение, обработка на естествен език и натоварвания за дълбоко обучение, каза Сри Ганесън, ръководител на управлението на софтуерни продукти в Habana Labs, пред The Register .

„Тази общност от учени и изследователи ще донесе различен клас проблеми и ще се опита да ги приложи в твърде дълбоко обучение“, каза тя. „Видовете модели, които те могат да донесат, може да са различни, така че това ще бъде [процес на обучение].“

Резултатите от това тестване ще бъдат споделени през следващите няколко години по време на полугодишни семинари и потребителски форуми.

Въпреки това, не всеки ще може да работи със системата. Изследователски групи, определени с помощта на външен консултативен съвет, и събраната информация ще се използва за разработване на най-добри практики и политики за разпределение. Това е различно от системите от първа категория, които се отварят за рецензирани изследователски проекти малко след като бъдат онлайн, каза Маджумдар.

След като изтекат трите години, проектът ще премине към двугодишна фаза на разпределение, по време на която екипът на SDSC ще се оттегли и ще позволи на независими учени да провеждат изследвания на системата.

Въпреки че Voyager току-що се появи онлайн, Majumdar твърди, че ранното тестване е било обещаващо, като производителността е „по-добра от прогнозираното“ и работните натоварвания се пренасят относително безболезнено, за да работят на Gaudi и Goya. „Софтуерният стек, пренасянето и работата на машината бяха наистина гладки“, каза той.

Какво ще кажете за Gaudi2 и Greco?

Voyager идва онлайн само седмици след като Habana Labs на Intel представи своите процесори за обучение и извод от второ поколение AI: Gaudi2 и Greco.

Intel твърди, че чиповете предлагат значително подобрение на производителността в сравнение с предишното поколение и се твърди, че превъзхождат графичните процесори A100 на Nvidia във вътрешните бенчмаркове.

600W Gaudi2 предлага 24 тензорни ядра, базирани на 7nm производствен процес и 96GB HBM2e памет с висока честотна лента, работеща при 2,45TB/s. Междувременно Greco предлага 16 GB — същото като Goya — по-нов LPDDR5 в по-малка PCIe карта с един слот, половин височина и дължина, която консумира по-малко от половината енергия.

„Gaudi2 е по-голям в много отношения с повече тензорни процесорни ядра, повече HBM2e, повече мащабируеми портове, така че каквото и да научим от [Voyager], трябва да мащабира още по-добре на Gaudi2,” каза Ганесън. „Авангардната работа се върши от тази общност. Така че трябва да се учим и да се развиваме за това, което ще се произвежда в бъдеще.“ ®

Вземете нашите технически ресурси