AMD представляет самый быстрый в мире ускоритель HPC для научных исследований | Журнал "Вольт"
Вт. Ноя 24th, 2020


Сегодня AMD анонсировала новый ускоритель AMD Instinct MI100 – самый быстрый в мире графический процессор HPC и первый серверный графический процессор x86, преодолевший барьер производительности в 10 терафлопс (FP64). Платформа MI100, поддерживаемая новыми платформами ускоренных вычислений от Dell, Gigabyte, HPE и Supermicro, в сочетании с процессорами AMD EPYC и открытой программной платформой ROCm 4.0 предназначена для продвижения новых открытий, опережающих эру экзафлопсей.

Графический процессор AMD Instinct MI100, созданный на основе новой архитектуры AMD CDNA, обеспечивает новый класс ускоренных систем для высокопроизводительных вычислений и искусственного интеллекта в сочетании с процессорами AMD EPYC 2-го поколения. MI100 обеспечивает пиковую производительность FP64 до 11,5 терафлопс для высокопроизводительных вычислений и до 46,1 терафлопс матрицы FP32 для рабочих нагрузок ИИ и машинного обучения. Благодаря новой технологии AMD Matrix Core MI100 также обеспечивает почти 7-кратное увеличение теоретической пиковой производительности FP16 с плавающей запятой для рабочих нагрузок обучения ИИ по сравнению с ускорителями AMD предыдущего поколения.

«Сегодня AMD делает важный шаг вперед на пути к эксафлопсным вычислениям, представляя AMD Instinct MI100 – самый быстрый в мире графический процессор для высокопроизводительных вычислений», – сказал Брэд Маккреди, корпоративный вице-президент AMD по графическим процессорам для центров обработки данных и ускоренной обработке. «Наш новейший ускоритель в сочетании с открытой программной платформой AMD ROCm, ориентированный на рабочие нагрузки, которые имеют значение в научных вычислениях, призван предоставить ученым и исследователям превосходную основу для их работы в области высокопроизводительных вычислений».

Открытая программная платформа для эры Exascale

Программное обеспечение для разработчиков AMD ROCm обеспечивает основу для экзадачных вычислений. Как набор инструментов с открытым исходным кодом, состоящий из компиляторов, программных API и библиотек, ROCm используется разработчиками программного обеспечения exascale для создания высокопроизводительных приложений. ROCm 4.0 оптимизирован для обеспечения масштабной производительности систем на базе MI100. ROCm 4.0 обновил компилятор, сделав его открытым и унифицированным для поддержки OpenMP 5.0 и HIP. Фреймворки PyTorch и Tensorflow, оптимизированные с помощью ROCm 4.0, теперь могут достичь более высокой производительности с помощью MI100. ROCm 4.0 – это новейшее предложение для разработчиков приложений HPC, ML и AI, которое позволяет им создавать производительное портативное программное обеспечение.

«Мы получили ранний доступ к ускорителю MI100, и предварительные результаты очень обнадеживают. Обычно мы наблюдали значительное повышение производительности, в 2-3 раза по сравнению с другими графическими процессорами», – сказал Бронсон Мессер, научный директор Oak Ridge. Вычислительный центр лидерства. «Также важно признать, что программное обеспечение влияет на производительность. Тот факт, что платформа открытого программного обеспечения ROCm и инструмент для разработки HIP имеют открытый исходный код и работают на различных платформах, это то, чем мы были почти одержимы с тех пор, как мы представила самую первую гибридную систему CPU / GPU ».

Ключевые возможности и особенности ускорителя AMD Instinct MI100 включают:

  • Абсолютно новая архитектура AMD CDNA – архитектура AMD CDNA, разработанная для работы с графическими процессорами AMD в эпоху экзадачности и лежащая в основе ускорителя MI100, обеспечивает исключительную производительность и энергоэффективность.
  • Лучшая производительность FP64 и FP32 для рабочих нагрузок HPC – обеспечивает лучшую в отрасли пиковую производительность FP64 11,5 TFLOPS и пиковую производительность FP32 23,1 TFLOPS, что позволяет ученым и исследователям со всего мира ускорить открытия в таких отраслях, как биологические науки, энергетика, финансы, академические науки, правительство, оборону и Больше.
  • Совершенно новая технология Matrix Core для высокопроизводительных вычислений и искусственного интеллекта – повышенная производительность для полного диапазона матричных операций с одинарной и смешанной точностью, таких как FP32, FP16, bFloat16, Int8 и Int4, разработанная для повышения конвергенции высокопроизводительных вычислений и искусственного интеллекта.
  • Технология AMD Infinity Fabric 2-го поколения – Instinct MI100 обеспечивает примерно в 2 раза большую пиковую пропускную способность однорангового ввода-вывода (P2P) по сравнению с PCIe 4.0 с совокупной пропускной способностью до 340 ГБ / с на карту с тремя связями AMD Infinity Fabric. На сервере графические процессоры MI100 могут быть сконфигурированы до двух полностью подключенных ульев с четырьмя графическими процессорами, каждый из которых обеспечивает до 552 ГБ / с полосы пропускания ввода-вывода P2P для быстрого обмена данными.
  • Сверхбыстрая память HBM2 – включает 32 ГБ памяти HBM2 с высокой пропускной способностью с тактовой частотой 1,2 ГГц и обеспечивает сверхвысокую пропускную способность памяти 1,23 ТБ / с для поддержки больших наборов данных и устранения узких мест при перемещении данных внутрь и из них. память.5
  • Поддержка новейшего отраслевого стандарта PCIe Gen 4.0 – разработана с поддержкой новейшей технологии PCIe Gen 4.0, обеспечивающей пиковую теоретическую пропускную способность для передачи данных от центрального процессора к графическому процессору до 64 ГБ / с.

Доступные серверные решения

Ускорители AMD Instinct MI100 ожидаются к концу года в системах от основных OEM и ODM-партнеров на корпоративных рынках, включая:

Dell
«Серверы Dell EMC PowerEdge будут поддерживать новый AMD Instinct MI100, который позволит быстрее анализировать данные. Это поможет нашим клиентам быстро достичь более надежных и эффективных результатов высокопроизводительных вычислений и искусственного интеллекта», – сказал Рави Пендеканти, старший вице-президент PowerEdge Servers, Dell Технологии. «AMD была ценным партнером в нашей поддержке инноваций в центрах обработки данных. Высокопроизводительные возможности ускорителей AMD Instinct естественным образом подходят для нашего портфеля серверов PowerEdge для искусственного интеллекта и высокопроизводительных вычислений».

Гигабайт
«Мы рады снова работать с AMD в качестве стратегического партнера, предлагающего клиентам серверное оборудование для высокопроизводительных вычислений, – сказал Алан Чен, помощник вице-президента NCBU, GIGABYTE. «Ускорители AMD Instinct MI100 представляют новый уровень высокопроизводительных вычислений в центрах обработки данных, обеспечивая более широкие возможности подключения и пропускную способность данных для исследований в области энергетики, молекулярной динамики и обучения глубокому обучению. В качестве нового ускорителя в портфеле GIGABYTE наши клиенты могут взглянуть чтобы получить выгоду от повышения производительности при выполнении ряда научных и промышленных рабочих нагрузок высокопроизводительных вычислений “.

Hewlett Packard Enterprise (HPE)
«Заказчики используют системы HPE Apollo для обеспечения специальных возможностей и производительности для решения ряда сложных рабочих нагрузок с большим объемом данных, связанных с высокопроизводительными вычислениями (HPC), глубоким обучением и аналитикой», – сказал Билл Маннел, вице-президент и генеральный менеджер HPC. в HPE. «С введением новой системы HPE Apollo 6500 Gen10 Plus мы продолжаем расширять наш портфель для повышения производительности рабочих нагрузок за счет поддержки нового ускорителя AMD Instinct MI100, который обеспечивает более широкие возможности подключения и обработки данных, наряду с процессором AMD EPYC 2-го поколения и. Мы с нетерпением ждем продолжения нашего сотрудничества с AMD, чтобы расширить наши предложения за счет новейших процессоров и ускорителей ».

Супермикро
«Мы рады, что AMD выпустила самый быстрый в мире ускоритель графического процессора HPC. Комбинация вычислительной мощности, полученной с новой архитектурой AMD CDNA, наряду с высокой памятью и одноранговой пропускной способностью графического процессора, которую обеспечивает MI100, наши клиенты будут “Получите доступ к отличным решениям, которые будут соответствовать их требованиям к ускоренным вычислениям. Добавьте открытый программный стек AMD ROCm, и они получат открытую, гибкую и портативную среду для удовлетворения их потребностей в исключительной поддержке приложений для критически важных корпоративных рабочих нагрузок”, – сказал Вик Маляла, старший вице-президент по разработке полевых приложений и развитию бизнеса Supermicro. «AMD Instinct MI100 станет отличным дополнением к нашим серверам с несколькими GPU и нашему набору высокопроизводительных систем».

Далее следует полная слайд-колода. Для получения дополнительной информации посетите страницу продукта.



Source link

от btarunr

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *