Облачные вычисления на GPU

Графический процессор (GPU, Graphics Processor Unit) – это специализированный тип микропроцессора видеокарты, позволяющий выполнять один и тот же тип вычислений в нескольких потоках одновременно. В первую очередь графический процессор предназначен для быстрого рендеринга изображений. Изначально GPU было периферийным устройством, дополняющим центральный процессор (CPU), но со временем полностью переориентировалось и стало центральным компонентом в HPC, локомотивом компьютерных вычислений.

GPU появились как ответ на усложнение графических задач, которые увеличивали нагрузку на CPU и снижали производительность компьютера. GPU разгружают центральный процессор от выполнения этих задач. Современные графические процессоры достаточно мощные, чтобы выполнять быстрые математические расчеты для многих других целей, помимо рендеринга.

В высокопроизводительных приложениях GPU используется вместе с CPU для ускорения глубокого обучения, аналитики и инженерных приложений для различных платформ – от искусственного интеллекта до беспилотников, роботов, поисковых систем, интерактивной речи, видеорекомендаций и многого другого.

Для компаний, которые занимаются сложными вычислениями, компьютерным обучением или 3D визуализацией GPU имеет огромное значение. Благодаря облачным технологиям работа с GPU стала проще и доступней. В этой статье рассмотрим особенности и преимущества использования GPU в облаке.

Первые GPU-вычисления в облаке

Конкуренция между облачными провайдерами в сфере облачных вычислений с помощью GPU продолжает набирать обороты. За рубежом активно начали использовать графические процессоры в качестве вычислительных устройств в 2016 году.

Так, в августе 2016 года было объявлено о начале закрытого тестирования инстансов виртуальных машин, оборудованных картами NVidia Tesla, а в сентябре 2016 года AWS разработали новый тип инстанса: Amazon Elastic Cloud Compute P2, в который также входят графические процессоры Nvidia. Azure в декабре 2016 года представила свои виртуальные машины N-Series, которые работали на базе графических процессоров Nvidia. Google, со своей стороны, в феврале 2017 года сообщил, что Google Compute Engine и Cloud Machine Learning будут поддерживать использование GPU.

Российский облачный провайдер Cloud4Y в начале 2017 года объявил о доступности новой услуги «Аренда сервера с GPU». Платформа в то время строилась на базе производительных видеокарт NVIDIA Tesla M60 с супербыстрым хранилищем и позволяло получить отличную производительность при работе с самыми ресурсоемкими приложениями — AutoCAD, 3DS Max, Maya и пр. Cloud4Y использовал платформу виртуализации VMware, полностью поддерживающую графические ускорители без необходимости использовать решения третьих фирм.

Так в иностранных и отечественных облачных платформах появились GPU-вычисления.

Что такое GPU-вычисления

Облачные вычисления с GPU – это услуга, основанная на виртуализации с GPU-ускорением. Такой сервер адаптирован к задачам, требующим высокой вычислительной мощности. Поскольку он интегрирован в облачное решение, клиенты получают преимущества ресурсов по запросу и почасовой тарификации.

Технология виртуальных GPU ускоряет ресурсоемкую серверную рабочую нагрузку, поэтому область ее применения в облаке, достаточно широка. Например:

графический рендеринг в различных приложениях для работы с видеоконтентом;
статистический анализ и генерация различных прогностических моделей;
проектирование и 3D-моделирование (визуализация);
исследования в области молекулярной химии, биохимии, математике;
искусственный интеллект (нейронные сети для машинного обучения и глубокого изучения);
анализ и обработка больших данных.

Работа с векторной графикой изменила развитие архитетктуры GPU, из-за чего графические процессоры стали эффективны для параллельных вычислений. При решении ресурсоемких задач мощность видеокарты используется не только для обработки и отображения сложной графики, но и для получения результатов с помощью математических алгоритмов, аналогичных рендерингу.

Аренда облачного сервера для разработки, хостинга, обученияПодробнее

Облачная структура GPU-вычислений

GPU-инстансы помогают компаниям получить преимущества от размещения более интенсивных вычислительных нагрузок в публичном облаке. Но какие именно приложения подходят для этих типов виртуальных серверов?

Поскольку крупные облачные провайдеры борются за долю на рынке, они постоянно расширяют ассортимент услуг. Так пользователи получили возможность развертывать экземпляры, имеющие доступ к графическим процессорам, что пригодилось для интенсивных вычислений, таких как искусственный интеллект.

Перед развертыванием облачного сервера с GPU необходимо понять типы приложений и рабочих нагрузок, которые они лучше всего поддерживают. К таким рабочим нагрузкам относятся:

Приложения бизнес-аналитики, поддерживающие массивные параллельные вычисления. Hadoop-подобные приложения с обработкой данных, которые могут быть распределены на большое количество элементарных задач на нескольких узлах или ядрах.
Искусственный интеллект (AI). Облачная инфраструктура с мощными графическими процессорами позволяет проверить масштабируемость проекта без больших инвестиций. Это открывает новые возможности для различных отраслей – от здравоохранения и биотехнологий до автомобилестроения.
Инженерное моделирование, например, в автомобильной промышленности, также выигрывает от облачных GPU. Производители автомобилей используют моделирование и симуляцию, что отнимает много времени, но GPU устраняют необходимость в портативных кластерах для обработки приложений, снижая затраты на анализ, и обычно ускоряя проекты.
VDI с GPU актуален в медиа-индустрии и индустрии развлечений, где необходимо создавать сложные изображения и видео. Дизайнерам и инженерам для работы нужны мощные стационарные компьютеры с графическими процессорами для рендеринга своих проектов, поэтому они всегда привязаны к своему рабочему месту в офисе. С виртуальным рабочим столом приложения, требующие сложной обработки графики и 3D рендеринга, доступны даже маломощного ПК, потому что вся обработка происходит в облачном центре обработки данных. Удаленные пользователи получают возможность работать на GPU, где бы они ни находились, что обеспечивает такой уровень свободы и гибкости, который не был возможен в прошлом. Более того, все данные в безопасности, так как они остаются в ЦОДе, а не хранятся на удаленном устройстве.
Суперкомпьютеры уже были доступны небольшим научным организациям через высокопроизводительные облака, которые могли значительно ускорить проекты. Облачные GPU-серверы помогут получить знания суперкомпьютеров на уровне бакалавриата, принося пользу академическим исследованиям.
Системы компьютерного зрения. В основе компьютерного зрения, нейросети, которая умеет распознавать людей и объекты на фотографиях и видео, тоже лежит машинное обучение. Для быстрой обработки датасета, проведения тестов, организации рабочей архитектуры нейросетей требуются значительные вычислительные мощности. которые как раз и предоставляют облачные GPU.

Внедрение решения на базе GPU сервера

Использование видеокарт для вычислений – это новый шаг в развитии информационных технологий. Преимущества, которые различные сферы бизнеса и науки получают от этой технологии, неоспоримы. Современный рынок инфраструктурных решений с использованием видео-процессоров богат предложениями с разнообразными конфигурациями.

Вы можете развернуть облачные серверы на базе GPU за считанные минуты и ускорить выполнение сложных вычислительных задач до десяти раз. Если задача требует большей вычислительной мощности, сервер легко масштабировать. Более того, облачные провайдеры предлагают удобную биллинговую систему – вы можете выбрать облачный сервер с GPU и платить за него только тогда, когда он вам нужен.

Клиенты Cloud4Y используют сервера с GPU NVIDIA Tesla P100, M60 и M40. В апреле 2022 мы расширили ИТ-парк, установив несколько графических серверов с Tesla V100.

характеристики Tesla v100

Tesla V100 — популярная модель графического процессора с тензорными ядрами, созданная на архитектуре NVIDIA Volta и предназначенная для работы в сферах искусственного интеллекта и высокопроизводительных вычислений (HPC). Это первый ускоритель, преодолевший барьер производительности в 100 тера-операций в секунду (TOPS) в задачах глубокого обучения. GPU Tesla V100 построены на базе двух процессоров Intel Xeon Gold 6240 с базовой тактовой частотой 2,6 ГГц и максимальной тактовой частотой с технологией Turbo Boost 3,9 ГГц.

FPGA-инстансы

Появление на рынке перепрограммируемых FPGA-ускорителей стало настоящим прорывом в нише высокопроизводительных вычислений. Однако эффект облачных программируемых пользователем вентильных матриц (FPGA) несколько сложнее. В целом, вычисления на базе FPGA могут обеспечить огромную производительность для одного, узко определенного варианта использования. Технология молода, и основной упор делается на ускорение конкретных вычислительных задач вроде сжатия и шифрования.

Для большей наглядности сравним CPU, GPU и FPGA

CPU — самый простой вариант для разных вычислительных задач, но CPU «не тянут» параллельные вычисления. Эта проблема частично решается путём создания многоядерных процессоров. Однако даже у самых производительных CPU число ядер пока измеряется десятками.
GPU — устройство, которое изначально радовало только геймеров и дизайнеров. Лишь относительно недавно люди оценили потенциал GPU для высокопроизводительных вычислений и майнинга криптовалют. Современные GPU содержат в чипе несколько тысяч процессорных ядер.
FPGA отличаются от CPU и GPU тем, что способны настраиваться под особенности решаемой на них вычислительной задачи. Ещё одной особенностью FPGA является сниженное энергопотребление в пересчёте на единицу вычислительной мощности, а также массивно-параллельная мелкозернистая архитектура. Число ядер в чипе FPGA может достигать одного миллиона.

gpu cloud server