Будущее быстрой графики для ПК? Подключение напрямую к SSD

Повышение производительности ожидается с каждым новым поколением лучших видеокарт , но похоже, что Nvidia и IBM нацелились на большие изменения.

Компании объединились для работы над технологией Big Accelerator Memory (BaM), которая предполагает подключение видеокарт напрямую к сверхбыстрым твердотельным накопителям. Это может привести к увеличению объема памяти графического процессора и более высокой пропускной способности при одновременном ограничении участия ЦП.

Диаграмма разбивает технологии Nvidia и IBM BaM.
Источник изображения: Архив

Об этом типе технологии уже думали и работали в прошлом. Интерфейс прикладного программирования Microsoft DirectStorage (API) работает примерно так же, улучшая передачу данных между графическим процессором и твердотельным накопителем. Однако это зависит от внешнего программного обеспечения, применимо только к играм и работает только в Windows. Исследователи Nvidia и IBM вместе работают над решением, которое устраняет необходимость в проприетарном API, но при этом подключает графические процессоры к твердотельным накопителям .

Метод, забавно называемый BaM, был описан в статье , написанной командой, которая его разработала. Подключение графического процессора напрямую к твердотельному накопителю обеспечит повышение производительности, которое может оказаться жизнеспособным, особенно для ресурсоемких задач, таких как машинное обучение. Таким образом, он в основном будет использоваться в сценариях профессиональных высокопроизводительных вычислений (HPC).

Технология, доступная в настоящее время для обработки таких тяжелых рабочих нагрузок, требует, чтобы видеокарта полагалась на большие объемы памяти специального назначения, например HBM2, или чтобы был обеспечен эффективный доступ к хранилищу SSD. Учитывая, что размер наборов данных только увеличивается, важно оптимизировать соединение между графическим процессором и хранилищем, чтобы обеспечить эффективную передачу данных. Здесь на помощь приходит БаМ.

«BaM уменьшает увеличение трафика ввода-вывода, позволяя потокам графического процессора считывать или записывать небольшие объемы данных по запросу, как это определено вычислением», — говорится в статье исследователей, впервые цитируемой The Register . «Цель BaM — увеличить объем памяти графического процессора и увеличить эффективную пропускную способность доступа к хранилищу, а также предоставить высокоуровневые абстракции для потоков графического процессора, чтобы легко осуществлять мелкозернистый доступ по требованию к массивным структурам данных в расширенной иерархии памяти».

Ядро графического процессора Nvidia стоит на столе.
Нильс Броекхёйсен/Digital Trends

Для многих людей, которые не работают непосредственно с этой темой, детали могут показаться сложными, но суть в том, что Nvidia хочет меньше полагаться на процессор и напрямую подключаться к источнику данных. Это сделало бы процесс более эффективным и освободило ЦП, сделав видеокарту более самодостаточной. Исследователи утверждают, что эта конструкция сможет конкурировать с решениями на основе DRAM, оставаясь при этом более дешевой в реализации.

Хотя Nvidia и IBM, несомненно, открывают новые горизонты со своей технологией BaM, AMD работала в этой области первой: в 2016 году она представила Radeon Pro SSG, графический процессор для рабочих станций со встроенными твердотельными накопителями M.2. Тем не менее, Radeon Pro SSG задумывался как исключительно графическое решение, и Nvidia делает несколько шагов вперед, стремясь справляться со сложными и тяжелыми вычислительными нагрузками.

Команда, работающая над BaM, планирует опубликовать информацию об оптимизации своего программного и аппаратного обеспечения с открытым исходным кодом, что позволит другим использовать полученные результаты. Нет никаких упоминаний о том, когда BaM может быть реализован в будущих продуктах Nvidia.