Ночная бомбежка! Nvidia выпускает самый мощный в мире чип искусственного интеллекта, производительность которого выросла в 30 раз. Хуан — Стив Джобс нашей эпохи

19 марта, 2024 Дядя Влад

Только что NVIDIA выпустила самый мощный в мире чип искусственного интеллекта.

Генеративный ИИ достиг переломного момента.

Двухчасовая конференция GTC 2024 больше напоминала масштабный концерт. Джим Фан, старший научный сотрудник NVIDIA, пошутил, что «Дженсен Хуанг — новая Тейлор Свифт».

Вероятно, это текущая позиция Джен-Сюня Хуанга из Nvidia в индустрии искусственного интеллекта.

В прошлом году Хуан Жэньсюнь заявил, что настал «момент iPhone» ИИ, позволяющий нам увидеть, как ИИ переписывает повседневную жизнь, и сегодня это показывает, что скорость этих изменений безумно ускоряется.

За последние 10 лет NVIDIA усовершенствовала искусственный интеллект примерно в миллион раз, что намного превышает закон Мура.Другими словами, NVIDIA пишет свой собственный закон итераций. От вычислительных мощностей чипов до внедрения искусственного интеллекта, от автомобилестроения до медицинской логистики — NVIDIA способствует развитию различных отраслей, одновременно добиваясь собственного прогресса.

Закон Мура мертв, но NVIDIA создала новый закон Мура.

За исключением компьютерных видеокарт, NVIDIA редко воспринимается нами в обычное время, но технологический прогресс многих продуктов вокруг нас всегда неотделим от них. волна AIGC.

Твит, отправленный генеральным директором OpenAI Сэмом Альтманом на X вчера вечером, может быть сноской времени:

Это самый интересный год в истории человечества, если не считать всех последующих лет.
Это был самый интересный год в истории человечества, но в будущем он будет самым скучным.

Создан самый мощный в мире ИИ-чип, и его производительность стремительно растет

На сегодняшний день это самый совершенный графический процессор, производимый в мире.

Главным героем пресс-конференции стал AI-чип Blackwell B200. Хуан Ренсюнь сказал, что название этого чипа происходит от имени математика, теоретика игр и теоретика вероятности Дэвида Блэквелла.

Основанный на процессе TSMC 4NP, вычислительный чип с архитектурой Blackwell имеет 104 миллиарда транзисторов, что является еще одним прорывом по сравнению с 80 миллиардами транзисторов в графическом процессоре GH100 предыдущего поколения.

Blackwell B200 — это не один графический процессор в традиционном понимании. Он состоит из двух графических процессоров Blackwell + процессорного чипа Grace и подключен через NV-HBI (интерфейс высокой пропускной способности Nvidia) со скоростью 10 ТБ/с, чтобы гарантировать, что каждый чип может работать отдельно. .

Таким образом, B200 на самом деле имеет 208 миллиардов транзисторов и может обеспечить до 20 петафлопс вычислительной мощности FP4. Два графических процессора в сочетании с одним процессором Grace могут повысить эффективность вывода LLM (Large Language Model) в 30 раз.

Производительность GB200 также будет значительно улучшена: в тесте GPT-3 LLM с 175 миллиардами параметров производительность GB200 в 7 раз выше, чем у H100, а скорость обучения — в 4 раза, чем у H100.

Более того, он снижает стоимость и энергопотребление в 25 раз по сравнению с H100.

Ранее, хотя AI-процессор NVIDIA H100 был очень популярен, пиковое энергопотребление каждого H100 достигало 700 Вт, что превышало среднее энергопотребление обычных американских домохозяйств. потребление будет таким же высоким, как крупный американский город сопоставим или даже больше, чем некоторые небольшие европейские страны.

Хуан Жэньсюнь сказал, что для обучения модели с 1,8 триллиона параметров раньше требовалось 8000 графических процессоров Hopper и 15 мегаватт мощности, а теперь 2000 графических процессоров Blackwell могут сделать это с энергопотреблением всего 4 мегаватта.

Высокая производительность графического процессора Blackwell B200 также прекрасно отражается на энергопотреблении. B200, использующий новейшую технологию межсоединений NVLink, поддерживает ту же архитектуру 8GPU и сетевые коммутаторы 400GbE. Хотя его производительность значительно улучшена, он может достигать того же пикового энергопотребления (700 Вт), что и H100/H200 предыдущего поколения.

Еще один момент, на который стоит обратить внимание, — это вычислительная мощность FP4. Хуан Жэньсюнь сказал, что за последние восемь лет вычислительная мощность искусственного интеллекта увеличилась в тысячу раз.

По сравнению с вычислительной мощностью FP8, обычно используемой в искусственном интеллекте, производительность двух вычислительных чипов B200 в 2,5 раза выше, чем у H100. Вычислительная мощность каждого чипа в архитектуре Blackwell на 25% выше, чем у чипа Hopper предыдущего поколения.

Старший научный сотрудник NVIDIA Джим Фан называет новый графический процессор Blackwell B200 «новым зверем производительности».

Вычислительная мощность B200 превышает 1 эксафлоп в рамках единой архитектуры.Производительность первого DGX, поставленного в OpenAI Джен-Сунь Хуангом, составляет 0,17 петафлопс.Параметры GPT-4-1,8T можно обучить на 2000 устройствах Blackwell в течение 90 дней.

Не будет преувеличением сказать, что родился новый закон Мура.

Поскольку Blackwell доступен в нескольких различных вариантах, Nvidia также предоставляет характеристики полного серверного узла с тремя основными вариантами.

Первая — это самая большая и мощная система GB200 NVL72, состоящая из 18 серверов высотой 1U, каждый сервер оснащен двумя суперчипами GB200. Система оснащена 72 графическими процессорами B200 с производительностью 1440 петафлопс для обработки искусственного интеллекта FP4 и 720 петафлопс для производительности обучения искусственного интеллекта в FP8. В ней используется решение для жидкостного охлаждения.Один NVL72 может обрабатывать 27 триллионов параметров моделей (максимальный параметр GPT-4 не превышают 1,7 триллиона параметров).

Другой спецификацией является HGX B200, который основан на использовании восьми графических процессоров B200 и процессора x86 в одном серверном узле. Каждый графический процессор B200 может быть настроен на мощность до 1000 Вт, а графический процессор обеспечивает до 18 петафлопс пропускной способности FP4, что медленнее. чем графический процессор в GB200 на 10%.

Наконец, NVIDIA также выпустит HGX B100, который имеет те же общие характеристики, что и HGX B200, оснащен процессором x86 и 8 графическими процессорами B100, но будет напрямую совместим с существующей инфраструктурой HGX H100 и позволит максимально быстро развернуть графические процессоры Blackwell. , каждый TDP графического процессора ограничен 700 Вт.

До этого Nvidia превратилась в компанию с оборотом в несколько триллионов долларов благодаря чипам искусственного интеллекта, таким как H100 и H200, превзойдя ведущие компании, такие как Amazon. Новый графический процессор Blackwell B200 и «суперчип GB200», выпущенные сегодня, очень многообещающи. лидирует и даже превосходит Apple.

Наступает эра программного обеспечения, определяющего все

В 2012 году небольшая группа исследователей выпустила революционную систему распознавания изображений под названием AlexNet, которая на тот момент намного превзошла предыдущие методы классификации собак и кошек, что сделало ее лидером в области глубокого обучения и сверточных нейронных сетей. потенциал (CNN) в распознавании изображений.

Именно увидев возможности ИИ, Хуан Жэньсюнь решил сделать ставку на ИИ. Интересно то, что раньше он использовался для распознавания сгенерированных изображений и генерации текста, а теперь — для создания изображений с помощью текста.

Итак, когда придет волна генеративного ИИ, что мы сможем с ней сделать? Джен-Сюнь Хуан дал несколько стандартных ответов.

Традиционные погодные модели в сочетании с погодной моделью NVIDIA Cordiff позволяют создавать прогнозы, охватывающие территории в сотни и даже тысячи километров, обеспечивая диапазон таких воздействий, как тайфуны, тем самым сводя к минимуму материальные потери. В будущем Кордифф также будет открыт для большего числа стран и регионов.

Генеративный ИИ может не только понимать изображения и аудио с помощью цифровых возможностей, но также может использовать свою огромную вычислительную мощность для сканирования миллиардов соединений с целью выявления новых лекарств.

Будучи торговцем оружием искусственного интеллекта, Хуан Жэньсюнь также представил систему NiMS, которая специализируется на помощи в разработке чипов искусственного интеллекта. В будущем у вас может даже появиться возможность сформировать суперкоманду ИИ. Разбив задачу на ряд подзадач, вы сможете позволить различным ИИ выполнять такие задачи, как поиск и оптимизация программного обеспечения.

Объекты, склады и заводские здания будущего будут определяться программным обеспечением.

Будь то человекоподобные роботы, беспилотные автомобили или манипулирующие руками, этим автономным роботам требуются операционные системы программного уровня. Например, благодаря сочетанию искусственного интеллекта и Omniverse NVIDIA построила роботизированный склад площадью 100 000 квадратных метров.

В этой физически точной моделируемой среде 100 потолочных камер отображают всю деятельность на складе в режиме реального времени с помощью программного обеспечения NVIDIA Metropolis и возможностей планирования маршрутов автономных мобильных роботов (AMR).

Эти симуляции также включают циклическое тестирование программного обеспечения агента ИИ для оценки и оптимизации способности системы адаптироваться к непредсказуемости реального мира.

В одном смоделированном сценарии AMR столкнулся с происшествием по пути за поддоном, заблокировав намеченный маршрут. Затем Nvidia Metropolis обновила и отправила карту занятости в реальном времени в систему управления, которая рассчитала новый оптимальный путь.

Операторы склада также могут задавать вопросы визуальной модели на естественном языке, а модель может понимать детали и действия и обеспечивать мгновенную обратную связь для повышения операционной эффективности.

Стоит отметить, что на этой конференции также появился Apple Vision Pro. Предприятия могут легко передавать интерактивные универсальные описания сцен (OpenUSD) 3D-приложений в Vision Pro в режиме реального времени через Omniverse Cloud, помогая пользователям исследовать виртуальные миры, как никогда раньше.

Концом пресс-конференции стал знакомый сегмент роботов. Как сказал Хуан Жэньсюнь, в тот момент, когда он открыл руки и встал вместе с другими гуманоидными роботами, в это время «пересечение компьютерной графики, физики и искусственного интеллекта, это… …Все начинается в этот момент».

▲ Маленькая пасхалка

Десять лет назад в GTC Джен-Сун Хуанг впервые подчеркнул важность машинного обучения.Хотя многие люди все еще считали Nvidia производителем «игровых видеокарт», они уже были в авангарде революции искусственного интеллекта.

В 2024 году, известном как первый год приложений искусственного интеллекта, NVIDIA уже использовала программное и аппаратное обеспечение искусственного интеллекта для расширения возможностей различных отраслей во многих областях: большие языковые модели, диалоговый искусственный интеллект, периферийные вычисления, большие данные, автономное вождение, бионические роботы…

Открытие лекарств — это не наша компетенция, а компьютерная техника; создание автомобилей — не наша компетенция, а компьютеры с искусственным интеллектом, необходимые для создания автомобилей. Честно говоря, компании сложно хорошо справляться со всеми этими вещами, но мы очень хороши в вычислительной части ИИ.

По сравнению с лидером отдельной отрасли NVIDIA больше похожа на «большого человека за кулисами».

Как сказал Хуанг, NVIDIA уже является платформенной компанией.

Именно опережающее развертывание и общая тенденция исторического развития позволили Nvidia занять более 70% продаж рынка ИИ-чипов в начале эры ИИ.Оценка компании также превысила 2 триллиона долларов США, не давно.

Возможно, это также причина, по которой Apple отказалась от производства автомобилей после многих лет борьбы и вложила значительные средства в генеративный искусственный интеллект.

В то время, когда мы все еще подвергаем сомнению полезность «ИИ», NVIDIA своими действиями доказала, что ИИ стал незаменимой частью новой эпохи.

Автор: Ли Чаофань, Сяо Фаньбо, Мо Чунюй

# Добро пожаловать на официальную общедоступную учетную запись aifaner в WeChat: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo