Создание «графической карты с ядерной бомбой» больше не может удовлетворить Nvidia
Каждый август Nvidia будет демонстрировать свои «мускулы» на SIGGRAPH, самой важной в мире конференции по компьютерной графике.
Пять лет назад генеральный директор Nvidia Хуанг Ренсюнь представил Quadro RTX, первую графическую карту с поддержкой трассировки лучей, на SIGGRAPH 2018. Это самый важный продукт Nvidia со времен G80, продвигающий графические процессоры Nvidia из эпохи GTX в эпоху RTX.
В то время Nvidia все еще была очень чистым производителем графических вычислительных чипов, и ее мысли были полны мыслей о том, как довести 3D-рендеринг до крайности.Его рыночная стоимость составляла около 81,4 миллиарда долларов США, и она еще не вошла в клуб 100 миллиардов. .
Но к 2023 году Nvidia претерпела радикальные изменения. На конференции GTC в марте, после того как Лао Хуанг выкинул золотую фразу «пришло время ИИ для iPhone», цена акций Nvidia начала неуклонно расти, постоянно устанавливая новые исторические максимумы.
За последние пять лет цена акций Nvidia выросла почти в 10 раз, а ее текущая рыночная стоимость превысила 1,1 трлн долларов, что делает ее первой в мире компанией по производству чипов, рыночная стоимость которой превышает 1 трлн долларов США. фондовый рынок.
Видеокарты Nvidia по-прежнему популярны на рынке, но теперь уже не геймеры гонятся за окончательной картинкой, а технологические гиганты, такие как Microsoft и Meta, стремятся развертывать и обучать большие модели.
Вчера вечером на SIGGRAPH 2023 вам было трудно услышать, как Лао Хуан произносит знакомые ключевые слова, такие как игры, рендеринг в реальном времени и 3D, и заменяет их такими понятиями, как генеративный ИИ, центры обработки данных и ускоренные вычисления.
Это новая Nvidia и новая эра.
Нвидиа изменилась
Мы можем интерпретировать, что это за компания, из финансового отчета Nvidia.
Долгое время игровой бизнес был основным бизнесом Nvidia.До первого финансового квартала 2023 года, под двойным влиянием спада потребления на рынке ПК и роста вычислений ИИ, бизнес центров обработки данных Nvidia, наконец, догнал и стал № 1 Nvidia Это также знаменует собой официальное преобразование Nvidia из традиционного поставщика графических процессоров в одного из крупнейших в мире поставщиков вычислительной мощности.
После этого дата-центры Nvidia начали стремительно расти, а ее H100, A100 и другие вычислительные видеокарты стали твердой валютой в индустрии ИИ, и в свое время был серьезный дефицит. Некоторые аналитики предполагают, что миру может понадобиться 432 000 H100 для удовлетворения рыночного спроса.
Последний квартальный финансовый отчет Nvidia показывает, что благодаря высокому спросу со стороны предприятий выручка Nvidia от бизнеса центров обработки данных в первом квартале составила около 4,2 млрд долларов США, увеличившись в годовом исчислении на 14 % и на 18 % в месячном исчислении, что превышает Ожидания Уолл-стрит.
Но если вы думаете, что Nvidia — это просто счастливчик, который попал под удар горячих денег ИИ, то вы недооцениваете Лао Хуанга.
Для Nvidia создание «ядерной бомбы GPU» и инвестиции в ИИ — это всего лишь «подготовительная работа» для реализации их окончательного видения.Что Nvidia действительно хочет сделать, так это построить настоящую метавселенную.
Самая продвинутая "мотыга"
Если работник хочет делать свою работу хорошо, он должен сначала наточить свои инструменты, и Nvidia это хорошо понимает.
В марте этого года Nvidia выпустила четыре чипа вывода ИИ, H100 NVL GPU, L4 Tensor Core GPU, L40 GPU и NVIDIA Grace Hopper, чтобы удовлетворить растущие потребности предприятий в вычислительной мощности.
На выставке Taipei Computer Show в мае Лао Хуанг представил суперкомпьютер DGX GH200, состоящий из 256 суперчипов NVIDIA GH200 Grace Hopper.
А буквально вчера Лао Хуан выпустил новую версию GH200 с памятью HBM3e, даже предыдущее поколение GH200 официально еще не поступило, а скорость обновления пугает.
Различия между старым и новым GH200 в основном заключаются в памяти.
GH200 Grace Hopper — это первый в мире чип графического процессора с памятью HBM3e, что увеличивает объем памяти на 50% с 96 ГБ до 144 ГБ на каждый графический процессор.
Память HBM3e — это новый тип технологии памяти с высокой пропускной способностью.С точки зрения скорости вычислений HBM3e может быть на 50% быстрее, чем скорость вычислений HBM3, обеспечивая максимальную скорость передачи 5 ТБ/с. Это позволяет новой версии GH200 запускать модели AI в 3,5 раза быстрее, чем текущие модели.
Среди них память GH200 с двойной конфигурацией может достигать 282 ГБ памяти HBM3e, что является 3,5-кратным увеличением емкости и 3-кратным увеличением пропускной способности по сравнению с предыдущим поколением. По сравнению с популярным H100 объем памяти увеличился в 1,7 раза, а пропускная способность увеличилась в 1,5 раза.
Как и предыдущее поколение, новый GH200 также имеет преувеличенную масштабируемость.
Благодаря технологии межсетевого взаимодействия Nvidia NVLink GH200 можно комбинировать в формы различных размеров в соответствии с потребностями предприятий, например серверы с одной, двумя и несколькими картами, шкафы и даже суперкомпьютеры.
В конечном итоге GH200 можно объединить в суперкомпьютер DGX GH200 SuperPod на 256 карт, который имеет 144 ТБ быстрой памяти и может выполнять 1018 операций с плавающей запятой в секунду.
Если вам этого недостаточно, вы также можете подключить несколько Nvidia DGX GH200 SuperPods к коммутатору Nvidia Quantum-2 InfiniBand.
Лао Хуан в шутку сказал: «Это должно быть в состоянии двигать Crysis».
Широкие возможности расширения обеспечивают неограниченные возможности для будущего GH200.
Другими словами, если вы хотите увеличить скорость вычислений, вам нужно всего лишь добавить больше серверных шкафов. Это очень полезно в будущем.Хуан Ренсюнь считает, что типичным сценарием применения GH200 в будущем будет модель большого языка, а «ускоренные вычисления» и «вычисления ИИ» постепенно заменят «общие вычисления» традиционных графических процессоров x86.
Например, при прошлом бюджете в 100 миллионов долларов можно было построить только небольшой центр обработки данных, приобрести 800 графических процессоров x86 и использовать для работы 5 мегаватт электроэнергии.
Но при том же бюджете Грейс Хоппер, которая выбирает ускоренные вычисления, потребляет всего 3 мегаватта электроэнергии, а пропускную способность данных можно увеличить на порядок. И если расчет основан на той же рабочей нагрузке, план расчета Грейс Хоппер требует всего 8 миллионов долларов США.
Говоря об этом, Лао Хуан выбросил свое знаменитое изречение: «Чем больше покупаешь, тем больше экономишь».
Официальные лица прогнозируют, что запуск нового GH200 придется ждать до второго квартала 2024 года. GH200, оснащенный памятью HBM3, будет поставлен во второй половине этого года, как и планировалось изначально.
Конечно, для отдельных разработчиков и небольших команд нереально построить центр обработки данных стоимостью в сотни миллионов долларов, поэтому Nvidia «близко» запустила новое поколение видеокарт для рабочих станций, в которых интегрирована передовая технология RTX: NVIDIA RTX 5000. , NVIDIA RTX 4500 и NVIDIA RTX 4000.
Среди них, в качестве флагманского графического процессора, NVIDIA RTX 5000 использует Tensor Core 4-го поколения и RT Core 3-го поколения, 32 ГБ видеопамяти GDDR6, поддерживает проверку ошибок ECC, подходит для высокопроизводительных рабочих станций, центров обработки данных и облачных игр.
NVIDIA RTX 4500 является графическим процессором среднего и высокого класса и оснащена 24 ГБ видеопамяти GDDR6, а также поддерживает проверку ECC.
По сравнению с продуктами предыдущего поколения NVIDIA RTX 4500 удваивает производительность трассировки лучей и удваивает производительность обработки ИИ.
NVIDIA RTX 4000 использует то же ядро графического процессора, что и RTX 4500, оснащена 20 ГБ видеопамяти GDDR6, а ее производительность трассировки лучей и вычислений ИИ была значительно улучшена.
Новый графический процессор NVIDIA RTX 5000 уже поступил в продажу, а графические процессоры NVIDIA RTX 4500 и RTX 4000 поступят в продажу во второй половине этого года.
Самая плодородная «земля»
Применяя рекламные слова Nongfu Spring, мы можем представить последнюю стратегию Nvidia в области искусственного интеллекта следующим образом:
Мы не производим ИИ, мы просто портеры ИИ.
Как мы все знаем, локальная настройка моделей ИИ — утомительная и сложная задача, и чтобы помочь разработчикам решить эту проблему, Лао Хуан объявил, что Nvidia запустит «AI Workbench».
Проще говоря, AI Workbench может предоставить разработчикам фреймворк, набор инструментов для разработки и другие среды, необходимые для настройки моделей ИИ в одном месте, и они могут напрямую приступить к созданию проектов.
Лао Хуан дал очень яркий пример на месте происшествия.
Например, компании нужно настроить модель Stable Diffusion для покраски, но у вас нет оборудования и вы не знаете, как настроить модель.
Не волнуйтесь, на данный момент вам просто нужно открыть AI Workbench, выбрать облачную рабочую станцию с 4 графическими процессорами RTX 6000 Ada, а затем вы можете настроить модель Stable Diffusion одним щелчком мыши.
Если вас не устраивают сгенерированные картинки, вы также можете сами загрузить картинки, переобучить модель и сгенерировать их заново.
Менее чем за минуту генерируется достойная картинка, и вам не нужно беспокоиться о других проблемах в процессе, потому что AI Workbench уже подготовил все остальное.
Nvidia объявила, что установит стратегическое партнерство с Hugging Face, платформой искусственного интеллекта с открытым исходным кодом, и применит эту технологию на корпоративном уровне.
Всего несколькими щелчками мыши на платформе Hugging Face разработчики могут легко переносить генеративные проекты ИИ с ноутбуков на рабочие станции, а затем в центры обработки данных или облака и, наконец, использовать ресурсы облачного ИИ NVIDIA DGX для обучения моделей ИИ.
Лао Хуан подчеркнул, что благодаря сотрудничеству с Hugging Face самая передовая технология искусственного интеллекта Nvidia может обеспечить поддержку во всех сферах жизни. Предприятия также могут использовать возможности сообщества открытого исходного кода для продвижения обучения ИИ в соответствии с потребностями планирования предприятия.
Самая большая «мечта»
После представления обновления программно-аппаратной платформы Лао Хуанг сказал с глубоким вздохом: «Давайте поговорим сегодня вечером о самой важной теме — OpenUSD».
Термин OpenUSD должен быть незнаком большинству людей. OpenUSD — это фреймворк с открытым исходным кодом от Pixar (да, Pixar, который сделал анимацию) в 2015. До этого Pixar использовала этот фреймворк более 10 лет.Многие анимации, которые мы видели, основаны на фреймворке OpenUSD.
OpenUSD можно понимать как универсальный стандарт для создания 3D-миров для описания, комбинирования, моделирования и сотрудничества.Хуанг сравнил его со «значением HTML для 2D-веб-страниц» и «действительно объединяющим весь мир».
Буквально на прошлой неделе Pixar, Adobe, Apple, Autodesk, Nvidia и JDF объявили о создании Альянса OpenUSD (AOUSD) для содействия стандартизации, развитию, развитию и росту OpenUSD.
Почему это малоизвестное имя объединяет так много компаний-гигантов в разных сферах? Он начинается с рабочего процесса 3D-работы.
Рабочие процессы 3D очень детализированы и сложны, например, дизайнеры, художники и инженеры специализируются на определенной части рабочего процесса 3D, такой как моделирование, текстурирование, материалы, моделирование физики, анимация, дизайн декораций и композитинг.
Поскольку инструменты, которые они используют (PS, AutoCAD, Blender и т. д.), разработаны разными компаниями, многие форматы файлов несовместимы друг с другом, что заставляет пользователей часто экспортировать, конвертировать форматы и импортировать, что утомительно и легко повредить. Контент.
OpenUSD — это технология, созданная для решения этих проблем.Благодаря OpenUSD такие инструменты, как Adobe Stager, Houdini, Maya, Blender, Renderman, Minuteman от Pixar и Unreal Engine от Epic, могут обмениваться данными и играть более важную роль.
Позже Лао Хуанг торжественно объявил, что Omniverse от Nvidia станет первой платформой, полностью построенной для OpenUSD.От базовой базы данных до системы движка каждая строка кода разработана вокруг OpenUSD.
Мало того, Nvidia также запустила API-интерфейсы, такие как RunUSD, ChatUSD и DeepSearch, которые еще больше снизят порог для разработчиков для создания приложений на основе OpenUSD, позволяя комбинировать 3D-рабочие процессы с искусственным интеллектом и другими технологиями.
Например, реклама автомобиля BYD Denza N7, созданная крупнейшей в мире рекламной компанией WPP, была снята в «Метавселенной».
WPP загрузил высокоточные CAD-данные Denza N7 в Omniverse для создания цифрового автомобиля-близнеца, а затем художники WPP могут создавать в среде Omniverse.
Например, вы можете вызвать API ChatUSD, и вам нужно всего лишь ввести описание из одного предложения, чтобы позволить ИИ создавать различные фоновые среды, тем самым создавая тысячи персонализированных клипов с контентом для глобальной маркетинговой деятельности.
Метавселенная и генеративный ИИ представляют собой естественную пару.Когда они встречаются, их ценность возрастает в геометрической прогрессии, и технология OpenUSD делает все это возможным.
Лао Хуанг считает, что в будущем все больше и больше отраслей должны будут пройти цифровую трансформацию, и Omniverse и искусственный интеллект скоро станут наиболее важным рабочим процессом для этих предприятий для завершения цифровой трансформации.
Чтобы построить Omniverse и искусственный интеллект, естественно, неотделима от мощной поддержки вычислительной мощности.Это истинная форма Nvidia:
Благодаря графическому процессору в качестве основы и искусственному интеллекту в качестве оболочки, он является самым мощным инструментом для продвижения промышленной цифровой трансформации.
#Добро пожаловать в официальный публичный аккаунт Айфанер в WeChat: Айфанер (идентификатор WeChat: ifanr), в ближайшее время вам будет представлен более интересный контент.
Ай Фанер | Оригинальная ссылка · Просмотреть комментарии · Sina Weibo