Самая объемная ночь! Google-версия ChatGPT открыта, Nvidia сбросила ядерную бомбу на видеокарту… Когда я просыпаюсь, ИИ снова изменился
«Момент iPhone» для ИИ настал
На только что завершившейся конференции Nvidia GTC 2023 генеральный директор Nvidia Хуан Ренсюнь трижды повторил эту точку зрения.
Как понимать?
Технология мультисенсорного экрана iPhone создала совершенно новый режим взаимодействия интерфейса смартфона, который дал начало мобильному Интернету.
Появление суперприложений ИИ, таких как ChatGPT и Stable Diffusion, знаменует собой зрелость технологий ускоренных вычислений и ИИ.ИИ проникает во все сферы жизни с беспрецедентной скоростью и способствует новой промышленной революции.
После непрерывного развития технологии ИИ в последние годы мощные вычислительные мощности и передовые модели обеспечивают подходящую платформу приложений для ИИ, побуждая различных производителей переосмысливать свои продукты и бизнес-модели, а также скорость итераций обновлений.
Прошлой ночью Nvidia, Microsoft, Google, Adobe и другие производители почти одновременно запустили свои соответствующие сервисы ИИ.
«В эту эпоху большого ИИ, если вы не хотите, чтобы другие вас ниспровергали, вы должны сначала ниспровергнуть других».
Как ИИ изменит нашу жизнь? После просмотра «Самой громкой ночи AIGC» у вас может возникнуть более глубокое чувство.
Nvidia внедряет ИИ во все отрасли
Nvidia представила много привлекательных «новых мероприятий» на ежегодной конференции GTC.
Например, она выпустила технологию изготовления ядер с помощью ИИ под названием CuLitho, которая проложила путь для 2-нанометрового техпроцесса, сотрудничала с такими автопроизводителями, как Lotus, Mercedes-Benz и BMW, и использовала Omniverse для создания цифровых производственных линий.
Но когда дело доходит до самого привлекательного контента всей конференции GTC, это должна быть новая графическая карта, выпущенная Nvidia — H100 NVL с двумя графическими процессорами NVLink.
H100 NVL — это графическая карта, специально разработанная для ChatGPT, которая требует огромной вычислительной мощности.H100 NVL имеет преувеличенно 188 ГБ памяти HBM3 (94 ГБ на карту), которая в настоящее время является самой большой картой памяти, выпущенной Nvidia.
Большая языковая модель, такая как GPT, потребляет много ресурсов памяти Теоретически модель GPT с сотнями миллиардов параметров может быстро заполнить графическую карту H100.
По сравнению с HGX A100 для обработки GPT-3, стандартный сервер, использующий четыре пары H100 и NVLink с двумя GPU, работает в 10 раз быстрее, «ядерная бомба» H100 NVL идеальна для крупномасштабного развертывания языковых моделей, таких как ChatGPT.
Еще одна большая работа Nvidia — перенести «та же модель ChatGPT» в облако и открыть ее для публики.
Работа ChatGPT в основном зависит от суперкомпьютера DGX, состоящего из A100 или H100.Microsoft потратила сотни миллионов долларов на покупку десятков тысяч графических карт A100 для формирования платформы облачных вычислений Azure.
Чтобы снизить стоимость развертывания больших моделей для пользователей, Nvidia запустила облачный сервис DXG.Начиная с $36 999 в месяц вы можете получить облачный суперкомпьютер, состоящий из 8 видеокарт H100 или A100, для легкого выполнения высоконагруженных вычислительных задач.
В 2016 году Лао Хуан лично поставил OpenAI первый суперкомпьютер DGX. Семь лет спустя самые мощные вычислительные мощности ИИ получили возможность войти в каждую компанию через DXG Cloud, выполняя задачи, которые раньше были невозможны.
Нетрудно представить, что передовые приложения, такие как ChatGPT, которые могут улучшить человеческое общение и эффективность работы, будут продолжать появляться, принося больше удобства и сюрпризов в нашу жизнь.
Превращая камень в золото, второе поколение Runway позволяет создавать все виды блокбастеров одним предложением.
На Станции Б всегда было популярное преследование: видео нельзя публиковать, так что это правда. Но теперь видео можно не только преобразовать, но и создать напрямую с помощью ИИ с нуля, без художников, фотографов или постобработки. Пока вы вводите абзац текста в Runway, он возвращает вам шокирующее короткое видео.
Поначалу Runway был вспомогательным инструментом для постпродакшна, хотя он и использовал магическую силу искусственного интеллекта, но то, что он мог делать, было несложным: стирание объектов, интерполяция изображений, удаление фона, отслеживание движения и т. д. Его можно рассматривать как Adobe Премьерный плагин для чайников.
И когда Подиум открыл новую дверь для искусственного интеллекта, у него появилась способность превращать камни в золото. В версии Gen 1, анонсированной в сентябре прошлого года, есть возможность конвертировать текст в видео. В то время люди только что увидели магию преобразования текста в изображение, и Runway могла напрямую генерировать динамические изображения, что было столь же шокирующим, как и удар по уменьшению размерности.
Спустя полгода Runway Gen 2 уже здесь.
По сравнению с моделью Gen 1 достигается более высокая временная согласованность и точность, с точки зрения человека связь между изображениями более плавная, а качество изображения выше.
С Gen 2 вы на один шаг ближе к созданию видеороликов вашего воображения в любое время и в любом месте.
Введите короткое слово-подсказку: горы, сфотографированные дронами. На основании этого Runway генерирует следующий экран.
Вот еще: послеполуденный солнечный свет льется из окон квартиры в Нью-Йорке.
Зайдите в расширенную версию, загрузите изображения и текст в Runway, а затем создайте короткое видео.
▲ Текст такой: Мужчина идет по улице, и его освещают неоновые огни окружающих баров.
▲ Исходное изображение
Или анимировать статическое изображение.
Также можно напрямую визуализировать динамическое изображение из нетекстурированной анимации для визуализации.
Прогресс "Подиума" очевиден для всех. Он шел все дальше и дальше и все ровнее по дороге по сравнению с сетевой моделью. Сегодняшнюю версию Gen 2 можно считать "смотрибельной". Хоть она и не изысканна, но можно ожидать будущего.
Возможно, когда дело доходит до версии Gen 3, с ее помощью мы сможем создавать короткие видеоролики Douyin одним щелчком мыши. Будет ли это кошмаром для качественных блоггеров в то время?
Лопаться! Google начинает тестирование Барда
Если Nvidia позволяет нам увидеть будущее развития ИИ, то Google Bard — это сегодняшний ИИ.
После того, как все были в шоке от GPT-4 и Midjourney V5 в течение недели, пока Лао Хуанг с нетерпением ждал грядущей эры ИИ, Google объявил об официальном открытии доступа к Bard: пожалуйста, попробуйте Bard и оставьте свой отзыв.
Согласно последней демонстрации Google, Bard больше похож на личного помощника, ориентированного на работу и учебу, чем на ChatGPT, с его помощью вы можете стимулировать идеи и удовлетворять любопытство.
Вы можете попросить Барда объяснить квантовую физику простым языком или попросить Барда провести мозговой штурм и помочь вам прочитать 20 книг за год.
В Google заявили, что пользователи могут ускорять идеи и стимулировать любопытство с помощью Барда. Вы можете использовать Bard, чтобы давать советы, например, как читать 20 книг в год или объяснять квантовую физику простым языком.
Мы также нашли некоторые детали в содержании демо. Бард, кажется, генерирует несколько ответов одновременно. Вы можете выбрать тот, который подходит вам лучше всего в соответствии с вашими потребностями, и продолжать задавать вопросы.
Конечно, ChatGPT также может генерировать несколько ответов, но он восстанавливается после завершения ответа.Для сравнения, Bard больше похож на сторону B, которая одновременно предоставляет несколько решений.
Возможно, негативные новости о ChatGPT и Bing Chat привлекли внимание Google, который постоянно подчеркивает, что Bard — это всего лишь эксперимент, а информация, генерируемая Bard, не отражает точку зрения Google.
Google заявил, что, хотя Bard основан на большой языковой модели и со временем станет сильнее, он изучит некоторые предубеждения или стереотипы, заставляя его «уверенно» произносить некоторую неточную или ложную информацию, например, он будет понимать «ZZ Plant». как Zamioculcas zamioculcas вместо правильного Zamioculcas zamiifolia.
С учетом уроков, извлеченных из «сумасшедшего» Bing Chat, первая бета-версия Bard ограничила количество обменов в одном разговоре, чтобы обеспечить точность содержимого. Когда вы впервые входите в Bard, он говорит вам, что это эксперимент, и ждет ваших отзывов.
Как первая версия Bard, она пока не поддерживает больше языков (включая китайский), и Google продолжит обновлять написание кода, распознавание/генерацию изображений и многоязычную поддержку.
▲ Бард: я не знаю китайского, но надеюсь в будущем говорить по-китайски
В настоящее время доступ к Bard открыт только в Соединенном Королевстве и Соединенных Штатах, и в будущем он будет постепенно распространяться на другие страны и регионы.
Вы можете делать фотографии во время чата, Bing Chat делает шаг вперед
Насколько популярен Bing Chat, объясняют, пожалуй, только данные о том, что Bing DAU впервые после запуска превысил 100 миллионов. От сложных вопросов до развлекательных чатов и реализации вдохновенных идей — Bing Chat меняет способ поиска в Интернете.
Отныне вы можете попросить Bing Chat рисовать картинки.
Microsoft обновила предварительные версии новых браузеров Bing и Edge тремя новыми функциями: Bing Image Creator, истории на основе ИИ и карты знаний 2.0. Самым важным из них является Bing Image Creator, который умеет рисовать картинки.
По данным Microsoft, человеческий мозг обрабатывает визуальную информацию примерно в 60 000 раз быстрее, чем текст.В поисковых данных Bing изображения являются одним из наиболее популярных типов.Bing Image Creator, основанный на усовершенствованной версии модели DALL·E, может позволить нам используйте наш собственный язык для описания информации об изображении в чате Bing, выберите художественный стиль, и Image Creator подключит контекст и «нарисует ваше воображение на бумаге».
Добавление Bing Image Creator делает браузер Edge первым браузером, в котором интегрирован генератор изображений с искусственным интеллектом.
Истории и карты знаний 2.0, основанные на искусственном интеллекте, позволяют вам после поиска получать изображения, короткие видеоролики и инфографику, управляемые искусственным интеллектом, и вы можете сразу получать факты и ключевую информацию.
Когда вы будете использовать Bing для поиска в будущем, вы получите не холодные веб-ссылки, а более богатые и интересные изображения, видео и визуальные истории.
Если вы подали заявку через новый Bing, теперь вы можете использовать Bing Image Creator в чате Bing, а если вы войдете со следующего URL-адреса, вы сможете попробовать его напрямую.
https://www.bing.com/создать
Однако в настоящее время эта функция поддерживает только английский язык и будет обновляться в будущем.
Adobe Firefly: «Самая мощная поддержка среди союзников»
Когда технологические компании берутся за создание изображений, известная дизайнерская и креативная компания Adobe, естественно, не отстает. В эту сумасшедшую ночь Adobe также запустила собственную коллекцию творческих генеративных моделей искусственного интеллекта: Adobe Firefly.
Adobe продемонстрировала возможности Firefly на нескольких простых примерах. Вы можете использовать одно предложение, чтобы превратить весенний пейзаж в зимний.
Вы также можете использовать кисть на траве, чтобы рисовать случайным образом, а затем сказать Firefly, что это река, и он автоматически сгенерирует реку.
Естественно, Firefly может сделать больше: выбрать шерсть собаки, он может превратить волосы в щетку и помочь собаке изменить прическу на месте, создать искусство слова, он может помочь вам создать слово или предложение; создайте наушники, Firefly также может поместить их в сцену и превратить в витрину продукта…
Adobe считает, что ИИ предоставляет новый способ открывать мир, и дизайнеры могут использовать наиболее удобный способ реализации творчества, «помогая творческим людям, а не заменяя их».
В то же время Adobe также создала CAI «Content Authenticity Initiative», которая установила глобальный стандарт для атрибуции доверенного цифрового контента и отметила контент, созданный искусственным интеллектом, для создания экосистемы Firefly. Сильнейшая поддержка».
Атака на AIGC
В эту ночь мы стали свидетелями нескольких крупных прорывов в области ИИ от сервисного уровня до прикладного уровня.
Эти кластерные обновления доказывают со стороны, что область ИИ вступила в стадию быстрого развития. В прошлом месяце ИИ, возможно, не умел хорошо рисовать пальцы, в следующем месяце, с увеличением вычислительной мощности и апгрейдом моделей, ИИ уже может заменить работу моделей одежды.
Бесчисленные научно-фантастические произведения предсказывали, что ИИ станет частью нашей жизни в будущем, но никто не сказал нам, что мы находимся всего в нескольких шагах от этого будущего.
Наша жизнь постепенно переписывается искусственным интеллектом. На конференции GTC Хуан Ренсюнь выдвинул интересную точку зрения: он считает, что генеративный ИИ — это компьютер нового типа, мы можем программировать на человеческом языке, и любой может приказать компьютеру решать задачи.
За последние несколько месяцев мы стали свидетелями того, как ИИ постепенно овладевал такими навыками, как рисование, письмо, редактирование, составление таблиц и PPT.Если эта скорость эволюции сохранится, есть ли что-то, что ИИ не может сделать?
Генеральный директор OpenAI Сэм Альтман недавно смело предсказал новую версию «Закона Мура» в Твиттере, полагая, что объем глобальных вычислений искусственного интеллекта будет удваиваться каждые 18 месяцев.
Другими словами, если вы все еще сомневаетесь в генеративном ИИ, то время даст вам самый весомый ответ.
#Добро пожаловать, обратите внимание на официальный публичный аккаунт Айфанер в WeChat: Айфанер (идентификатор WeChat: ifanr), более интересный контент будет представлен вам как можно скорее.
Ай Фанер | Оригинальная ссылка · Просмотреть комментарии · Sina Weibo