Это была огромная неделя для AI. Вот 5 самых важных объявлений, которые вам нужно знать

21 сентября, 2024 Дядя Влад

Гонка за достижением AGI (общего искусственного интеллекта) продолжалась, и это казалось монументальной неделей в быстром развитии ИИ.

Давайте взглянем на некоторые из главных историй об искусственном интеллекте на этой неделе: от Apple, дающей нам представление о своем интеллекте, до огромных достижений в области видео, генерируемого ИИ.

Программный запуск Apple Intelligence

Белый iPhone 16 лежит снаружи лицевой стороной вниз, окруженный кучей листьев. — Джо Маринг / Цифровые тенденции

Это была насыщенная неделя для производителя устройств из Купертино. Мы увидели публичный дебют iOS 18 , WatchOS 11 и MacOS 15 , за которым сразу же последовали поступления в продажу iPhone 16 и Apple Watch 10, а также Apple выпустила свое первое обновление для новой ОС с бета-версией 18.1 .

Бета-версия не предлагает полный набор функций ИИ — мы не ожидаем увидеть его до официального выпуска 18.1 в октябре — но этого достаточно, чтобы дать заинтересованным пользователям почувствовать, на что вскоре будет способен генеративный агент ИИ. .

Однако, судя по тому, что уже видел Digital Trends , Apple Intelligence, вероятно, потребуется дополнительная доработка и полировка, прежде чем он будет готов для публики.

Lionsgate сотрудничает с Runway для обучения видеомоделей искусственного интеллекта

Странно, но я мог бы поклясться, что прошлогодняя забастовка голливудских писателей произошла именно в ответ на необдуманное использование Голливудом генеративного искусственного интеллекта. Эти коллективные действия, очевидно, мало что сделали, чтобы отговорить Lionsgate от немедленного возвращения к победе в сфере искусственного интеллекта, которая на этой неделе объявила о партнерстве с Runway, создателями модели поколения видео Gen-3 Alpha.

По соглашению обе компании будут сотрудничать в разработке и обучении модели создания видео с использованием обширного каталога кино- и телеконтента Lionsgate. Они планируют использовать его для «разработки передовых, капиталоэффективных возможностей создания контента», что, как мы все знаем, является отличительной чертой великого кино, а не плохо продуманной попыткой лишить прав тысячи художников по раскадровке, дизайнеров освещения и эффектов. актеры, музыканты и другие люди, которые выполняют фактическую работу по созданию фильмов и сериалов, заменяя их собранным вместе генеративным искусственным интеллектом.

Snap выпускает новые гигантские очки Spectacles AR

Snap продолжает пытаться сделать очки AR реальностью. На этой неделе компания выпустила пятую и последнюю версию своей линейки очков Spectacles AR . Новое оборудование предлагает более широкое поле зрения и дисплей, похожий на «100-дюймовый дисплей на расстоянии 10 футов», в то время как SnapOS и связанное с ним приложение для смартфона получили значительные обновления по сравнению с предыдущими версиями. Сообщается, что Snap также сотрудничает с OpenAI, чтобы внедрить «облачные мультимодальные модели искусственного интеллекта» в умные очки.

Новые характеристики также весят приличные 226 граммов, что более чем на 100 граммов больше, чем прошлогодняя версия, и выглядят так, как будто бы носила Эдна Мод . В настоящее время они доступны только разработчикам, которые платят 99 долларов в месяц за доступ к программе, и пока нет информации о том, когда будет выпущена потребительская версия.

Новые инструменты искусственного интеллекта YouTube выполняют за вас большую часть процесса создания контента.

Логотип YouTube на экране телефона — Гринвиш / Пексели

Стремясь снизить входной барьер для новых создателей контента и лучше конкурировать с платформами коротких видео, такими как TikTok, YouTube на этой неделе представил множество новых инструментов производства с улучшенным искусственным интеллектом . В среду на мероприятии Made on YouTube в Нью-Йорке компания Google объявила, что модель создания видео Veo от DeepMind будет включена в YouTube Studio. Модель может генерировать шестисекундные видеоролики с разрешением 1080p и широкий спектр кинематографических стилей, используя только текстовую подсказку.

Компания позиционирует эти новые функции как помощника для «мозгового штурма», который может предлагать темы для видео, а также генерировать заголовок, миниатюру и первые несколько строк сценария. Пользователи также смогут использовать Veo в сочетании с Dream Screen, который генерирует фоновые изображения с помощью искусственного интеллекта. Вы сможете создать статический фон с помощью Dream Screen, а затем анимировать его с помощью Veo.

Кстати, знаете ли вы, что написание чат-ботом электронного письма из 100 слов потребляет эквивалент трех бутылок воды и 14 светодиодных лампочек, работающих в течение часа? Может быть, попробуйте использовать свою голову для мозгового штурма некоторых оригинальных идей вместо того, чтобы кипятить озера, чтобы услышать рекурсивные предложения большой языковой модели.

Gen-3 Alpha от Runway теперь предлагает преобразование видео в видео.

Runway Gen-3 Alpha только что вышел на новый уровень благодаря видео-в-видео
Теперь вы можете изменить стиль любого видео, используя только текстовые подсказки в потрясающем качестве.
10 диких примеров того, что возможно: pic.twitter.com/onh12zCzpI
— Мин Чой (@minchoi) 15 сентября 2024 г.

Прежде чем объявить о своем партнерстве с Lionsgate, Runway начала неделю с внедрения новой функции для своей модели генерации видео Gen-3 Alpha: возможность изменять кинематографический стиль любого видео с помощью текстовых подсказок. Энтузиасты искусственного интеллекта отлично проводят время с новым инструментом.

Вы можете увидеть технологию в действии в сообщении в социальной сети выше. На этой неделе Runway также представил API, который позволит сторонним разработчикам включать видеомодель в свои собственные приложения, системы и устройства.