ChatGPT представляет Sora с функцией создания 20-секундного видео с помощью искусственного интеллекта

OpenAI обещает выпустить свою модель видеогенератора следующего поколения Sora с февраля . В понедельник компания наконец представила рабочую версию в рамках мероприятия «12 дней OpenAI».

«Это важнейшая часть нашей дорожной карты AGI», — заявил генеральный директор OpenAI Сэм Альтман во время прямой трансляции компании.

По словам команды OpenAI, Sora будет доступна подписчикам Plus и Pro в США и по всему миру начиная с полудня понедельника.

Сообщается, что ютубер Маркиз Браунли получил ранний доступ к видеогенератору и в понедельник утром опубликовал на своем канале краткий обзор. Похоже, что Sora не построена на основе GPT-4 , как практически все другие генеративные инструменты OpenAI. Модель доступна не на стандартном веб-сайте ChatGPT, а на сайте Sora.com (который на момент публикации этого сообщения все еще не работает).

Модель способна генерировать видео с разрешением от 480p до 1080p продолжительностью от 5 до 20 секунд как из текстовых подсказок, так и из эталонных изображений. Он также способен редактировать и расширять существующие видеоклипы. Подписчикам ChatGPT Plus будет разрешено до 50 поколений клипов с разрешением до 720p в месяц и меньшее количество видео в более высоком разрешении продолжительностью каждое по пять секунд. Пользователям Pro будет разрешено неограниченное количество поколений при любом разрешении и продолжительности до 20 секунд. В дополнение к инструментам редактирования, Sora также предлагает функцию «раскадровки», которая позволит создателям объединить несколько подсказок в одну кинематографическую сцену.

Браунли отмечает, что модели требуется «несколько минут» для создания клипа 1080p, но отмечает, что «это также происходит прямо сейчас, когда почти никто ее не использует. Мне даже интересно, сколько времени это займет, когда это будет открыто для всех желающих». Браунли также отмечает, что модель испытывает значительные трудности с правильной генерацией ног и их движений: передние и задние ноги меняют положение неестественным и непонятным образом.

В отличие от Grok 2 , Sora будет ограничивать то, что могут создавать пользователи, и явно запрещает создание объектов, защищенных авторским правом, людей младше 18 лет и всего, что содержит насилие или «откровенные темы».

Несмотря на лидирующие позиции OpenAI в индустрии искусственного интеллекта, Sora сталкивается с задержками на протяжении всего процесса разработки, что позволяет таким конкурентам, как модели Gen-3 Alpha от Runway , Kling от Kuaishou Technology и модели Movie Gen от Meta, опередить ее на рынке. Сора также недавно (хотя и ненадолго) была публично раскрыта группой бета-тестеров, которые обвинили компанию в «художественном занижении» возможностей модели.