Новые видеоролики OpenAI, созданные искусственным интеллектом, поражают воображение людей
Последнее предприятие OpenAI в области искусственного интеллекта, возможно, является самым впечатляющим на сегодняшний день. Эта новая модель искусственного интеллекта, получившая название «Сора», только что открыла свои двери для ограниченного числа пользователей, которые смогут ее протестировать. Компания запустила его, показав несколько видеороликов, полностью созданных искусственным интеллектом, и конечные результаты поразительно реалистичны.
OpenAI представляет Sora, заявляя, что она может создавать реалистичные сцены на основе текстовых подсказок, и видеоролики, размещенные на ее веб-сайте, служат доказательством этого. Подсказки описательные, но короткие; Лично я использовал более длинные подсказки, просто взаимодействуя с ChatGPT . Например, чтобы создать видео с шерстистыми мамонтами, изображенное выше, Соре потребовалась подсказка из 67 слов, описывающая животных, окружающую среду и расположение камеры.
Представляем Sora, нашу модель преобразования текста в видео.
Сора может создавать видеоролики продолжительностью до 60 секунд с высокодетализированными сценами, сложными движениями камеры и несколькими персонажами с яркими эмоциями. https://t.co/7j2JN27M3W
Подсказка: «Красиво, снежно… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) 15 февраля 2024 г.
«Sora может генерировать видеоролики продолжительностью до минуты, сохраняя при этом визуальное качество и следование указаниям пользователя», — говорится в заявлении OpenAI. ИИ может создавать сложные сцены, наполненные множеством персонажей, пейзажей и точным движением. С этой целью OpenAI утверждает, что Сора предсказывает и читает между строк по мере необходимости.
«Модель понимает не только то, что пользователь запросил в командной строке, но и то, как эти вещи существуют в физическом мире», — заявили в OpenAI. Модель не просто прорабатывает персонажей, одежду или фон, но также создает «неотразимых персонажей, выражающих яркие эмоции».
Сора также может заполнить пробелы в существующем видео или сделать его длиннее, а также создать видео на основе изображения, так что это не только текстовые подсказки.
Хотя видео выглядят хорошо в виде скриншотов, в движении они просто ошеломляют. OpenAI предоставила широкий спектр видеороликов, демонстрирующих новые технологии, включая улицы Токио в стиле киберпанк и «исторические кадры» Калифорнии во время золотой лихорадки. Есть и еще кое-что, включая очень крупный план человеческого глаза. Подсказки охватывают все, от мультфильмов до фотографий дикой природы.
Сора все же допустил несколько ошибок. Если присмотреться, можно увидеть, что, например, у некоторых фигур в толпе нет голов или они странно двигаются. В некоторых образцах неловкое движение бросалось в глаза с первого взгляда, но чтобы заметить общую странность, потребовалось несколько просмотров.
Возможно, пройдет некоторое время, прежде чем OpenAI откроет Sora для широкой публики. Прямо сейчас модель протестируют красные команды, которые оценят потенциальные риски. Некоторые авторы также смогут начать его тестирование уже сейчас, пока он все еще находится на ранних стадиях разработки.
ИИ все еще несовершенен, поэтому я ожидал чего-то довольно запутанного. Будь то низкие ожидания или способности Соры, я ухожу впечатленный, но также и слегка обеспокоенный. Мы уже живем в мире, где трудно отличить подделку от чего-то настоящего, и теперь под угрозой не только изображения, но и видео. Однако Sora далеко не первая модель преобразования текста в видео, которую мы видели, такая как Pika .
Другие тоже поднимают флаг, например, популярный технический YouTube-блогер Маркес Браунли , который написал в Твиттере, что «если это вас хоть немного не касается, то ничего не будет» в ответ на видео Сора.
Каждое из этих видео создано искусственным интеллектом, и если вас это хоть немного не касается, то уже ничего не будет.
Новейшая модель: https://t.co/zkDWU8Be9S .
(Помнишь, Уилл Смит ест спагетти? У меня так много вопросов) pic.twitter.com/TQ44wvNlQw
— Маркес Браунли (@MKBHD) 15 февраля 2024 г.
Если Sora от OpenAI сейчас так хороша, трудно представить, на что она будет способна через несколько лет дальнейшей разработки и тестирования. Это технология, которая потенциально может заменить многие рабочие места, но, будем надеяться, что, как и ChatGPT, вместо этого она будет сосуществовать с людьми-профессионалами.