Meta сделала DALL-E для видео, и это одновременно жутко и потрясающе

Meta представила сумасшедшую модель искусственного интеллекта, которая позволяет пользователям превращать напечатанные описания в видео. Система называется Make-A-Video и является последним трендом контента, созданного искусственным интеллектом в Интернете.

Система принимает короткие описания, такие как «робот, скользящий по волнам в океане» или «рыба-клоун, плывущая через коралловый риф», и динамически генерирует короткий GIF-файл с описанием. Есть даже три разных стиля видео на выбор: сюрреалистический, реалистичный и стилизованный.

Кисть художника рисует на холсте крупным планом

Согласно сообщению генерального директора Meta Марка Цукерберга в Facebook , перевести письменный текст в видео намного сложнее из-за того, что видео требует движения:

«Создавать видео намного сложнее, чем фотографии, потому что помимо правильной генерации каждого пикселя система также должна предсказывать, как они будут меняться с течением времени. Make-A-Video решает эту проблему, добавляя уровень неконтролируемого обучения, который позволяет системе понимать движение в физическом мире и применять его к традиционному преобразованию текста в изображение».

Молодая пара гуляет под проливным дождем

Исследовательская группа искусственного интеллекта Meta написала документ , в котором описывается, как работает система и чем она отличается от текущих методов преобразования текста в изображение (T2I). В отличие от других моделей машинного языка, метод Meta Text-to-Video (T2V) не использует предварительно определенные пары текст-видео. Например, он не сочетает «идущего человека» с видео, где идет настоящий мужчина.

Если это звучит очень похоже на DALL-E, популярное приложение T2I, вы не за горами. После того, как DALL-E приобрел популярность, появились и другие приложения T2I. В августе TikTok выпустил фильтр под названием AI Greenscreen, который генерирует изображения в стиле рисования на основе введенных вами слов.

Пушистый ленивец в оранжевой вязаной шапке пытается понять ноутбук крупным планом, высокодетализированный экран студийного освещения, отражающийся в его глазу

За последние несколько лет контент, созданный ИИ, стал довольно популярным. Технология Deepfake , методы машинного обучения для замены лица человека другим, даже используется студиями визуальных эффектов для крупнобюджетных шоу, таких как «Мандалорец ».

В июле The Times ошибочно сообщила об украинке в разгар российско-украинской войны. Проблема в том, что она не настоящая .

Угроза искусственного интеллекта, вероятно , не является реальной угрозой , но такие проекты, как DALL-E и Make-A-Video, — это забавные исследования некоторых интересных возможностей.