Люди снимают целые короткометражные фильмы с помощью этого нового приложения для создания видео с помощью искусственного интеллекта.

скриншот видео MiniMax AI, на котором собака бежит по полю
МиниМакс

Стартап Minimax, поддерживаемый Alibaba и Tencent , один из китайских « тигров искусственного интеллекта », выпустил свою модель преобразования текста в видео Video-01, которая может генерировать высокоточные изображения людей, вплоть до движений их рук. Minimax представила новый инструмент в субботу на своей первой конференции разработчиков в Шанхае.

Video-01 позволяет пользователям создавать 6-секундные видеоролики с разрешением 1280 x 720 и частотой 25 кадров в секунду с помощью текстовых подсказок, как сообщается, примерно за 2 минуты. На конференции генеральный директор Minimax Ян Цзюньцзе отметил, что это только первая итерация модели и что будущие обновления будут включать в себя возможность генерировать видео из изображений и редактировать эти созданные видео, как сообщает South China Morning Post: «Мы действительно сделали значительный прогресс в создании видеомоделей, и, согласно внутренним оценкам и оценкам, наша производительность в создании видео лучше, чем у Runway», — сказал он журналистам.

Чтобы попробовать Видео-01 самостоятельно, зайдите на сайт Видео-01 . Во время написания этой статьи сайт был наводнен пользователями, поэтому процесс создания видео занял около 5 минут, но мне не потребовалось вводить номер мобильного телефона или иным образом входить в систему, чтобы использовать его. Как и в случае с другими ведущими системами искусственного интеллекта для видео, такими как Kling и Runway, вы можете диктовать кинематографические движения камеры в текстовой подсказке. В результате качество видео было довольно хорошим, поразительно реалистичным и не содержало каких-либо значительных визуальных галлюцинаций, обычно встречающихся в аналогичных бесплатных инструментах искусственного интеллекта . Видео также можно загрузить в формате .MP4.

Video-01 присоединяется к все более насыщенному рынку создания видео, даже без долгожданного появления Sora от OpenAI . Два других «тигра», Shengshu AI и Zhipu AI (оба оцениваются более чем в 1 миллиард долларов), в июле выпустили свои собственные инструменты для преобразования текста в видео, как и Kaishou Industries с Kling.AI . Byte Dance также недавно выпустила свой собственный инструмент для преобразования текста в видео. Приложение Jimeng для преобразования текста в видео в магазинах приложений Apple и Android, хотя оно доступно только для пользователей в Китае, Minimax придется конкурировать с такими приложениями, как Dream Machine от Luma Labs и Gen-3 от Runway .