Как человеческая маскировка под Сору стала паролем дорожного движения?

24 февраля, 2024 Дядя Влад

Уилл Смит снова создал мем, в прошлый раз это была пощечина Оскара, на этот раз мукбанг со спагетти.

В марте 2023 года пользователь сети Reddit использовал искусственный интеллект для создания забавного видео, на котором Уилл Смит ест лапшу: его лицо было отвратительным, а черты лица были деформированы, из-за чего люди теряли аппетит.

В феврале 2024 года, через два дня после того, как OpenAI выпустила Sora, Уилл Смит опубликовал в Instagram сравнительное видео поедания лапши: он стал красивее, а его движения в еде стали более приличными.

Как вы думаете, вторую половину видео создал Сора? Нет, лапшу ел сам Уилл Смит, и он выполнил всю работу.

Передняя нога была потрясена официальной демонстрацией Соры, а задняя нога увидела эту динамику, и люди засомневались в том, кто я, откуда я и куда иду.

Хотя Сора еще не открыта для публики, Интернет становится все более нелепым: видеоролики ИИ становятся все ближе и ближе к реальности, и все больше и больше видеороликов из реальной жизни являются фальшивыми ИИ.

Я не знаю, сможет ли это убить Голливуд, но сначала Сора сжег мне ствол мозга.

Мы более или менее видели видео стабильной работы Соры. В то же время OpenAI также щедро выпустила видеоролики с опрокидыванием. Некоторые из них более популярны в социальных сетях, особенно следующая подсказка: «Археологи нашли несколько автомобилей в пустыня. Обычный пластиковый стул, тщательно выкопанный и вычищенный» видео.

Кресло кажется дышащим, мыслящим существом из другого мира, не связанного гравитацией и человеческой силой, появляется и трансформируется из воздуха и даже тайно уносит человека. Возможно, это не вина ИИ, ведь слово-подсказка не указывает, находятся ли они на земле.

Если бы видео было распространено в социальных сетях, оно могло бы быть помечено тегами: #потоксознания, #сюрреализм, #preciousvideoofearlyhumankindtamingthewildchair…

OpenAI серьезно объяснила, почему произошел баг: Соре не удалось смоделировать стул как жесткий объект, то есть объект, не меняющий форму и объем под действием внешних сил, поэтому физическое взаимодействие было неточным.

Видео Соры о том, как разбить чашку, кажется искусством, которое можно увидеть только после того, как съешь ядовитые грибы. Чашка на самом деле движется автоматически, без ветра. Жидкость вылетает из стекла, как желе, прежде чем разбиться. Каждый шаг неожидан.

Кроме того, есть спортсмены, использующие беговые дорожки задом наперед, праздничные свечи, которые невозможно задуть, волки, которые появляются и исчезают из воздуха… ИИ непреднамеренно совершает вещи, которые не может себе представить ни человеческий мозг, ни спецэффекты.

В техническом отчете OpenAI не было четкой позиции, а лишь упоминалось, что Sora может моделировать некоторые аспекты людей, животных и окружающей среды в реальном мире. , но может быть сложно точно смоделировать физические принципы сложных сцен, например, перепутать левое и правое и не оставить следов укуса после откусывания печенья.

Хотя ИИ еще не развился до законченного состояния, вы можете использовать свое воображение. Видео с искусственным интеллектом, которые еще не стабильны, можно использовать в качестве библиотеки материалов для тем сверхъестественного, саспенс, ужасов и фэнтези, обеспечивая новое вдохновение для творчества.Чем больше вы пытаетесь поднять гроб Ньютона, тем более артистичным становится ваше исполнение.

Точно так же, как «копать стулья» и «разбивать чашки», их уже можно использовать в клипах, рекламе, фильмах и играх. Это по-прежнему похоже на большую постановку. Несмотря на то, что эффект странный, он на удивление плавный. Он превосходит Station Б. Серия «Изучал мультипликацию пять лет».

Несмотря на то, что контент был таким волшебным, некоторые пользователи сети все же на секунду колебались: «Если бы ошибка не была обнаружена, я бы сомневался, что ее сняли на видео», «Это волшебный трюк?»

Это связано с тем, что даже ролловер-видео Соры все еще может превосходить «предшественников», таких как Pika и Runway, с точки зрения продолжительности, качества изображения и стабильности.

В то время как другие инструменты генерируют видео длительностью не более 3–4 секунд и стараются сделать один кадр максимально стабильным, Sora повышает верхний предел до 1 минуты, чтобы добиться плавного переключения нескольких кадров и относительно точно поддерживать последовательность основного объекта. и визуальный стиль картины, как будто умеет ею пользоваться. Язык объектива и ритм повествования рассказывают истории.

На первый взгляд кажется, что за сценой следят настоящие камеры: люди, объекты и сцены движутся в трехмерном пространстве, и один и тот же персонаж может иметь несколько ракурсов.

▲ Сора может достичь разных точек зрения.

Некоторые шутят, что это скачок от «анимационных картинок» к «видео», генерируемым ИИ.

К их числу, безусловно, можно причислить видео, где Сора переворачивает машину: это как написать кучу кода в каше, но он запускается.

Чжоу Хунъи, председатель 360, рассказал об интересном моменте на Weibo: "Сора работает как человеческий сон. Мы будем мечтать о странных вещах, но это основано на том, что мы видим своими глазами и накопленном жизненном опыте. В этом нет необходимости". 3D-модели и покадровый рендеринг, как в кино- и телеиндустрии.

С определенной точки зрения, генеративный ИИ действительно подобен машине мечты, которая все ближе и ближе приближается к человеческому мышлению. Он использует различные слова-подсказки для создания разумных или необоснованных ответов с вероятностью. Независимо от того, правильный это или неправильный, он обязательно будет дать вам ответ.

Фактически, с момента появления ChatGPT люди хотели использовать ИИ, чтобы воплотить мечты в реальность. На Xiaohongshu есть много постов, которые визуализируют сны. Хотя они не могут по-настоящему восстановить эффект в уме, они также приносят некоторые фантомы духовного мир в реальность.

В будущем Сора может сделать сны и творчество человека более яркими. Вводя текст, изображения или видео, вы сможете добавлять изменения света и тени, регулировать угол изображения и даже добавлять звуковые эффекты «одним щелчком мыши»…

Не знаю, потеряет ли голливудская элита работу.Пользователи сети уже горят желанием попробовать.Помимо инстинкта заниматься порнографией, у них еще есть куда приложить свое воображение.

Люди, которые смеются над собственными неудачами, используют подражание Соре в качестве пароля для трафика.

Помимо видео с переворачиванием автомобиля, другие видео Соры на первый взгляд поражают воображение, но они не выдерживают пристального внимания лупы. Искаженные символы на вывеске магазина, пятая лапа кота, неверные шаги модели…

Ошибки, возможно, являются последней стеной между ИИ и реальностью, но люди сами хотят ее разрушить.

Хотя Сора еще не открыт для публики, те, кто продает курсы и фишки, зарабатывают деньги, а те, кто развлекается трюками, также нашли способы ловить рыбу в мутной воде и изобрели новый способ привлечения трафика.

Когда они разместили видео в социальных сетях, они добавили к копии «создано Сорой» и приличные подсказки, притворяясь, что их сделал ИИ, точно так же, как Уилл Смит имитирует ИИ, имитирующего самого себя.

Участвуют короткие видеоблогеры из разных регионов. Те, кто хвастается милыми домашними животными, играет в игры, знакомится с кумирами Amway, рекламирует товары… неужели они не вдохновляют Сору на трудоустройство?

Среди них сложнее всего отличить подлинный от подделки, несомненно, болливудские фильмы. Сюжеты и спецэффекты индийских полицейских фильмов особенно удивительны. Они слишком сложны для людей и делают физику несуществующей. Даже искусственному интеллекту приходится у них учиться. . .

Если бы не энтузиасты, которые добавили комментарии и прикрепили ссылку на YouTube, загруженную 11 лет назад, чтобы доказать бесчеловечную новаторскую природу индийских фильмов, никто бы не осмелился за это поручиться.

К веселью присоединился даже официальный аккаунт Netflix India, который перехватил отрывок из индийского антибританского фильма "RRR" и притворился, что его сгенерировал Сора. Согласно обычному преувеличению индийских блокбастеров, первые несколько секунд действительно могут обмануть аудитория.

Хотя эти фальшивые видеоролики с искусственным интеллектом созданы людьми, а смешанный в них искусственный интеллект кажется обычным, ИИ, возможно, не сможет их имитировать.

Запутывая общественное мнение и навлекая его на себя, вред по-прежнему причиняется людьми, и возникает цепочка подозрений.

Пользователи сети начали беспокоиться, что, когда фотографии, созданные искусственным интеллектом и реальные фотографии, действительно неясны, у них могут быть «убедительные доказательства», даже если они ничего не сделали.

Таков сюжет напряженной британской драмы «Пойнт правды»: спецслужбы подделали видео наблюдения, чтобы осудить преступников.

Они считают, что подделка видеозаписей наблюдения — это просто «воспроизведение» незаконных доказательств, таких как материалы прослушивания телефонных разговоров, в юридические доказательства.

Но никто не знает, перейдут ли люди, использующие технологии, черту и перейдут от прививки и прививки к созданию чего-то из ничего.

Определение методов реагирования ИИ можно использовать и с другой стороны, чтобы сбежать из панциря золотой цикады.

Поскольку ИИ не очень хорошо рисует руки, в прошлом существовал мем, в котором преступники носили фальшивые пальцы для совершения преступлений. Выглядело так, будто у них было шесть пальцев. Это могло означать, что видео наблюдения создано ИИ и не может быть использовано в качестве доказательства в суде.

ИИ близок к реальности, а люди притворяются ИИ. ИИ также может использоваться для фальсификации доказательств, представленных в суде, и признания доказательств недействительными. Волшебный мир, в котором магия побеждает магию, действительно может наступить. ИИ пока не может активно вызывать хаос, а подорвать доверие могут сами люди.

Возможно, ИИ пока не способен моделировать мир, но он уже повлиял на то, как мы видим мир.

Что касается проблемы искусственного интеллекта, затрудняющей различие между реальным и фальшивым, когда мы говорим об изменении лица Deepfake, мы уже слишком много об этом говорили. Как Сора мог быть другим?

Недавно OpenAI сделала неожиданный шаг — открыла аккаунт в TikTok и выложила работы Соры.

OpenAI не только тщательно маркирует каждое видео, созданное ИИ, чтобы люди не запутывали реальность, но также включает подсказки.

«Реалистичное видео показывает бабочку, которая может плавать под водой через красивый коралловый риф» «Макросъемка листа показывает крошечные шлейфы, движущиеся по его венам» «Камера, расположенная низко над землей, внимательно отслеживает муравьев в джунглях»… …

Эти видеоролики смешиваются с реальным коротким видеоинформационным потоком и сопровождаются фоновой музыкой.Если вы не будете осторожны и проведете пальцем слишком быстро, это может считаться реальным.

Пользователи сети полушутя-полусерьезно призывали в зоне комментариев OpenAI: «Лучше сделайте что-то вроде водяного знака, иначе человечество обречено».

Sora еще не запущена. На самом деле, все догадываются, что практикующие видеоконтент могут быть самой спокойной группой людей, потому что они более профессиональны и лучше понимают бизнес. Демо-версия Sora имеет много проблем с последовательностью и точностью контента. Если этого будет недостаточно и она не будет соответствовать точным требованиям Стороны А, то будет сложно внедрить технологию в промышленный процесс.

Но я не очень оптимистичен. ИИ уже повлиял не только на правду и ложь, но и на то, как мы видим мир. Он не заменяет напрямую определенное программное обеспечение для монтажа, определенный сценарий или определенного режиссера.

Специалист по искусственному интеллекту @Kwebbelkop предполагает, что OpenAI в настоящее время выпускает только короткие видеоролики с искусственным интеллектом на TikTok, возможно, для сбора соответствующих пользовательских данных, таких как количество просмотров, точной настройки модели на основе отзывов людей и даже создания AI-версии TikTok в будущем.

Алгоритм коротких видео уже очень хорошо угадывает, что вам нравится. Что произойдет, если добавить генеративный искусственный интеллект, чтобы сделать видеоконтент более персонализированным?

В будущем наш опыт просмотра фильмов также может претерпеть качественные изменения.

Однако ожидания OpenAI от продуктов искусственного интеллекта определенно заключаются не только в том, чтобы общаться с вами и снимать видео. Более глубокая цель состоит в том, чтобы позволить искусственному интеллекту изучать человеческий естественный язык и физические законы мира.

Даже если дело ограничивается областью видео, если Сора может снимать грубые концептуальные фильмы, это уже очень впечатляет. Способ создания видео, стиль контента и даже наши предпочтения в отношении контента могут измениться благодаря ИИ.

Если оставить в стороне искусственный интеллект, мобильный телефон, принадлежащий почти каждому, фактически повлиял на то, как снимаются и производятся видеоролики, позволяя каждому стать режиссером своей жизни.

Бьюти-видео, где вы наносите макияж, разговаривая на камеру, влоги, в которых показаны фрагменты вашей личной жизни и т. д. – это продукты, которые под этим влиянием многие блоггеры могут снимать в своих спальнях на мобильные телефоны. Рост количества коротких видеороликов также заставил нас все больше привыкать к смахиванию вверх и вниз по мобильным телефонам, что делает нас менее терпеливыми и более отвлекаемыми.

Хотя по сравнению с Sora инструменты создания видео, такие как Runway и Pika, имеют ограниченные возможности, некоторые люди комбинировали их с инструментами создания изображений, такими как Midjourney, и использовали их для создания трейлеров к фильмам.

Из-за плохой стабильности также был выбран стиль видео: в основном быстрый монтаж с повествованием, упором на ритм и визуальное воздействие, но в нем отсутствуют диалоги персонажей и более сложные сцены.

▲ Научно-фантастический короткометражный фильм с искусственным интеллектом «Время взаймы».

Напротив, Сора может поддерживать более сложные сцены, действия персонажей и взаимодействие между персонажами и окружающим миром. Кто-то использовал образец фильма Соры, затем использовал голосовой инструмент AI ElevenLabs для его дублирования и использовал iMovie для его редактирования, чтобы создать более плавный «трейлер к фильму», который кажется «одним кадром до конца».

Два типа видеороликов, которые Сора демонстрирует внешнему миру, можно условно разделить на два типа: один — творческое воображение, например, астронавты, стоящие на холодной планете, два пиратских корабля, сражающиеся в кофе, и персонажи мультфильмов, танцующие дискотеку. к реальности и добыче золота: Калифорния во время жары, отражения в окнах поездов, природа Нигерии в 2056 году…

Отражение в окне поезда очень похоже на то, что снимает видеоблог. Сцена на открытом воздухе в Нигерии, где камера перемещается от рынка под открытым небом к городскому пейзажу, также очень похожа на пустой кадр новостного видеоролика.Кто-то уже планировал объединить с этим видео цифровых людей.

Фотография может иногда даже показаться ненужной. Сора может напрямую создать вид на туристическую достопримечательность с высоты птичьего полета с помощью быстрых слов, что мало чем отличается от кадра, на котором человек управляет дроном. Наши глаза и мозг знают, как выглядит Санторини, и ИИ также «знает» это, так что эту работу можно поручить ИИ.

Раньше была очень интересная метафора: этот мир представляет собой огромную «Землю Онлайн», массовую многопользовательскую ролевую онлайн-игру, разработанную Solar System, с лучшим 3D-изображением невооруженным глазом и системой VR.

Концепция «симулятора мира», предложенная OpenAI, в определенной степени рассматривает все как ввод информации, поглощая текст, изображения и видео, а затем выводит информацию, превращая текст в картины, а изображения в видео, как если бы «Владыка мира» Earth Online», но мы можем не понимать принципа. Мы можем просто дать запрос и получить результат.

Такое будущее должно быть далёким. По крайней мере, на данный момент просмотр слишком большого количества видео Сора заставит людей скучать. Женщины, идущие по улицам Токио, не имеют эмоций в глазах и не могут почувствовать человеческую атмосферу. Но когда мы смотрим короткие видеоролики Иногда это тоже так, мир нуждается в тонком кино и принимает огромную избыточность, точно так же, как рассчитано и сопротивление главного героя «Матрицы».

Наступает будущее, в котором ИИ будет принимать все более активное участие. В следующий раз, когда мы увидим предполагаемую ошибку, мы не сможем напрямую признать ее фальшивой. Нам это может не нравиться, но мы должны это принять.

Чжан Ченгчен

Он остер, как осенний мороз, и может отвести злые бедствия. Рабочая электронная почта: zhangchengchen@ifanr.com

Электронная почта 8

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo