После использования артефакта TikTok я сразу удалил PS

19 августа, 2022 Дядя Влад

Изображения становятся текстом, что сегодня уже не проблема. Различные функции распознавания облегчают извлечение текста из изображений, а для ИИ не представляет большой проблемы интерпретация изображения.

Но нарисовать картинку для современного ИИ по-прежнему сложно, а распознавание картинок и извлечение информации — это обработка информации для ИИ. Но в рисунке есть дополнительный слой не только для обработки информации, но и для завершения творения. Первый представляет собой вопрос с множественным выбором, а второй представляет собой пропозициональную композицию.

Сразу после того, как вы хорошо ответили на вопросы с несколькими вариантами ответов, следующим шагом будет ответ на субъективные вопросы бесплатной игры. Но никто не думал, что первым, кто ответил на этот вопрос в своем приложении, был TikTok.

Используйте TikTok для создания Facebook, Джек Ма

По сравнению с такими гигантами, как Google и OpenAI, которые много инвестировали в индустрию ИИ и давно погружены в индустрию ИИ, TikTok может быть просто «переводным студентом». Но почему не удивительно, что переводной студент обошел гиганта и первым решил задачу? Хотя переводные студенты тоже проявили некоторую изобретательность, по крайней мере, они все равно очень впечатляют.

Функция преобразования текста в картинку, созданная TikTok, называется «Зеленый экран ИИ», которая заменяет исходный монотонный белый фон, а ИИ создает для вас фон видео. Фоны этих роликов могут не соответствовать запросам создателей, но в конце концов, это уникальный фон зеленого экрана, настроенный специально для вас, и если вам повезет, он может больше подойти к тематике видеоконтента.

▲ Нажмите на специальный эффект, чтобы использовать эту функцию при отправке видео. Изображение получено от Silicon Stars.

Мы провели несколько тестов с этой новой функцией, чтобы увидеть, как выглядит изображение, нарисованное TikTok. Среди слов в случайном тесте некоторые картины сбивали с толку, в то время как другие были оценены как «очень хорошо изображающие странности».

Наиболее хорошо принята картина, представленная при входе в «Facebook».Вы можете смутно узнать синюю иконку Facebook.Единственный глаз и одно ухо на картине создают неповторимое чувство ужаса. В сочетании с недавними новостями Facebook, я должен сказать, что эта картина очень хорошо передает ощущение слова Facebook.

Есть также такие слова, как яблоко и Китай, которые точно изображены на изображении. Первый может легко увидеть, что это яблоко, а второй также может видеть здания в китайском стиле, и в то же время он также избегает государственного флага и других чувствительных шаблонов в сфере предпринимательства. Вот только картинку Apple представить сложно, даже ключевые слова Apple + генеральный директор Apple Кук представляют шаблоны, связанные с яблоками и блюдами.

Однако есть и много несвязанных между собой, например, мы пробовали Alibaba, Tencent и ByteDance, и нельзя сказать, что сгенерированные не имеют ничего общего с этими брендами. Но в любом случае его сложно распознать с первого взгляда, несколько абстрактно.

Также есть много интересных картинок, нарисованных путем ввода имен персонажей. Имя известного заокеанского хендмейд-блогера Ли Цзыци — приятный пейзажный рисунок, также узнаваема с первого взгляда картина знаменитого бывшего тренера Премьер-лиги Арсена Венгера, которая относится к стилю ре-деконструкции классических фотографий, стиль Джека Ма тоже немного странно, и глаза, которые соответствуют Facebook, имеют чувство подглядывания.

Что касается Маска, мы сгенерировали четыре изображения с помощью TikTok, и ни одно из них не было узнаваемо.

Конечно, кроме удачных слов-символов и абстрактных картинок, есть еще Switch и Guangzhou, которые считаются выраженными в самый раз и могут напоминать.

Картина в стиле Zelda с персонажами, по которым фанаты узнают, что «это может быть Марио». Точно так же можно легко идентифицировать культовые здания Гуанчжоу и яркие цвета.

Время генерации каждого фонового изображения составляет менее 5 секунд.Если тема похожа, то эти изображения очень подходят для фонового изображения видео. Время генерации короткое и им может пользоваться каждый, в этом преимущество TikTok, поэтому появление такого продукта text-to-image в приложении с сотнями миллионов ежедневных активностей можно считать знаковым событием.

Просто TikTok по-прежнему использует ярлыки.

В настоящее время почти все производимые картины относятся к стилю живописи, а многие даже относятся к абстракционизму и импрессионизму, по сравнению с созданием реалистических изображений эта трудность значительно ниже. В конце концов, даже если вы не похожи на себя, вы можете положиться на свой мозг, чтобы компенсировать это.ИИ, который понимает слова, которые вы вводите, — это та же проблема, с которой вы сталкиваетесь, когда идете в художественный музей, чтобы увидеть художественная выставка – если сходства мало, то пойми и придумай.

Кроме того, это экономичный метод: сложность ниже, требуемая вычислительная мощность также ниже, а стоимость ниже.

▲ Даже картинки с небольшим кровавым текстом не будут слишком страшными

Текст в изображение, даже у Google нет продукта, генерируемого в реальном времени.

С точки зрения эффекта, эффект рендеринга зеленого экрана AI в TikTok не может быть оценен очень высоко. Но как технология с высоким порогом ее можно считать улучшением, если ее могут использовать пользователи без какого-либо порога в течение нескольких секунд.

Хотя сгенерированные изображения ограничены тем фактом, что сгенерированные изображения недостаточно «повседневны» и недостаточно реалистичны, чтобы вызывать опасения по поводу злоупотребления технологиями и мошенничества с изображениями, реалистичные изображения на самом деле можно сделать, но они пока не доступны для всех, как зеленые экраны ИИ. Вот и все.

Google также выпустил инструмент Imagen AI, который может превратить простое предложение в реальное изображение — такое же реальное, как фотосессия. Но, к сожалению, даже Google, который много инвестировал в искусственный интеллект, не может создавать продукты, которые генерируются «на лету». Другими словами, возможность попросить ИИ нарисовать вам картинку пока недоступна в Imagen AI.

▲ Imagen AI может нажимать на разные параметры, чтобы делать разные изображения.

В настоящее время на официальном сайте есть только некоторые предустановленные варианты, даже если вы нажмете на каждый из них, есть только десятки комбинаций, но есть реалистичные стили и стили масляной живописи на выбор. Заинтересованные читатели все еще могут пойти и немного поиграть сами.

Google — это тип, который известен и привлекает внимание каждым своим ходом. А исследовательская лаборатория искусственного интеллекта OpenAI полагается на работы, и они запустили самый оригинальный и популярный генератор искусственного интеллекта для преобразования текста в изображение Dall-E.

▲ Далл-Э

Dall-E может реалистично перередактировать существующие изображения из текстового контента, может добавлять и удалять элементы за вас, учитывая прорисовку теней, отражений и текстур — технология PS может вас убить. Очень просто анализировать и имитировать существующие картины и заменять их Стиль вдохновения исходит от оригинальной работы, то есть главный герой изменен.

Как исследовательский проект, Dall-E все еще находится в стадии закрытого бета-тестирования, и «ограниченное число доверенных пользователей» в списке публикует фото за фото в социальных сетях. Каждый пользователь, участвующий в тесте, может получить 50 бесплатных баллов изначально, а затем по 15 баллов в месяц после этого, 1 балл может генерировать 4 картинки с одним текстовым содержанием, а также может выбрать три стиля рисования.

В настоящее время у Dall-E по-прежнему очень мало методов монетизации для внутренних бета-пользователей — если вы хотите воспользоваться услугой после того, как 15 баллов в месяц будут израсходованы, вы можете купить 115 баллов за 15 долларов. Хорошей новостью является то, что полученные изображения также могут быть коммерциализированы, и после того, как вы создали их с помощью Dall-E, вы можете использовать их для всего: от иллюстраций, обложек, дизайнов футболок и многого другого.

▲ Пользователь может добавлять элементы в заданное положение, при этом добавленные на фото элементы также будут автоматически дополняться в плане теней и т.д.

Режиссер видео Карен X. Ченг сказала Bloomberg:

Я часами экспериментировал с созданием изображений и сбился с пути… больше похоже на то, что вы работаете с живым, дышащим человеком, чем с таким инструментом, как Photoshop.

Конечно, Dall-E в настоящее время не идеален.С его помощью все еще немного сложно создать полностью реалистичное человеческое лицо.Требуются профессиональные медицинские знания, чтобы точно представить человеческие кости.Это не очень хорошо. Исследователь Адитья Рамеш сказал, что DALL-E умеет только читать текст, а затем генерировать изображения, поэтому на самом деле он пытается создать визуально похожий контент.

▲Фантастические изображения, созданные Dall-E

Эта технология, конечно, очень перспективна, вы можете себе представить, что она снижает порог поиска изображений для создателей контента, и вы можете представить, что художники-портретисты могут повысить эффективность с ее помощью. Но так же, как появлением каждой технологии можно злоупотреблять, технология ИИ, помогающая тексту генерировать картинки, также имеет такой риск — негативные сценарии применения, появившиеся на Deepfake, будут повторяться один за другим.

К счастью, на этот раз поставщик технологий уже подготовился заранее и хотел посадить ИИ в клетку.

Абстрактные изображения TikTok сами по себе являются уровнем защиты, потому что они нереалистичны. Кроме того, даже если вы введете какой-либо наводящий на размышления контент (насилие, нагота) в TikTok, представленные картины все равно не такие, как ожидалось, а абстрактный стиль не ясен и позволяет избежать огромных затрат на просмотр.

▲ Ограничения на официальном сайте Dall-E

Dall-E также ограничивает создание ИИ жестокого, ненавистнического контента для взрослых, сводя к минимуму воздействие Dall-E на такие концепции в алгоритме. В то же время платформа также имеет передовые технологии, предотвращающие использование реальных человеческих лиц для создания изображений (знаменитости с облегчением), а автоматизированные системы и системы наблюдения за людьми также предотвращают злоупотребление Dall-E.

Просто появление всех новых технологий не может просто смотреть на плохую сторону, и стоит с нетерпением ждать перспектив высокой эффективности, которые они несут. По крайней мере, Ай Фанер с нетерпением ждет окончания статьи, которая когда-нибудь будет опубликована: «Карта заголовков статьи сгенерирована Dall-E».

Ленг Сычжэнь

Не слишком интересно, не слишком оптимистично.

почтовый ящик 4

#Добро пожаловать на официальный аккаунт Айфанер в WeChat: Айфанер (WeChat: ifanr), в ближайшее время вам будет представлен более интересный контент.

Love Faner | Исходная ссылка · Просмотреть комментарии · Sina Weibo