Только что выпущенный Pixel 9 выводит фотографию с мобильного телефона на новый уровень

Google в этом году, кажется, немного обеспокоен.

Во-первых, реклама искусственного интеллекта, выпущенная на Олимпийских играх, была обречена на провал, вызвав огромный кризис общественного мнения, а зона для комментариев однажды была закрыта. Суд округа Колумбия также признал ее монополией и оказался в глубокой ловушке. монопольная тюрьма.

▲ Отмененная реклама Gemini

Под двойным ударом Google находится чуть ли не в самой затруднительной ситуации в истории. В настоящее время Google срочно нуждается в красивом развороте, чтобы найти точку опоры.

Итак, глобальная конференция по запуску Made by Google, которая традиционно должна проводиться в октябре каждого года, уже здесь.

Pixel 9, доступны все серии

На этом ежегодном мероприятии, которое состоялось за два месяца до этого, дебютировала серия Pixel 9.

В этом году в серию Google Pixel вошли четыре члена, а именно Pixel 9, Pixel 9 Pro, возвращающийся Pixel 9 Pro XL и Pixel 9 Pro Fold. Все эти четыре телефона оснащены процессором Tensor G4 собственной разработки Google.

Процессор Tensor G4 использует конфигурацию ядер 1+3+4, состоящую из одного Cortex-X4, трех Cortex-A720 и четырех Cortex-A520. По сравнению с процессором Tensor G3 на чипе Pixel 8 (или более ранней версии) новый Cortex-. X4 в Tensor G4 улучшает одноядерную производительность примерно на 11%, но из-за отсутствия одного ядра (Cortex-A720) ожидается, что многоядерные результаты увеличатся лишь примерно на 3% по сравнению с Tensor G3.

▲ Сравнение текущих результатов Google Pixel 9 Pro XL и Pixel 8 Pro предыдущего поколения.

Однако кратковременная стагнация чипа не повлияла на решимость Google использовать искусственный интеллект: это первый мобильный телефон, оснащенный мультимодальной моделью Gemini Nano Multimodality. Google утверждает, что эта модель в 3 раза мощнее и сложнее, чем модель, выпущенная последней. год 3 раза.

Помимо новых чипов, Google также хорошо подготовлен к работе с изображениями.

Хотя Pixel 9 Standard Edition не сильно изменился по сравнению с Pixel 8 Standard Edition предыдущего поколения, за исключением того, что сверхширокоугольная камера была обновлена ​​с IMX 386 до IMX 858, в Pixel 9 Pro и Pro XL Google выбрала «стабильно мощное» решение: помимо основного, за исключением 50-мегапиксельного сенсора Samsung GNK, все остальные камеры используют сенсоры Sony IMX 858.

IMX 858 — наиболее распространенный сенсор в современных флагманских фотокамерах. Размера 1/2,51 дюйма достаточно для решения задач по созданию изображений сверхширокоугольного объектива и телеобъектива с соответствующим размером модуля изображения, который соответствует соответствующему фокусному расстоянию. конфигурация Xiaomi Mi 14 Ultra.

Компания Pixel прошла долгий путь от эпохи одно- и двухкамерных камер и, наконец, достигла аппаратной конфигурации, которую сегодня должен иметь флагманский телефон для обработки изображений.

За последние два года Made by Google аппаратное обеспечение больше не является традиционным фокусом, а функция искусственного интеллекта, находящаяся в центре внимания, — это тема, которая всех больше всего волнует.

Изображения ИИ: от «реальных» к «виртуальным»

Когда наступает волна искусственного интеллекта, Google пытается оседлать эту волну: на прошлогодней конференции Made by Google и на конференции Google I/O 2024 в этом году Google анонсировала большое количество технологий искусственного интеллекта, от генеративных моделей до обработки естественного языка, от независимые приложения Когда дело доходит до системной интеграции, это поведенческий подход «Все в ИИ».

Алан Кей, учёный-компьютерщик, которого больше всего признавал Стив Джобс, сказал:

Людям, которые действительно серьезно относятся к программному обеспечению, следует создавать собственное оборудование.

Первым преемником новых функций искусственного интеллекта, запущенных Google, естественно, является его «сын» Pixel, а в области обработки изображений ИИ мобильных телефонов сияет.

Google называет камеры серии Pixel 9 «первыми в мире камерами с искусственным интеллектом», чего достаточно, чтобы доказать, что помимо фотомодулей флагманского уровня Google так же уверен в благе нового искусственного интеллекта.

В Pixel 8 есть функция, специально подготовленная для групповых фотографий: Best Take.

При съемке иногда неизбежно приходится фотографировать выражения лиц и позы, которые не соответствуют ситуации в данный момент. Best Take сделает несколько снимков, будет использовать искусственный интеллект, чтобы выбрать лучшую часть каждого человека на этих изображениях, и автоматически синтезировать их. Если вас не устраивает выбор AI, вы также можете выбрать вручную и наконец объединить их в одну фотографию.

В Pixel 9, чтобы помочь вам делать более качественные фотографии, Google придумал новый трюк: добавьте меня.

Эта новая функция пытается решить проблему с фотографированием «не-селфи» без помощи посторонних — вам нужно всего лишь поднять Pixel 9, чтобы сфотографировать друга, а затем попросить друга направить Pixel 9 на вы находитесь в том же положении, и «Добавить меня» автоматически поможет вам объединить их в одну фотографию.

Это чем-то похоже на часто используемый метод в фотографии — наложение: после стабилизации камеры снимайте людей в разных положениях в одной и той же сцене, затем помещайте эти фотографии в Photoshop или другое программное обеспечение для постобработки для выравнивания и, наконец, объединяйте их для объединения. на одной и той же фотографии появляются разные персонажи.

▲ Фотографии, сделанные с помощью камеры, для группировки

Теперь, с помощью искусственного интеллекта, Pixel 9 может завершить этот сложный процесс всего лишь поднятием руки.

Если «Добавить меня» — это всего лишь автоматизация технологии «стека», то новая функция «Волшебного редактора» действительно сводит изображения с мобильного телефона на пересечении «настоящих» и «ложных».

Модернизированный «Волшебный редактор» стал настоящим «Волшебным редактором»: помимо изменения экспозиции экрана, удаления фона и перемещения элементов экрана предыдущего поколения, вам нужно всего лишь ввести соответствующий текст, чтобы создать картинку по разум пользователя.

Короче говоря, это то, что мы часто называем моделью диаграммы Винсента.

Диаграммы Винсента больше не считаются «новыми» в технологии искусственного интеллекта. Такие модели, как DALL-E, разработанные OpanAI, и Stable Diffusion с открытым исходным кодом уже давно стали привычными помощниками в рисовании. После многих итераций можно сказать, что различные творения у вас под рукой. .

▲ Изображения созданы с помощью Midjourney.

Однако традиционные модели требуют, чтобы мы использовали веб-страницы или Discord и другие каналы для доступа к ним. Более того, нам нужно самостоятельно настроить локальный интерфейс управления, чтобы использовать его без проблем. С серией Pixel 9 все намного проще — вам нужно только это сделать. разблокируйте телефон. Введите текст, и Magic Editor сделает все это за вас.

Это неотделимо от технических резервов Google для генеративного искусственного интеллекта — Google Imagen будет предоставлять пользователям услуги по созданию изображений искусственного интеллекта, начиная с мая 2022 года, такие как наша самая раздражающая программа проверки человека и машины.

Будучи старшим сыном лагеря Android, Pixel всегда был относительно сдержанным, но никто не может игнорировать его существование — Google всегда передает ему любую новую технологию как можно скорее. Со временем Pixel стал своего рода ориентиром. : две новые функции — «Добавь меня» и Magic Editor — могут стать направлением использования Android-технологии фотографии с искусственным интеллектом в будущем.

Пересечение виртуальности и реальности является разделительной линией между записью и творчеством.

Pixel 9 указал путь к созданию изображений с использованием искусственного интеллекта, но он также вызвал противоречия: от пост-фотографии до вмешательства искусственного интеллекта, люди всегда беспокоились о «потере реальности».

Действительно, я не знаю, с каких это пор фотографии, кажется, находятся под проклятием «реальности»: каждая фотография должна быть объективным «доказательством», и как только она будет изменена или создана, она будет помечена как «P-изображение». как будто Мы тоже обманывали в своей жизни.

Но фотографии не должны быть такими – кто будет нажимать кнопку спуска затвора для 100% достоверности? Мало кто, кроме новостных и документальных фотографов, делает это.

▲Даже в новостной фотографии некоторая «реальность» избегается посредством композиции.

Для большинства людей фотографии являются скорее носителем, как говорит Google:

Благодаря нашей технологии искусственного интеллекта фотография — это больше, чем просто изображение, а способ запечатлеть и воссоздать самые важные моменты в вашей жизни.

Эти важные моменты всегда полны эмоций и субъективности — для большинства из нас нажать кнопку спуска затвора часто является моментом волнения, радости и удивления.

Вот и эти фотографии, конденсирующие наши мысли, стали носителями драгоценных воспоминаний.

▲ Баланс белого мобильного телефона не может помочь мне сохранить золотое послесвечение, но искусственный интеллект может

Однако фотографии слишком объективны и часто не соответствуют воспоминаниям в нашем сознании. В настоящее время использование искусственного интеллекта для изменения или создания фотографий похоже на высказывание классической фотографии:

Меня нет на картинке П, я просто восстанавливаю красивые пейзажи, которые я тогда видел.

Хотя это всего лишь замечание, которое часто используется на форумах по фотографии, чтобы ответить на последующие обвинения, оно точно отражает значимость технологии искусственного интеллекта для фотографий: использование инструментов, позволяющих легче сделать фотографии людей ближе к воспоминаниям.

В конце 19 века, с появлением фотографии, задача реализма стала переходить от живописи к фотографии, стала подниматься и возглавлять тенденцию импрессионизм — новая концепция живописи, отошедшая от полного реализма.

Теперь, с появлением искусственного интеллекта, фотография еще больше расширила свои границы, и все больше и больше людей начали «создавать» фотографии. Независимо от того, выступаете ли вы против этого или поддерживаете, фотография вступила на путь, который никогда не будет оглядываться назад.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo