Фотореалистичная А.И. Инструмент может заполнить пробелы в изображениях, в том числе лица

16 июля, 2019 Дядя Влад

скрин-шоп с изображением ручки, снимок экрана 2019 07 16 в 05 19 53

Вам нужно всего лишь проверить последний голливудский блокбастер или подобрать название новой игры ААА, чтобы напомнить, что компьютерная графика может использоваться для создания ослепительных потусторонних изображений, когда это необходимо. Но некоторые из наиболее впечатляющих примеров сгенерированных машиной изображений — это не обязательно инопланетные ландшафты или гигантские монстры, это модификации изображений, которые мы даже не замечаем .

Так обстоит дело с новой демонстрацией искусственного интеллекта, созданной компьютерными учеными в Китае. Совместно с университетом Сунь Ятсена в Гуанчжоу и пекинской исследовательской лабораторией Microsoft они разработали интеллектуальный искусственный интеллект, который можно использовать для точного заполнения пустых областей на изображении: будь то пропущенное лицо или фасад здания.

Эта технология, называемая inpainting, использует технологию глубокого обучения, чтобы заполнить эти пробелы путем копирования фрагментов изображения на оставшейся части изображения или создания новых областей, которые выглядят убедительно точными. Инструмент, который его создатели называют PEN-Net (сеть ENcoder с Pyramid-context), восстанавливает этот образ, «кодируя контекстную семантику из ввода с полным разрешением и декодируя изученные семантические функции обратно в изображения». Изображения Transfer Network (ATN) не только впечатляюще реалистичны, но и инструмент очень быстр в освоении.

«[В этой работе мы предложили] глубокую генеративную модель для высококачественных задач по окраске изображений», — говорит ведущий автор проекта Янхонг Цзэн , который связан с Школой данных и компьютерных наук и ключей Университета им. Лаборатория машинного интеллекта и современных вычислений, рассказала Digital Trends. «Наша модель заполняет недостающие области от глубокого до мелкого на всех уровнях, основываясь на межслойном механизме внимания, так что можно обеспечить согласованность структуры и текстуры в результатах окраски. Мы рады видеть, что наша модель способна генерировать более четкие текстуры и более разумные структуры, чем предыдущие работы ».

Как отмечает Цзэн, исследователи не впервые разработали инструменты для рисования. Тем не менее, система PEN-Net команды демонстрирует впечатляющие результаты рядом с классическим методом PatchMatch и даже другими современными подходами.

«В нашей повседневной жизни для рисования изображений применяется широкий спектр задач, — продолжил Цзэн. «Сейчас мы планируем применить нашу технологию для редактирования изображений — особенно для удаления объектов [и] восстановления старых фотографий».

Документ с описанием работы под названием «Изучение сети пирамидального контекстного кодера для высококачественного рисования изображений» доступен для чтения в хранилище препринтовых документов Arxiv .