Оптические иллюзии могут помочь нам создать следующее поколение ИИ

Вы смотрите на изображение черного круга на сетке круглых точек. Он напоминает дыру, выжженную в куске белой сетки, хотя на самом деле это плоское стационарное изображение на экране или листе бумаги. Но твой мозг так не понимает. Подобно низкоуровневому галлюцинаторному переживанию, ваш разум отключается; воспринимая статичное изображение как вход в черный туннель, который движется к вам.

Реагируя на правдоподобие эффекта, тело начинает бессознательно реагировать: зрачки расширяются, чтобы впустить больше света, точно так же, как они приспосабливаются, если вы собираетесь погрузиться в темноту, чтобы обеспечить наилучшее возможное зрение.

Оптическая иллюзия черной дыры

Рассматриваемый эффект был создан Акиёси Китаока , психологом из Университета Рицумейкан в Кобе, Япония. Это одна из десятков оптических иллюзий, которые он создал за долгую карьеру. («Мне они все нравятся», — сказал он, отвечая на вопрос Digital Trend о том, есть ли у него любимые.)

Эта новая иллюзия стала предметом исследования, недавно опубликованного в журнале Frontiers in Human Neuroscience . В то время как основное внимание в статье уделяется физиологическим реакциям человека на новый эффект (который, как оказалось, испытают около 86 процентов из нас), общая тема также может иметь большое значение, когда речь идет о будущем машинный интеллект — как один из исследователей стремился объяснить Digital Trends.

Эволюционное преимущество

оптическая иллюзия, известная как спираль Фрейзера
На первый взгляд может показаться, что на этом изображении изображена спираль, закручивающаяся к центру. Но попробуйте проследить за одной из линий, которая изгибается внутрь, и вы поймете, что это вовсе не спираль.

Что-то не так с твоим мозгом. По крайней мере, такой простой вывод можно сделать из того, как человеческий мозг воспринимает оптические иллюзии. Какое другое объяснение существует для двухмерного статического изображения, которое мозг воспринимает как нечто совершенно иное? Долгое время господствующая психология считала именно это.

«Поначалу люди думали: «Хорошо, наш мозг не идеален… Он не всегда все делает правильно». Это провал, верно?» сказал Бруно Лаенг , профессор факультета психологии Университета Осло и первый автор вышеупомянутого исследования. «Иллюзии в этом случае были интересны, потому что они выявляли какое-то несовершенство механизма».

Психологи больше не рассматривают их таким образом. Во всяком случае, подобные исследования подчеркивают, что зрительная система — это не просто камера. Оптическая иллюзия «Иллюзорная расширяющаяся дыра» ясно показывает, что глаз приспосабливается к воспринимаемому, даже воображаемому, свету и темноте, а не к физической энергии.

Что наиболее важно, это демонстрирует, что мы не просто слепо фиксируем мир с помощью наших зрительных систем, а вместо этого проводим непрерывный набор научных экспериментов, чтобы получить небольшое эволюционное преимущество. Цель состоит в том, чтобы проанализировать данные, представленные нам, и попытаться упреждающе решить проблемы, прежде чем они станут, ну, проблемами.

«У мозга нет возможности узнать, что [на самом деле] там, — сказал Лаенг. «То, что он делает, — это создание своего рода виртуальной реальности того, что может быть снаружи. Есть немного догадок. В этом отношении вы можете думать о мозге как о своего рода вероятностной машине. Вы можете назвать это байесовской машиной, если хотите. Он использует некоторую предварительную гипотезу и постоянно пытается проверить ее, чтобы увидеть, работает ли она».

Лаенг приводит пример того, как наши глаза приспосабливаются, основываясь не более чем на восприятии солнечного света: даже когда он виден сквозь облачный покров или лиственный полог над головой. На всякий случай.

«В эволюции важно не то, что это правда [в тот момент], а то, что это вероятно», — продолжил он. «Сужая зрачок, ваше тело уже приспосабливается к ситуации, которая, скорее всего, произойдет через короткий промежуток времени. Что происходит [если внезапно выходит солнце], так это то, что вы ослеплены. Ослепленный означает временно выведенный из строя. Это имеет огромные последствия, являетесь ли вы добычей или хищником. Вы теряете доли секунды в конкретной ситуации и можете не выжить».

Наша зрительная система должна делать предположения не только в свете и темноте. Представьте себе игру в теннис, когда мяч движется с большой скоростью. Если бы мы полностью основывали свое поведение на том, что зрительная система получает в любой данный момент, мы бы отстали от реальности и не смогли бы вернуть мяч. «Мы способны воспринимать настоящее, хотя на самом деле застряли в прошлом», — сказал Лаенг. «Единственный способ сделать это — предсказать будущее. Это немного похоже на игру слов, но в двух словах это все».

Машинное зрение становится лучше

распознавание лиц
Изусек / Getty Images

Так какое это имеет отношение к компьютерному зрению? Потенциально все. Например, для того, чтобы робот мог эффективно функционировать в реальном мире, он должен иметь возможность вносить такие корректировки на лету. Компьютеры имеют преимущество, когда дело доходит до их способности выполнять чрезвычайно быстрые вычисления. Чего у них нет, так это миллионов лет эволюции на их стороне.

Тем не менее, в последние годы машинное зрение добилось огромных успехов. Они могут распознавать лица или походку в видеопотоках в реальном времени — возможно, даже в огромном скоплении людей. Аналогичная классификация изображений и технические инструменты также могут распознавать присутствие других объектов, а прорывы в области сегментации объектов позволяют лучше понять содержание различных сцен. Также был достигнут значительный прогресс, когда дело доходит до экстраполяции 3D-изображений из 2D-сцен, что позволяет машинам «считывать» из сцен трехмерную информацию, такую ​​как глубина. Это приближает современное компьютерное зрение к человеческому восприятию изображений.

Тем не менее, по-прежнему существует пропасть между лучшими алгоритмами машинного зрения и теми возможностями, основанными на зрении, которые подавляющее большинство людей могут реализовать с юных лет. Хотя мы не можем точно сформулировать, как мы выполняем эти задачи, основанные на видении (цитируя венгерско-британского эрудита Майкла Поланьи, «мы можем знать больше, чем можем сказать»), мы, тем не менее, способны выполнять впечатляющий набор задач, которые позволяют нам использовать наше зрение различными умными способами.

Тест Тьюринга для машинного зрения

Если исследователи и инженеры надеются создать системы компьютерного зрения, которые будут работать как минимум на одном уровне с визуальными способностями искусственного мозга, создание алгоритмов, способных понимать оптические иллюзии, будет неплохой отправной точкой. По крайней мере, это может оказаться хорошим способом измерения того, насколько хорошо системы машинного зрения работают с нашим собственным мозгом. Возможно, это не ответ на мифический Искусственный Общий Интеллект , но он может стать ключом к открытию Общего Видения.

оптическая иллюзия, которая обманывает ваш мозг, заставляя его видеть ложные цвета
Хотите верьте, хотите нет, но все эти шары имеют одинаковый оттенок серого, и ваш мозг интерпретирует их как имеющие разные цвета на основе контекстуальных сигналов цветных линий, которые пересекают их.

«Если бы кто-то однажды разработал искусственную зрительную систему, которая совершает те же иллюзорные ошибки восприятия, что и мы, вы бы знали, что они [достигают] хорошей имитации того, как работает наш мозг», — сказал Лаенг. «Это будет своего рода тест Тьюринга. Если у вас есть искусственная сеть, обманутая иллюзией, как и мы, то мы [будем] очень близки к пониманию лежащих в основе вычислений самого мозга».

И-Чжэ Сонг , читатель курса «Компьютерное зрение и машинное обучение» в Центре обработки речи и сигналов британского Университета Суррея, согласен с этой гипотезой. «Просьба к алгоритмам зрения понять оптические иллюзии как общую тему имеет большое значение для сообщества», — сказал он Digital Trends. «Это выходит за рамки текущего фокуса сообщества на том, чтобы просить машины [распознавать], расширяя границы [и] требуя, чтобы машины рассуждали. Этот толчок [будет представлять собой] значительный шаг вперед к «Общему видению», где необходимо учитывать субъективные интерпретации визуальных концепций».

Используй свою иллюзию

На сегодняшний день было проведено несколько ограниченных исследований, направленных на достижение этой цели, хотя они все еще находятся на относительно ранней стадии. Насим Нематзаде, исследователь, имеющий докторскую степень. в искусственном интеллекте и робототехнике — модели низкоуровневого зрения — один человек, опубликовавший работу по этой теме .

«Мы считаем, что дальнейшее изучение роли простых гауссовых моделей в низкоуровневой обработке сетчатки и ядра Гаусса на ранней стадии [глубокие нейронные сети] и его предсказание потери перцептивной иллюзии приведет к более точным методам компьютерного зрения. и модели», — сказал Нематзаде Digital Trends. «[Это может] внести вклад в модели более высокого уровня обработки глубины и движения и обобщить их для компьютерного понимания естественных изображений».

Макс Уильямс, исследователь ИИ, который помог собрать набор данных из тысяч изображений оптических иллюзий для систем компьютерного зрения, наиболее лаконично описывает взаимосвязь между общим зрением и оптическими иллюзиями: процесс извлечения визуальной сцены из непостижимого светового поля, созданного физическим миром, от которого мы почти полностью изолированы», — рассказали они Digital Trends. «Я не думаю, что можно сделать зрительную систему достаточно выразительной, чтобы ее можно было считать «восприятием», свободным от иллюзий».

Достижение общего видения

Чтобы было ясно, достижение общего зрения на человеческом уровне (или выше) для ИИ не просто научит их распознавать стандартные оптические иллюзии. Никакая сверхспецифическая способность, скажем, расшифровывать иллюзии Magic Eye с точностью 99,9% за 0,001 секунды не заменит миллионы лет человеческой эволюции.

(Интересно, что у машинного зрения уже есть собственная версия оптических иллюзий в виде противоборствующих моделей, из-за которых они могут ошибочно принять — как на одной тревожной иллюстрации — напечатанную на 3D-принтере игрушечную черепаху за винтовку . те же эволюционные преимущества, что и оптические иллюзии, действующие на людей.)

Тем не менее, заставить машины понимать оптические иллюзии человека и реагировать на них так же, как мы, может быть очень полезным исследованием.

И одно можно сказать наверняка: когда будет создан ИИ General Vision, он попадется на те же оптические иллюзии, что и мы. По крайней мере, в случае с Иллюзорно расширяющейся дырой 86% из нас.