Наконец-то печать снята! Bing взял на себя инициативу в ChatGPT для поддержки функции распознавания изображений, не только может понимать мемы, писать веб-страницы, но и «обращаться к врачу».

Помните мультимодальные возможности, о которых говорил OpenAI, когда выпускал GPT-4 в марте этого года?

▲ Демонстрация ответа GPT-4, машинный перевод

GPT-4 поддерживает ввод изображений и может понимать мемы, задачи по физике и статьи. После выпуска он всех шокировал. Это также самая большая точка обновления GPT-4 по сравнению с GPT-3.5.

К сожалению, OpenAI сообщает, что функция ввода изображения все еще находится в стадии предварительного исследования и пока недоступна для широкой публики.

▲ Добавлена ​​иконка распознавания изображений. Изображение с Reddit.

Однако недавно пользователь сети Reddit обнаружил, что его учетная запись Bing Chat незаметно добавила запись для загрузки изображений.

Microsoft ранее сообщила, что Bing Chat использует модель GPT-4, и упомянула в большом журнале обновлений в прошлом месяце, что добавит мультимодальную поддержку Bing.В целом, Bing Chat, вероятно, будет постепенно развиваться для пользователей Открыть карту тест функции узнавания.

Этот пользователь сети провел много тестов в Bing Chat, давайте посмотрим, насколько мощным является Bing Chat с «длинными глазами».

Первая — самая удивительная функция GPT-4 по просмотру мемов. GPT-4 может не только понимать содержание картинки, но и анализировать шутки мема, как люди.

Например, в этом меме GPT-4 видно, что картинка хочет выразить, что абсурдно использовать устаревший VGA-образный интерфейс для зарядки iPhone, и абсурдно вводить смех.

▲ Машинный перевод

Пользователи сети загрузили те же самые мемы в Bing Chat для тестирования, и произошла странная вещь: Bing Chat не распознал, что это VGA-интерфейс, поэтому не смог «поймать» шутку, но Bing Chat все же расшифровал фотографии. , даже сказал марку кабеля, и дал более подробную информацию.

Это может быть случайная ошибка Bing Chat, или может быть, Microsoft внесла дополнительные корректировки ограничений в фактическое применение GPT-4, что привело к отклонению в ответе.

Пользователи сети выложили очередной мем-мультик про машинное обучение, и на этот раз Bing Chat смог точнее ответить на содержание и шутки в картинке.

Анализ Bing Chat другого мема о глажке одежды в машине также точен.

▲ Перевод здесь неверен, исходный текст: Diddy Kong, Pyra, Pikachu, Zero Suit Samus, Donkey Kong, Sonic the Hedgehog, Ness, Cloud Strife и Incineroar.

Насколько точно распознает изображения Bing Chat? Он загрузил изображение персонажей «Nintendo Smash Bros.» На одном изображении расположено множество персонажей, и попросил Bing Chat распознать всех персонажей по одному.

В итоге Bing Chat распознал 7 из 12 символов, и кажется, что двухмерная задача для него пока что немного сложна.

Когда OpenAI был выпущен, он также показал случай программирования веб-страницы, сделав снимок вручную.Пользователь сети также нарисовал изображение вручную, чтобы протестировать Bing.

Давайте пропустим длинную ссылку на код и сразу посмотрим, как работает эта страница. Видно, что прототип базовой веб-страницы все еще построен.

Добавление функции распознавания изображений расширяет возможности использования чата Bing. В конце концов, многие элементы (такие как формулы и диаграммы) в реальности сложно выразить словами. В настоящее время просто бросьте изображение в ИИ, чтобы получить ответ.

Пусть это объяснит, например, процесс кроссинговера хромосом во время мейоза.

Пусть он поиграет в учителя биологии и проанализирует, как работает фильтрация нефронов.

Его можно даже использовать в качестве онлайн-врача для простой диагностики кожных заболеваний.

Ранее ChatGPT был разработан для изучения иностранных языков и практики устного английского благодаря его превосходным навыкам понимания текста и выражения.

После добавления визуального распознавания Bing Chat может даже играть роль учителя средней школы, старшей школы или даже университета, чтобы помочь учащимся решать сложные математические, физические и химические задачи.Если в будущем можно будет продвигать функцию распознавания изображений, это может решить проблема образования в определенной степени Проблема несбалансированности ресурсов.

Пользователи также могут использовать его для базовой медицинской диагностики, экономя деньги и время, необходимые для лечения, что отражает ценность ИИ для широкой публики.

Конечно, хотя Bing Chat может в основном понимать содержание реального мира, его ответы в конце концов можно использовать только в качестве справочных и не могут рассматриваться как профессиональные советы.

Поэтому, если функция распознавания карт должна быть полностью открыта для общественности, Microsoft необходимо ввести множество ограничений и отладок, чтобы гарантировать, что у общественности не будет проблем с безопасностью из-за недоверия к ответу ИИ.

В краткосрочной перспективе распознавание изображений Bing Chat должно быть только тестовой функцией, доступной небольшому числу пользователей.Если вы заинтересованы, вы можете немедленно войти в свою учетную запись Microsoft, чтобы увидеть, есть ли еще одна на панели чата Bing. Значок изображения чата.

В настоящее время Bing Chat открыт для всех учетных записей Microsoft, зайдите и откройте слепое окно, чтобы увидеть, получили ли вы тестовую квалификацию. ⬇

https://www.bing.com/новый

Вырезать дерьмо.

#Добро пожаловать в официальный публичный аккаунт Айфанер в WeChat: Айфанер (идентификатор WeChat: ifanr), в ближайшее время вам будет представлен более интересный контент.

Ай Фанер | Оригинальная ссылка · Просмотреть комментарии · Sina Weibo