Вышел шестой выпуск ChatGPT в конце года с видеозвонками и демонстрацией экрана, а также рождественским пасхальным яйцом.

13 декабря, 2024 Дядя Влад

После того, как вчера ChatGPT был полностью запущен в Apple Family Bucket, OpenAI представил еще одно важное обновление.

Сегодня ChatGPT запустил функции видеозвонков и совместного использования экрана, а также ограниченный голосовой режим Санта-Клауса «Режим Санта».

Другими словами, теперь ChatGPT не только красноречив, но и может «открыть глаза, чтобы увидеть мир». Если у вас есть сомнения, сделайте «видеозвонок» прямо в ChatGPT. Возможно, это поможет вам лучше решить проблему.

Эти функции будут доступны всем пользователям Team и большинству подписчиков Plus и Pro в течение следующей недели. Платным пользователям в ЕС придется подождать еще немного.

ChatGPT, поддерживающий более 50 языков, сможет понимать визуальные сцены в режиме реального времени, помогать вам решать проблемы и даже стать наставником по искусственному интеллекту, который научит вас новым вещам.

На этой пресс-конференции, которая также заняла менее 20 минут, директор по продукту OpenAI Кевин Вейл, Джеки Шеннон, Мишель Цинь и Роуэн Зеллерс показали нам, на что способен ChatGPT с «глазами»?

Например, если вы покупаете набор оборудования для ручного приготовления кофе, но не знаете, с чего начать, вы можете также совершить «видеозвонок» в ChatGPT.

Он может шаг за шагом научить вас выполнять каждый шаг в зависимости от того, какой прибор находится перед вами: от размещения фильтровальной бумаги, заливки горячей воды, засыпки молотого кофе в фильтровальную бумагу и т. д. – все это можно изучить и освоить. .

Застрявший? Не стесняйтесь задавать преподавателям GPT любые вопросы. Этот учитель ИИ не только отвечает на все вопросы, но и иногда оказывает гуманную поддержку, полную эмоциональной ценности.

Помимо видеоподсказок в реальном времени, ChatGPT также поддерживает функцию совместного использования экрана. Пользователям нужно всего лишь щелкнуть значок расширенного голосового режима в правом нижнем углу и выбрать «Поделиться экраном» в раскрывающемся меню, чтобы получить целевую помощь.

«Видя» друга в костюме Санта-Клауса и шутящего о том, имеет ли он право претендовать на должность Санта-Клауса в торговом центре, преподаватель GPT предложит соответствующие формулировки и поддержит высокий эмоциональный интеллект.

Эй, Кевин, твой костюм Санты такой праздничный. Может быть, продолжайте практиковать свое «Хо-хо-хо», и вы в кратчайшие сроки превратитесь в Санта-Клауса из торгового центра.

Фактически, президент OpenAI Грег Брокман недавно провел викторину по анатомии человека с Андерсоном Купером, используя ChatGPT с визуальной функцией.

Когда Купер рисовал на доске части тела, ChatGPT мог мгновенно «понять», что он рисовал.

«Позиция очень хорошая, мозг прямо в голове. Что касается формы, то это хорошее начало, но мозг больше похож на овал». ChatGPT даже может пропеть формулу площади треугольника с британским акцентом.

Однако в последующей обработке геометрических задач ChatGPT были очевидные недостатки. Простая ошибка аннотации не была обнаружена, и еще есть много возможностей для улучшения понимания геометрии плоскости.

Чтобы поприветствовать наступление Рождества, OpenAI также запустила предустановленный голос «Санта-Клауса». Пользователям нужно всего лишь щелкнуть значок снежинки на главном экране, чтобы поговорить с Санта-Клаусом ChatGPT.

Например, пусть Санта расскажет историю.

Я должен сказать, что каждый раз, когда «Санта-Клаус» говорит «Хо-хо-хо~», это весьма волшебно и звучит очень празднично.

Во время прямого эфира ведущий также задал «Деду Морозу» несколько вопросов, в том числе о его любимой рождественской традиции, любимых оленях и т. д.

Интересно, что когда Кевин Вейл надел искусственную бороду Санта-Клауса и спросил, как за ней ухаживать, ChatGPT, давший совет, тоже ответил тоном Санта-Клауса:

«Друг мой, это самая потрясающая борода, которую я когда-либо видел».

Этот голос будет запущен сегодня, и чтобы каждый пользователь мог в полной мере ощутить это праздничное яйцо, OpenAI сбросит номер расширенного использования голоса пользователя во время первого опыта. Даже если квота будет израсходована, пользователь сможет продолжать общаться с ним. вы через стандартный голосовой режим взаимодействия «Санта-Клаус».

Возможно, из-за того, что пресс-конференция была слишком длинной, жалобы пользователей сети также были сосредоточены на голосе Санта-Клауса. Самый типичный пример — X нетизен @khoomeik.

Ученый-исследователь Google Deepmind Йонас Адлер даже напрямую раскритиковал OpenAI:

Удивительно, как быстро OpenAI реагирует на выпускаемые нами продукты и всегда запускает их одновременно. Однако мне не очень нравится, что они используют режим Санта-Клауса в качестве ответа на Gemini 2.0, поскольку, похоже, ему не хватает важности и серьезности, чтобы соответствовать Gemini 2.0.

Стоит отметить, что вчера Google взял на себя инициативу по запуску продукта искусственного интеллекта с возможностями визуального понимания, который может понимать и анализировать реальную сцену, в которой находится пользователь, и получил много похвал от пользователей сети.

Сегодня OpenAI последовала этому примеру и установила «глаза» на ChatGPT, что также означает, что ChatGPT еще больше расширился от относительно одной модальности до «визуально-языкового мультимодального понимания».

Другими словами, ChatGPT больше не будет ограничиваться текстовыми инструкциями и информацией, введенной пользователем, а сможет понимать контекст пользователя посредством зрения, включая страницы на экране компьютера, изображения, снятые камерами мобильных телефонов, и даже информация в реальном времени от других периферийных устройств.

Полвека назад ученые лаборатории Xerox PARC представили компьютер, способный понимать поведение человека. Сегодняшнее развитие искусственного интеллекта превращает эту мечту в реальность за пределами монитора.

От бумаги до клавиатуры, от двоичного языка до естественного языка — люди упрощают способы общения с машинами. Визуальные возможности ChatGPT также позволяют нам увидеть окончательный ответ: позволить машинам «видеть» мир, как люди.

Учитывая, что Альтман и бывший главный дизайнер Apple Джони Айв разрабатывают интеллектуальные аппаратные устройства с искусственным интеллектом, я еще больше рад видеть, что эта функция появится на этом новом оборудовании.

В тот момент, когда ИИ открывает глаза, он наконец появляется в мире глазами человека.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo