Вышел шестой выпуск ChatGPT в конце года с видеозвонками и демонстрацией экрана, а также рождественским пасхальным яйцом.
После того, как вчера ChatGPT был полностью запущен в Apple Family Bucket, OpenAI представил еще одно важное обновление.
Сегодня ChatGPT запустил функции видеозвонков и совместного использования экрана, а также ограниченный голосовой режим Санта-Клауса «Режим Санта».
Другими словами, теперь ChatGPT не только красноречив, но и может «открыть глаза, чтобы увидеть мир». Если у вас есть сомнения, сделайте «видеозвонок» прямо в ChatGPT. Возможно, это поможет вам лучше решить проблему.
Эти функции будут доступны всем пользователям Team и большинству подписчиков Plus и Pro в течение следующей недели. Платным пользователям в ЕС придется подождать еще немного.
ChatGPT, поддерживающий более 50 языков, сможет понимать визуальные сцены в режиме реального времени, помогать вам решать проблемы и даже стать наставником по искусственному интеллекту, который научит вас новым вещам.
На этой пресс-конференции, которая также заняла менее 20 минут, директор по продукту OpenAI Кевин Вейл, Джеки Шеннон, Мишель Цинь и Роуэн Зеллерс показали нам, на что способен ChatGPT с «глазами»?
Например, если вы покупаете набор оборудования для ручного приготовления кофе, но не знаете, с чего начать, вы можете также совершить «видеозвонок» в ChatGPT.
Он может шаг за шагом научить вас выполнять каждый шаг в зависимости от того, какой прибор находится перед вами: от размещения фильтровальной бумаги, заливки горячей воды, засыпки молотого кофе в фильтровальную бумагу и т. д. – все это можно изучить и освоить. .
Застрявший? Не стесняйтесь задавать преподавателям GPT любые вопросы. Этот учитель ИИ не только отвечает на все вопросы, но и иногда оказывает гуманную поддержку, полную эмоциональной ценности.
Помимо видеоподсказок в реальном времени, ChatGPT также поддерживает функцию совместного использования экрана. Пользователям нужно всего лишь щелкнуть значок расширенного голосового режима в правом нижнем углу и выбрать «Поделиться экраном» в раскрывающемся меню, чтобы получить целевую помощь.
«Видя» друга в костюме Санта-Клауса и шутящего о том, имеет ли он право претендовать на должность Санта-Клауса в торговом центре, преподаватель GPT предложит соответствующие формулировки и поддержит высокий эмоциональный интеллект.
Эй, Кевин, твой костюм Санты такой праздничный. Может быть, продолжайте практиковать свое «Хо-хо-хо», и вы в кратчайшие сроки превратитесь в Санта-Клауса из торгового центра.
Фактически, президент OpenAI Грег Брокман недавно провел викторину по анатомии человека с Андерсоном Купером, используя ChatGPT с визуальной функцией.
Когда Купер рисовал на доске части тела, ChatGPT мог мгновенно «понять», что он рисовал.
«Позиция очень хорошая, мозг прямо в голове. Что касается формы, то это хорошее начало, но мозг больше похож на овал». ChatGPT даже может пропеть формулу площади треугольника с британским акцентом.
Однако в последующей обработке геометрических задач ChatGPT были очевидные недостатки. Простая ошибка аннотации не была обнаружена, и еще есть много возможностей для улучшения понимания геометрии плоскости.
Чтобы поприветствовать наступление Рождества, OpenAI также запустила предустановленный голос «Санта-Клауса». Пользователям нужно всего лишь щелкнуть значок снежинки на главном экране, чтобы поговорить с Санта-Клаусом ChatGPT.
Например, пусть Санта расскажет историю.
Я должен сказать, что каждый раз, когда «Санта-Клаус» говорит «Хо-хо-хо~», это весьма волшебно и звучит очень празднично.
Во время прямого эфира ведущий также задал «Деду Морозу» несколько вопросов, в том числе о его любимой рождественской традиции, любимых оленях и т. д.
Интересно, что когда Кевин Вейл надел искусственную бороду Санта-Клауса и спросил, как за ней ухаживать, ChatGPT, давший совет, тоже ответил тоном Санта-Клауса:
«Друг мой, это самая потрясающая борода, которую я когда-либо видел».
Этот голос будет запущен сегодня, и чтобы каждый пользователь мог в полной мере ощутить это праздничное яйцо, OpenAI сбросит номер расширенного использования голоса пользователя во время первого опыта. Даже если квота будет израсходована, пользователь сможет продолжать общаться с ним. вы через стандартный голосовой режим взаимодействия «Санта-Клаус».
Возможно, из-за того, что пресс-конференция была слишком длинной, жалобы пользователей сети также были сосредоточены на голосе Санта-Клауса. Самый типичный пример — X нетизен @khoomeik.
Ученый-исследователь Google Deepmind Йонас Адлер даже напрямую раскритиковал OpenAI:
Удивительно, как быстро OpenAI реагирует на выпускаемые нами продукты и всегда запускает их одновременно. Однако мне не очень нравится, что они используют режим Санта-Клауса в качестве ответа на Gemini 2.0, поскольку, похоже, ему не хватает важности и серьезности, чтобы соответствовать Gemini 2.0.
Стоит отметить, что вчера Google взял на себя инициативу по запуску продукта искусственного интеллекта с возможностями визуального понимания, который может понимать и анализировать реальную сцену, в которой находится пользователь, и получил много похвал от пользователей сети.
Сегодня OpenAI последовала этому примеру и установила «глаза» на ChatGPT, что также означает, что ChatGPT еще больше расширился от относительно одной модальности до «визуально-языкового мультимодального понимания».
Другими словами, ChatGPT больше не будет ограничиваться текстовыми инструкциями и информацией, введенной пользователем, а сможет понимать контекст пользователя посредством зрения, включая страницы на экране компьютера, изображения, снятые камерами мобильных телефонов, и даже информация в реальном времени от других периферийных устройств.
Полвека назад ученые лаборатории Xerox PARC представили компьютер, способный понимать поведение человека. Сегодняшнее развитие искусственного интеллекта превращает эту мечту в реальность за пределами монитора.
От бумаги до клавиатуры, от двоичного языка до естественного языка — люди упрощают способы общения с машинами. Визуальные возможности ChatGPT также позволяют нам увидеть окончательный ответ: позволить машинам «видеть» мир, как люди.
Учитывая, что Альтман и бывший главный дизайнер Apple Джони Айв разрабатывают интеллектуальные аппаратные устройства с искусственным интеллектом, я еще больше рад видеть, что эта функция появится на этом новом оборудовании.
В тот момент, когда ИИ открывает глаза, он наконец появляется в мире глазами человека.
# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo