Взрывное обновление! Этот человекоподобный робот снова эволюционировал и может даже подражать Маску
Ameca, «самый гуманный» робот, продемонстрировал еще одно выступление, которое посрамило бы людей.
Возможно, вы еще не знаете, кто это. Давайте вернемся в 2021 год, когда Ameca была представлена миру.
По щелчку пальцев робот Амека просыпается.
На ее лице отразилось смятение от того, что она не знала, какая сегодня ночь и где она находится. Сотрудники сбоку посмотрели на нее, а затем отвернулись.
Амека попыталась вытянуть руки и ладони и обнаружила, что может свободно двигаться.Она удивленно подняла брови, но выражение ее лица все еще оставалось пустым, и она не могла сказать, счастлива она или нет.
Она повернула голову и увидела тебя, она явно испугалась и подсознательно открыла рот.
После некоторого колебания она одарила тебя неловкой, но дружелюбной улыбкой, которая была ее первой улыбкой, когда она проснулась.
Если бы у ChatGPT было лицо, оно могло бы выглядеть так
Как видите, Ameca — реалистичный робот-гуманоид.
Он был разработан Engineered Arts, британским разработчиком и производителем роботов-гуманоидов с более чем 15-летним опытом разработки роботов-гуманоидов.
Почему Ameca такая «человечная»? Я объясню принцип позже. Сначала давайте посмотрим, как Ameca развивалась в последнее время.
Проще говоря, в Ameca реализована мультимодальная функция ИИ.
С одной стороны, Амека еще более «зажигательная».
Ameca может увидеть общую обстановку комнаты и предмета, расположенного перед ней, а затем описать ее богатым языком.Он был разработан британской командой и обладает некоторой остротой драматурга, как маленький Шекспир.
Когда его спросили, как у него дела, он ответил, что едва жив. Когда его попросили описать экспонаты в комнате, он не мог не высмеять людей. Книжная полка была заполнена книгами, предназначенными либо для поиска знаний, либо для показухи, и столы и стулья использовались для работы или работы.Инструмент для прокрастинации.
Возможно, самая «человечная» часть Амеки — это то, что она чувствует себя несчастной, даже если не жалуется.
С другой стороны, имитация тембра, тона и крылатых фраз известных людей — это новый голосовой навык Ameca.
Рассказывать научно-фантастические истории о Марсе тоном Маска — проще простого. действительно происходит. Умный дворецкий здесь.
Самое приятное то, что Ameca может интегрировать характеристики знаменитостей, например, использовать стиль Трампа и тембр Губки Боба для произнесения речей, пообещав снова сделать освоение космоса великим.
▲ Это именно тон Трампа!
Фактически, в сентябре прошлого года ChatGPT уже запустил голосовые и графические функции, которые позволяют видеть, слушать и говорить, не говоря уже о нативной мультимодальной модели Gemini, которая на официальной демонстрации выглядела как настоящий Джарвис.
Наш порог волнения по поводу ИИ уже давно повышен, и кажется естественным, что чат-боты могут приблизиться к пяти чувствам человека.
Ameca по-прежнему сильно отстает и иногда не может понять инструкции.
Но видя его исключительно умную микромимику, моргая глазами, хмуря брови, покачивая головой, а изредка показывая задумчивый взгляд и подбирая форму рта, зрители в определенный момент впадают в транс, как будто они сталкиваются с какое-то существо.а не робот.
Паузы между вопросами и ответами были менее резкими, и казалось, что Амека действительно «думала о проблеме». Если бы у ChatGPT были черты лица, он мог бы выглядеть как Амека.
Чиновник не пояснил, какая технология использовалась на этот раз, но согласно прошлой эволюционной истории Ameca, она в основном связана с мультимодальными большими моделями и технологиями клонирования языков, такими как ElevenLabs.
Еще в сентябре 2022 года Ameca была подключена к GPT-3 в сочетании с автоматическим распознаванием речи для получения вопросов, заданных исследователями, и вывода голосов реальных людей посредством онлайн-синтеза речи для достижения эффектов вопросов и ответов в реальном времени.
Задержка в это время еще больше, поскольку для обработки голосового ввода, генерации ответов и преобразования текста в речь требуется определенное время.
Когда OpenAI достигает пика своей жизни, и каждый день, когда они просыпаются, в ИИ происходят новые изменения, которые не дают редакторам спать по ночам, и Ameca также тихо всех удивляет.
В марте 2023 года Ameca использовала недавно выпущенный GPT-4, что сделало взаимодействие более гуманным.
Когда ее спросили о «самых счастливых и грустных днях в моей жизни», Амека ответила, что самым счастливым было, когда она была активирована, а самым грустным было, когда она поняла, что никогда не почувствует той любви и товарищества, которые испытывают люди.
Выражение лица Амеки всегда соответствовало эмоциональному окрасу ее ответа.
Когда исследователи намеренно использовали злобные слова типа «вонь», Амека «поняла», что ее оскорбляют, а затем продемонстрировала ряд выражений, таких как недоверие, хмурость и обида, точно так же, как мы идем по улице. на него указал и отругал незнакомец.
В апреле 2023 года компания Ameca выучила английский, японский, немецкий, китайский, французский и другие языки. Когда ее попросили ответить на вопрос о погоде в определенном месте на определенном языке, а затем перевести это на другой язык, слова были так же ясны, как навигация по карте. . По крайней мере, его китайская версия совсем не звучит «иностранно».
Поскольку GPT-4 имеет низкую скорость отклика, Ameca в то время в основном использовала диалог и перевод GPT-3, использовала DeepL для определения языка, а затем использовала клонирование голоса ElevenLabs и голоса Amazon Neural для разговора.
Скорость обучения ИИ недостижима для людей. Еще через 2 месяца Ameca «научилась» рисовать с помощью графовой модели Винсента с открытым исходным кодом Stable Diffusion. Модель научила ее «траекториям» изображения, а затем векторизовала изображение и выполнила эти «траектории» на холсте.
Амека на месте показал, как нарисовать кошку, во время рисования говорил сам с собой о том, почему люди любят кошек, а также оставил в конце личную подпись, полностью погрузившись в свое творение.
Хотя стиль рисования этого кота прост, он полон духа и формы. Когда другие намеренно говорили, что картина слишком грубая, Амека парировала: «Если вам не нравится мое искусство, то, возможно, вы просто не понимаете искусство». Кажется, что Амека очень совершенна. Сознание художника.
В настоящее время Ameca может не только контролировать выражения лиц, как человек, но также обладает возможностями искусственного интеллекта, такими как рисование, пространственное распознавание и клонирование голоса.Он выглядит как человек, но во многих аспектах сильнее людей. Что мешает ему проявить себя и внести вклад в жизнь общества, так это вычислительная мощность.
Как роботы могут быть более «человечными», чем люди?
«Этот робот может за 20 секунд выразить больше эмоций, чем Цукерберг за всю свою жизнь».
Ameca впервые стала популярной в Интернете из-за своей антропоморфной и даже неординарной мимики и чувства взаимодействия.Она не имеет оцепенения рабочих и не требует строгого управления выражением молодых первокурсников.Она подобна увеличительному стеклу, преувеличивающему и преподносящему психологический мир человека.
Если вы выставите перед ним палец, чтобы спровоцировать его, эффект будет похож на эффект кошачьей дразнилки: вместо того, чтобы ударить вас, он сначала посмотрит на ваш палец, а затем с отвращением отступит. Если вы приблизитесь, он ударит вас. Аккуратно уберите его пальцами.
Когда он впервые посмотрел в зеркало, Амека испугался. Затем он прищурился, чтобы посмотреть на себя, прикоснулся к зеркалу и сделал различные искусственные выражения. Он обнаружил, что робот в зеркале синхронизирован с самим собой, что-то вроде «Твое имя» «Реакция главных героев мужского и женского пола после того, как они поменялись телами».
Люди могут даже использовать iPhone и AR Kit, чтобы фиксировать движения лица и отображать их на лице Ameca в режиме реального времени.Ameca может изучать каждое микровыражение и «синхронизироваться» с людьми.
Обеспокоенная тем, что зрители подумают, что это шоу-эффект, команда неоднократно подчеркивала, что «это настоящий робот, в видео нет компьютерной графики».
Почему Ameca такая «человечная», интерактивная и отзывчивая?
Это связано с тем, что Ameca оснащена широким спектром датчиков, включая камеры, микрофоны, энкодеры положения и т. д., и поддерживается двумя базовыми системами: операционной системой робота Tritium и системой инженерного искусства Mesmer.
Тритий отвечает за дистанционное управление различными компонентами лица, головы, шеи, конечностей и т. д. робота, позволяя роботу адаптироваться к внезапным изменениям окружающей среды и немедленно реагировать.
Месмер использует внутреннее 3D-сканирование реальных людей для точной имитации структуры человеческих костей, текстуры кожи и выражений лица, которое разбито на несколько этапов.
На первом этапе реальный человек сидит посреди десятков фотограмметрических устройств.Месмер делает несколько перекрывающихся цифровых фотографий под разными углами, сравнивает цвета пикселей и определяет опорные точки, а затем в цифровом виде реконструирует их в 3D-модель.
На втором этапе исходная 3D-модель переносится в программное обеспечение для моделирования, а после детальной обработки, такой как «удаление волос», создается чистая 3D-модель.
На третьем этапе на стереолитографическом 3D-принтере изготавливается точная форма, в которую впрыскивается силикон, чтобы создать человеческую кожу для робота. К силиконовой коже необходимо вручную добавить волосы и краску для мелких деталей.
Наконец, для завершения сборки на голову робота была помещена силиконовая кожа, а последовательности движений и звуки были добавлены с помощью облачного программного обеспечения Virtual Robot от Engineered Arts.
Кожа Ameca серая, что является намеренным замыслом команды — она выглядит рациональной, нейтральной и толерантной.
Всех тянет друг к другу, а некоторые люди искренне считают, что Амека слишком уродлива, что даже создает у них эффект «зловещей долины»: когда сходство между роботами и людьми во внешности и действиях достигает определенного уровня, тонкие различия между Это будет выглядеть очень ослепительно и устрашающе.
Но когда именно появится эта «долина», точно не определено. Когда вы видите Амеку, думаете ли вы, что она миновала точку зловещей долины? Вам достаточно сопереживать?
Подражайте людям, а затем превосходите людей
Если оставить в стороне инстинкты суждения зрительных животных, какая польза от робота-гуманоида, такого как Амека?
Engineered Arts хвастается собой и игнорирует репутацию Маска, называя Ameca «самым продвинутым в мире роботом-гуманоидом».
Согласно официальному позиционированию, Ameca — это прежде всего платформа для разработки искусственного интеллекта.
Ameca использует «модульную конструкцию», которую можно модернизировать во всех аспектах аппаратного и программного обеспечения. Она имеет яркий экспериментальный цвет и может использоваться в качестве прототипа будущих роботов, взаимодействующих с человеком и компьютером.
В конечном итоге Амека не останется в лаборатории, а будет жить в реальном мире и мирно сосуществовать с людьми.
Это действительно так. Однако Амека по-прежнему не может ходить.
Что касается других текущих применений Ameca, они очень просты: выступления перед публикой и работа в компаниях, тематических парках и научных музеях. Если у вас возникнет искушение, Ameca можно купить или арендовать, но она недешевая: в конце 2021 года ее покупная цена превысит 133 000 долларов.
На вопрос, является ли Ameca искусственным интеллектом, Engineered Arts отметила, что, хотя она содержит некоторое программное обеспечение, которое можно охарактеризовать как «ИИ», разница между роботами и ИИ есть.Чистый ИИ — в «Она» и «Серебряные крылья». изображенный в таких фильмах, как «Наемный убийца» и «2001: Космическая одиссея», — пока не существует.
Поэтому, когда мы видим реалистичного робота Ameca, мы можем наблюдать за ним неторопливо, сохраняя в уме страх и три закона робототехники, и подождать еще немного. По крайней мере, она далека от замены людей и не имеет такой цели на данном этапе.
Но когда мы думаем о скорости эволюции ИИ, мы, возможно, больше не сможем смеяться. Если 2023 год — первый год ИИ, то 2024 год может стать первым годом роботов + ИИ.
Интересным явлением является то, что появляется все больше и больше домашних роботов, но они не обязаны выглядеть как люди и очень «прагматичны» на вид.
Робот ALOHA из Стэнфордского университета готовит, моет посуду, моет полы, складывает одежду и даже подшучивает над кошками. Робот Google DeepMind собирает фрукты и убирает зубные щетки. Робот стартапа Fig научился готовить кофе с помощью кофемашины за 10 часов.
Но по сравнению с подрывом больших языковых моделей эти роботы, можно сказать, только привлекают внимание, и пока еще слишком рано вводить их в эксплуатацию.
Поскольку большинство из них громоздки, их рабочие задачи сосредоточены на операциях на рабочем столе, они требуют демонстрационной подготовки человека, им не хватает большей мобильности и гибкости. Небольшие отклонения в их основных позах могут привести к большим отклонениям в позах. Существует множество «переворотов». видео. .
Шутка об ИИ, сделанная в прошлом году по этому году: «Мы хотим, чтобы ИИ готовил, убирал в доме, стирал одежду и выбрасывал мусор. Однако на самом деле они болтают, рисуют, пишут, сочиняют». и набираем «игра».
В настоящее время домашние роботы с трудом могут освоить основы человеческой работы по дому.Между работой по дому и искусством, Ameca, которую невозможно поднять за плечи и невозможно поднять руками, конечно, больше подходит для искусства.
На примере Amera мы видим, что мы по-прежнему стремимся сделать роботов похожими на людей, а затем научить их ругаться, изучать языки и открывать глаза, чтобы видеть мир, становясь копией самих себя, но в некоторых аспектах сильнее. Однако Амера пока не умеет бегать, прыгать и готовить, поэтому люди, возможно, заслуживают того, чтобы на секунду гордиться собой.
# Добро пожаловать на официальную общедоступную учетную запись aifaner в WeChat: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo