Что происходит, когда ChatGPT устанавливается на робота-собаку Boston Dynamics?
Ролик «Большая желтая собака» от Boston Dynamics можно назвать моделью роботов-знаменитостей в Интернете.
Спот умеет патрулировать, передвигать кирпичи и танцевать.С момента своего рождения Спот привлекает внимание любителей роботов со всего мира.Кто может отказаться от такой собаки-робота с гибкими движениями, простой и честной осанкой и миловидностью.
После многих лет разработки быть симпатичным больше не является "основным бизнесом" Spot. По данным Boston Dynamics, Spot теперь может помогать людям выполнять задачи в определенных сценариях, таких как обнаружение приборов на трансокеанских кораблях и участие в сложных исследованиях местности. Или спасательные работы и скоро.
Что будет, если дать Spot такое же гибкое тело и такой же умный мозг, как ChatGPT?
Эксперт по искусственному интеллекту Сантьяго Вальдаррама действительно сделал такое Пятно с «самым сильным мозгом».
Используйте ChatGPT, чтобы значительно упростить взаимодействие человека с компьютером
Сантьяго поделился в Твиттере видео, на котором он взаимодействует с модифицированной версией Spot, возможно, с первой в истории говорящей и общающейся собакой-роботом.
Как видно из демонстрационного видео, Spot не так прост, как установка «Siri»: когда он отвечает на человеческие вопросы, его тело также будет раскачиваться в зависимости от содержания и тона фразы, что выглядит как The Wall-E из научная фантастика стала реальностью.
Когда вы зададите несколько простых вопросов «Да или Нет», он также ответит вам языком тела, таким как «кивание» и «качание головой» вместо голоса.Это показывает, что Spot далеко не так прост, как встроенный -в смарт-динамике.
После доступа к ChatGPT самым большим изменением в Spot стало то, что он может понимать человеческую речь и общаться с пользователями на естественном языке.
Сантьяго продемонстрировал сцену. Он сказал Споту, что в комнате слишком много народу, потому что он слишком мешает. Отпустите его немного назад. Как только голос стих, Спот понял, что имеет в виду Сантьяго, и сделал несколько шагов назад.
Как насчет того, чтобы призывать роботов работать в фантастических фильмах?
В прошлом для работы Spot требовался большой пульт дистанционного управления, похожий на дрон, или компьютер для ввода сложных команд, но теперь добавление ChatGPT дало Spot мощную способность понимать естественный язык, и он может взаимодействовать с роботами, двигая вашим ртом.
В этом процессе ChatGPT действует как переводчик между людьми и роботами, превращая «человеческие слова», вводимые людьми, в инструкции, понятные машинам, а затем выражая обратную связь робота в реальном поведении или «человеческих словах».
Сантьяго рассказал, что они вводят файл Spot в ChatGPT, и объяснил структуру файла и как читать файл, таким образом реализуя голосовой диалог и работу со Spot.
Взаимодействие между оператором и Spot значительно упростилось. Люди могут спросить его напрямую: «Сколько у вас мощности?» Тогда Spot ответит голосовым способом, который использует технологию преобразования текста в речь Google. «Рот» пятна.
Spot (или встроенный ChatGPT) будет отвечать на вопросы в соответствии с реальной ситуацией, например, когда вы спросите его, какую задачу выполнить дальше, он ответит в соответствии с установленным списком задач, что в значительной степени позволяет ChatGPT избежать ситуаций, фабрикующих факты.
Когда оператор дает Spot команды, такие как поворот на 90 градусов и перемещение вперед на 1 метр, Spot свяжет внутренние датчики и систему позиционирования, чтобы точно реагировать на эти команды, и не скажет, что он вышел из-под контроля, потому что «мозг слишком развитый".
Интересно, что когда вы зададите ему вопрос «Кто вы?», он ответит «Я OpenAI», а не робот-собака Спот.
Компания Сантьяго, Levatas, занимается искусственным интеллектом и сотрудничает с Boston Dynamics, помогая компаниям изучать способы использования роботов для решения практических задач.
Сантьяго считает, что наибольшее практическое значение установки ChatGPT on Spot заключается в преобразовании сложных данных, с которыми могут работать только технические специалисты, в естественный язык, понятный и понятный каждому.
Каждый раз, когда робот выполняет задачу, ему приходится вводить длинный набор инструкций, после завершения работы он также будет генерировать большое количество данных, и только самые профессиональные техники могут анализировать проблемы на основе этих данных.
Но теперь через ChatGPT это можно сделать двумя простыми предложениями.
Когда порог срабатывания робота становится ниже, сценарии использования робота становятся богаче.
Потенциал больших моделей ИИ нельзя недооценивать
Версия Spot с «самым мощным мозгом» не может быть достигнута за одну ночь.Месяц назад Сантьяго выпустил видео, представляющее Spot, который может «понимать человеческую речь» и использует Whisper, еще одну важную модель искусственного интеллекта OpenAI.
В этом «первом издании» Smart Spot Сантьяго более подробно объясняет принципы:
Whisper может эффективно преобразовывать речь в текст в режиме реального времени, а точность и скорость преобразования очень впечатляют. Объединив Whisper с SDK Spot, он может извлекать ключевые слова из человеческой речи, а затем отправлять команды Spot через SDK.
Вам нужно только сказать ему слово, вы можете заставить Spot покинуть зарядную док-станцию, встать, чтобы проверить, есть ли проблема со счетчиком, что значительно снижает эксплуатационные расходы людей.
Практика Сантьяго отвечает на широко обсуждаемый вопрос с хорошей точки зрения: каково значение большой языковой модели, такой как ChatGPT?
Сначала люди думали, что ChatGPT — это чисто генерирующий текст искусственный интеллект, обладающий относительно сильными способностями к пониманию естественного языка и способный писать статьи и отчеты.
Позже люди обнаружили, что пока ChatGPT получает соответствующие инструкции, он может автоматически выполнять программирование или обработку текстов вместо людей, как компьютер, основанный на естественном языке.
После того, как OpenAI выпустил функцию плагина, ChatGPT можно комбинировать со многими интернет-приложениями, интегрируя многие кроссплатформенные операции с диалогами и становясь новым входом в Интернет.
Copilot, выпущенный Microsoft, вдохновил воображение людей на следующий этап взаимодействия человека с компьютером: графический интерфейс операций не всегда является разумной парадигмой, и многие привычные нам операции могут быть заменены диалогом.
Когда мы вернемся к Spot, мы ясно увидим значение большой языковой модели: упростить взаимодействие человека с компьютером и дать роботам более развитый интеллект.
Независимо от того, используется ли ChatGPT в качестве нового интернет-портала или в качестве пульта дистанционного управления для управления промышленными роботами с возможностью обучения, анализа проблем и выполнения высокоточных операций, он по существу переводит сложные наборы инструкций на естественный язык, снижая эксплуатационные расходы.
Это расширение возможностей позволит будущим промышленным роботам быть не только инструментами для выполнения команд, но и иметь уровень интеллекта, сравнимый с человеческим мозгом.
Подобно тому, как графический интерфейс превращает сложные командные строки в интуитивно понятные значки, а сложная операция по нажатию различных значков стала простым предложением, люди переходят от графического пользовательского интерфейса к новому этапу: пользовательскому интерфейсу на естественном языке.
На этом этапе модель большого языка станет ключевой технологией промышленных роботов, которая упростит взаимодействие человека с компьютером, повысит эффективность производства и будет способствовать дальнейшему технологическому развитию человеческого общества.
А в некоторых случаях языковые модели могут даже лучше понимать язык, чем люди. Арвинд Нараянан, профессор Принстонского университета, упомянул в своем блоге личный случай.
Арвинд Нараянан подключил ChatGPT к голосовому взаимодействию для своей почти четырехлетней дочери. Как и все дети, его дочь полна любопытства и часто задает различные вопросы ChatGPT.
К его удивлению, когда он сказал ChatGPT, что разговаривает с ребенком, ChatGPT стал очень хорошо выражать сочувствие.
Дочь: «Что происходит, когда выключают свет?»
ChatGPT: «С выключенным светом будет очень темно и может быть немного страшно. Но не волнуйтесь! Есть много вещей, которые помогут вам чувствовать себя в безопасности и комфортно в темноте».
Обозреватель Bloomberg Парми Олсон отметил, что Microsoft и Google заняты использованием больших моделей в поисковых системах, но они не видят, что ChatGPT больше подходит как эмоциональный компаньон, чем как поставщик фактов.
Олсон также попросила ChatGPT пройти тест на эмоциональный интеллект, который оказался лучше, чем у нее самой и у ее коллег. Просто потому, что ChatGPT обучается на текстовом материале в Интернете, в данных будет много дезинформации, но это также улучшает имитацию эмпатии.
Эти случаи полностью продемонстрировали, что способность больших языковых моделей понимать естественный язык на самом деле имеет большой прикладной потенциал.
Обладая такой мощной способностью к пониманию, мы можем использовать модель большого языка, чтобы по-настоящему реализовать еще одну инновацию во взаимодействии человека с компьютером.В то же время появление модели большого языка открыло новые возможности для разработки роботов.
Модели с большим языком позволяют роботам лучше понимать и обрабатывать инструкции, а также быстрее учиться и адаптироваться к новым задачам и условиям.
«Житель Нью-Йорка» упомянул в сопроводительной статье «Фабрика тьмы» (Dark Factory), что общая трудность промышленных роботов в настоящее время заключается в разработке «конечного эффектора», похожего на человеческую руку, чтобы робот мог использовать различные объекты захвата из различных размеров и форм с большой силой.
Если эта техническая проблема будет решена, роботы смогут выполнять более тонкую работу, а степень автоматизации во многих областях значительно повысится. Например, сбор различных фруктов можно автоматизировать, а сборочная линия Foxconn больше не нуждается в таком количестве рабочих.
Будущие промышленные роботы должны быть не только инструментом для выполнения команд, но и обладать уровнем интеллекта, сравнимым с человеческим мозгом, со способностью к обучению, анализу проблем и выполнению высокоточных операций.
На промышленной производственной линии «мускулистые» промышленные роботы более гибки и эффективны, способны лучше справляться с различными производственными проблемами и повышать эффективность и качество производства. Например, в области автомобилестроения большие языковые модели могут наделить роботов более сильным интеллектом и когнитивными способностями, что позволит им лучше выполнять разнообразные задачи.
В области медицинской робототехники роботы могут общаться с врачами и пациентами с помощью технологии обработки естественного языка, чтобы предоставлять более качественные медицинские услуги.
Модель большого языка привнесла в индустрию роботов мощный мозг и создала более общий сценарий применения роботов, который, вероятно, станет техническим ядром четвертой промышленной революции. «Голосовая версия» Spot — первая искра этого технологического изменения.
#Добро пожаловать, обратите внимание на официальный публичный аккаунт Айфанер в WeChat: Айфанер (идентификатор WeChat: ifanr), более интересный контент будет представлен вам как можно скорее.
Ай Фанер | Оригинальная ссылка · Просмотреть комментарии · Sina Weibo