Ideal MindVLA хочет переосмыслить автономное вождение и оснастить каждую машину «преданным водителем».

Мы надеемся, что MindVLA сможет наделить автономные транспортные средства когнитивными и адаптивными способностями, подобными человеческим, превратив их в интеллектуальных агентов, способных думать. Подобно тому, как iPhone изменил представление о мобильных телефонах, MindVLA также изменит определение автономного вождения.

В марте было огромное количество новых автомобилей и новых технологий, различные автомобильные компании гонялись друг за другом, вызывая у людей головокружение и даже порождая иллюзию, что новые продукты отстают, как только они выпускаются.

Нет, совсем недавно компания Ideal поделилась последними достижениями своей технологии MindVLA на конференции NVDIA GTC 2025, заявив, что она «переосмыслит автономное вождение, точно так же, как iPhone 4 изменил представление о мобильных телефонах».

Если оставить в стороне сложные технические принципы и методы реализации, наибольшая ценность технологии Ideal MindVLA заключается в том, что она поднимает опыт пользователя автомобиля на совершенно новый уровень.

На встрече компания Ideal подытожила возможности новой интеллектуальной системы вождения в одном предложении: эта новая интеллектуальная система вождения станет постоянным водителем для каждого.

Что может этот специальный драйвер? Я придумал следующие сценарии: забрать меня утром из гаража у моей двери, избавив меня от необходимости спускаться в подвал, чтобы забрать машину; высадить меня у дверей компании, а затем автоматически найти парковочное место и припарковать его, без необходимости искать парковочное место; когда я хочу пойти в торговый центр или кафе, автоматически найти подходящее место назначения без необходимости вручную выбирать навигацию. Самое главное, что он может определить мое местоположение и автоматически забрать меня.

Идеал обобщает эти сцены тремя словами: «понятный», «видимый» и «обнаружимый».

«Понятный» означает, что пользователи могут изменять маршрут и поведение автомобиля с помощью голосовых команд. Это не только расширяет голосовое взаимодействие автомобиля и машины от функций кабины, таких как кондиционер и сиденья, до конкретных операций вождения, но также позволяет пользователю стать вторым пилотом и «научить» автомобиль и машину поворачивать налево, поворачивать направо или ускоряться.

«Видимый» означает, что MindVLA обладает отличными общими знаниями и может распознавать вывески окружающих магазинов и знаковые места. Идеальный пример: когда пользователь не может найти транспортное средство в незнакомом месте, ему нужно только сделать фотографию окружающей среды и отправить ее автомобилю. Транспортное средство, оснащенное MindVLA, может определить местоположение на фотографии и автоматически найти пользователя.

«Найти» в основном используется в сценариях парковки и роуминга в парке. Самый типичный пример – поиск парковочного места в подвале. Пользователю достаточно сказать автомобилю: «Найди парковочное место и припаркуйся».

«Постоянный водитель», кажется, хорошо работает в кампусе и подвале, так как же Ideal гарантирует, что он также способен работать на дорогах общего пользования?

Как мы все знаем, отечественная дорожная ситуация очень сложна, помимо снующих повсюду электромобилей и интенсивной игры между людьми и транспортными средствами, она также имеет следующие характеристики.

Одним из них является широкое использование полос для автобусов. Эти полосы размечены и используются различными способами, включая наземные текстовые знаки, воздушные знаки и придорожные знаки. В разных районах используются разные текстовые формы для объяснения ограничений по времени, и часто появляются новые полосы для автобусов или знаки, которые размыты из-за строительных работ.

Второе — это динамически регулируемые полосы и приливные полосы, которые появились в крупных городах в последние годы, а также зоны ожидания и зоны ожидания, созданные для полного использования пространства перекрестков. Время использования этих зон контролируется различными сигнальными огнями или светодиодными текстовыми знаками, и оборудование может каждый день сталкиваться с новыми дополнениями, сбоями или обслуживанием.

Таким образом, в Китае системы автономного вождения не только должны иметь дело со сложными взаимодействиями между человеком и транспортным средством, но также должны иметь возможности понимания текста, здравого смысла и сильные логические рассуждения.

FSD, недавно запущенный Tesla, подвергся критике за плохую работу в этих сценариях.

Чтобы решить эти проблемы, компания Ideal приняла в качестве решения структуру двойной системы.

Проще говоря, идеальная модель делится на две системы: быстрое мышление (система 1) и медленное мышление (система 2). Автомобильный терминал реализует быструю систему посредством сквозной модели. Это единственная модель, которая напрямую преобразует входные данные датчиков в выходные данные траектории движения, аналогично интуитивным реакциям человека. Система реагирует на различные сценарии, имитируя поведение человека при вождении, и полностью управляется данными. Она не требует установленных человеком правил и не полагается на какие-либо высокоточные карты или предварительную информацию. Он имеет чрезвычайно высокую эффективность обучения и исполнения.

Медленная система опирается на большую модель визуального языка (VLM) с масштабом параметров 2,2B. В сценариях, требующих понимания текста, здравого смысла и логического рассуждения, VLM проводит углубленный анализ с помощью цепочки мыслей (COT), принимает важные решения и обеспечивает быстрое выполнение системы. Сквозная модель (Система 1) и модель VLM (Система 2) работают на чипе OrinX.

Короче говоря, благодаря такой технической архитектуре идеальный автомобиль, оснащенный функцией MindVLA, больше не является просто инструментом вождения, а интеллектуальным агентом, который может общаться с пользователем и понимать намерения пользователя.

Интеллектуальные или персонализированные генеративные интеллектуальные решения для вождения стали консенсусом различных автомобильных компаний и поставщиков на пути развития технологий будущего. Джикриптон и Чжоюй также упомянули соответствующий контент вчера на своих технологических конференциях.

Поскольку в настоящее время на рынке нет реальных автомобилей, оснащенных системой такого типа, мы не можем оценить ее реальную эффективность. Однако согласно графику каждой компании, серийное производство этих систем ожидается уже в этом году. Тогда Dongche как можно скорее проведет для всех реальный опыт тестирования.

# Добро пожаловать на официальную общедоступную учетную запись WeChat aifaner: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo