Я видел новые «Джемини» и «Проект Астра», вот почему за ними будущее

Мы быстро вступаем в сферу полезного ИИ, и ключом к этому является Project Astra , новый универсальный ИИ-агент Google, который помогает в повседневных задачах. Oppo, Honor, Motorola и Tecno разработали новые способы использования искусственного интеллекта, которые помогут вам в повседневной жизни, но ключом к следующему поколению искусственного интеллекта является мультимодальный подход Astra.

Идея проста: направьте камеру телефона на что-нибудь и поговорите с Google Gemini в реальном времени, где вы сможете задавать ему вопросы и предлагать предложения на основе того, что он видит.

Технология, лежащая в основе, сложна, и, как вы можете себе представить, внедрение функций происходит более постепенно. Первые две функции наконец-то готовы, и перед их запуском в конце этого месяца мне удалось ознакомиться с ними вместе с другими анонсами Gemini. То, что я увидел, — это будущее искусственного интеллекта, и я очень взволнован:

Возможности Astra: Gemini Live Video и совместное использование экрана.

Приложение Gemini Live на Galaxy S25 Ultra транслирует на телевизор приложение Gemini с открытой функцией камеры.
Нираве Гондия / Цифровые тенденции

Большим обновлением Gemini является новыйGemini Live , который получает новые визуальные возможности на базе Project Astra. Логично, что функции Astra помогут создать следующее поколение Google Live во многих отношениях.

Если вы ждали ИИ, который поможет вам понять мир вокруг вас, новая функция обмена видео изменит вашу жизнь. Демонстрация включала в себя вопросы, связанные с гончарным бизнесом, а Gemini Live была посвящена пониманию цветов, форм и контекста без необходимости многочисленных подсказок.

Как вы увидите в видео выше, это очень увлекательно, а возможности безграничны. Я понятия не имею, возможно ли это, но могут ли Gemini помочь вам сменить колесо или устранить распространенную проблему с двигателем, если вам никогда раньше этого не приходилось делать? А как насчет того, чтобы попросить у него совета по моде, узнать медицинский диагноз или посмотреть живую трансляцию происходящего во время путешествия?

Приложение Gemini Live на Galaxy S25 Ultra транслирует на телевизор приложение Gemini, отображающее расшифровку разговора и предпринятые шаги. Приложение Gemini Live на Galaxy S25 Ultra транслирует на телевизор приложение Gemini, отображающее расшифровку разговора и предпринятые шаги. Приложение Gemini Live на Galaxy S25 Ultra транслирует на телевизор приложение Gemini с открытой функцией камеры.

Конечно, есть и профессиональный вариант использования, и новый Gemini Live также поддерживает совместное использование экрана. Это позволит вам делиться своим экраном, задавать вопросы, а Gemini поможет вам в этом. Я вижу, что это особенно эффективно при выполнении сложных задач, таких как подача документов, изучение сложного предмета или заполнение финансовой и налоговой документации.

Это не единственные достижения в новом агентном искусственном интеллекте: Google продемонстрировал и другие новые функции Gemini для продуктов в своей экосистеме.

Gemini Live теперь может читать файлы, документы и изображения

Распознавание документов в Google Gemini Live
Нираве Гондия / Цифровые тенденции

Помимо функции совместного использования экрана на Gemini Live, Google продемонстрировал способность Gemini читать и понимать широкий спектр изображений, файлов и документов. Эта функция расширяет основные возможности Gemini Live и включает в себя множество различных типов файлов.

Эта функция, вероятно, станет огромным благом для студентов, поскольку Google продемонстрировал, как студенты могут ее использовать. Рассмотрим страницу учебника по ДНК. Как показано в видео, Gemini Live может объяснить тему более подробно, выполнить поиск в базе знаний дополнительной актуальной информации и даже придумать стишок, который поможет вам запомнить ключевые факты.

Распознавание документов в Google Gemini Live Распознавание документов в Google Gemini Live Распознавание документов в Google Gemini Live

Добавление этих функций поднимет Gemini Live на новый уровень и, мы надеемся, рано или поздно откроет эру следующих очков Google. Демонстрация проводилась с использованием приложения Gemini на Galaxy S25 Ultra, поэтому оно должно быть доступно всем пользователям Gemini Advanced.

Новые функции Google Home: процедуры Gemini

Интеграция Google Home и Gemini на Nest Hub Max
Нираве Гондия / Цифровые тенденции

Эта демонстрация была специально разработана, чтобы показать, как Gemini AI развивает умный дом. Во многих отношениях Gemini будет использоваться для реализации долгожданной мечты об автономном умном доме.

Демо-версия включает в себя аналогичный сценарий отсутствия файлов cookie. Если у вас есть дети, партнер-сладкоежка или даже хитрый домашний питомец, новая интеграция Google Home и Gemini поймает их с поличным.

Интеграция Google Home и Gemini на смартфоне Интеграция Google Home и Gemini на смартфоне Интеграция Google Home и Gemini на смартфоне

Демонстрация показала, как Gemini можно использовать для прокрутки отснятого материала с камеры Nest Cam, поиска конкретного момента, когда исчезли файлы cookie, и анализа сцены. И все это из-за простой подсказки о том, кто съел пропавшее печенье? С помощью одной команды Gemini также может настроить новую процедуру, которая будет автоматически выполняться в следующий раз, когда преступник будет обнаружен на этой камере. Мне не терпится продолжить тестирование процедур, особенно более сложных подсказок и процедур.

Будущее искусственного интеллекта — за Google Gemini

Логотип Gemini на боковой стороне стенда Google Gemini на MWC 2025.
Нираве Гондия / Цифровые тенденции

Я впечатлен запуском Google Gemini, по крайней мере, его усилиями по созданию смартфонов. Широкое внедрение на сотнях миллионов устройств Android и партнерство с различными производителями телефонов для разработки новых функций являются ключевыми факторами роста числа пользователей и функций.

Google здесь является непревзойденным посредником, помогая объединить различные идеи и потребности производителей телефонов в рамках своей дорожной карты функций. Наступит время, когда некоторые функции останутся эксклюзивными для конкретного производителя телефонов, но сейчас здорово, что все пользователи Gemini могут протестировать и испытать эти достижения.

Распознавание документов в Google Gemini Live
Нираве Гондия / Цифровые тенденции

То есть, если вы платите за Gemini Advanced. Как и ожидалось, функции видео и совместного использования экрана в Gemini Live доступны только пользователям Gemini Advanced, при этом неясно, будут ли все или часть других функций доступны без платной подписки. Если вы еще не купили его, возможно, сейчас самое время. Если вам нужен новый телефон, вы также можете бесплатно получить 1 год плана Google One AI, который включает в себя Gemini Advanced , при покупке Pixel 9 Pro , Pixel 9 Pro XL или Pixel 9 Pro Fold .

Последние обновления Gemini меня очень воодушевляют будущим искусственным интеллектом на смартфонах. Ранние функции Gemini были для меня менее полезны, поскольку они были ориентированы на более творческие начинания, тогда как меня больше интересовали хаки производительности, но ситуация изменилась довольно быстро. Для пользователей iPhone, возможно, Gemini сможет помочь заполнить дыру после задержки выхода новой Siri на базе искусственного интеллекта, анонсированной ранее на этой неделе.