Вот все самые важные анонсы Gemini с Google I/O 2024.

Генеральный директор Google Сундар Пичаи на сцене Google I/O рассказывает о Близнецах.
Google

Неудивительно, что искусственный интеллект находится в центре внимания конференции разработчиков Google I/O в этом году. Компания только что представила более продвинутую версию Gemini 1.5 Pro, мощного пакета генеративного искусственного интеллекта. Gemini 1.5 Pro, доступный для разработчиков уже сегодня, представляет собой мультимодальную языковую модель, которая может работать с текстом, голосом и различными форматами контента.

Последние обновления Gemini 1.5 Pro включают расширенное контекстное окно, расширенные функции анализа данных, интеграцию с дополнительными приложениями Google и расширенные возможности настройки. Также есть улучшения в важнейших случаях использования, таких как перевод, кодирование, рассуждение и многое другое.

Близнецы 1.5 Флэш

Ключевые особенности Gemini 1.5 Flash.
Google

Google также представила Gemini 1.5 Flash — модель меньшего размера, оптимизированную для более узких или высокочастотных задач, где скорость и время отклика имеют наибольшее значение.

И 1.5 Pro, и 1.5 Flash теперь будут поддерживать контекстное окно на 1 миллион токенов, и Google также планирует расширить это число до 2 миллионов в 1.5 Pro. Обе модели теперь доступны пользователям в 200 странах в качестве предварительной версии, а общее внедрение ожидается в июне.

Более длинное контекстное окно

Этап Google I/O со слайдом на экране, рассказывающим о Близнецах.
Google

Одной из основных возможностей Gemini 1.5 Pro является улучшенное контекстное окно на 1 миллион токенов, которое считается самым длинным из всех потребительских чат-ботов в мире. Это означает, что ИИ теперь может воспринимать множество больших документов — до 1500 страниц или суммировать около 100 электронных писем. В конечном итоге он также сможет обрабатывать час видеоконтента или кодовых баз, превышающих 30 000 строк.

Google также объявил, что к концу этого года он даже намерен достичь контекстного окна в 2 миллиона токенов, что еще больше расширит возможности ИИ.

Близнецы в прямом эфире

Google демонстрирует Gemini Live.
Google

Чтобы модель искусственного интеллекта выглядела более естественной и интуитивно понятной, Gemini получит новую функцию Live, которая позволит вам улучшить качество общения. Вы можете не только разговаривать с Gemini и задавать вопросы, но он также может реагировать на различные звуки в вашем окружении.

Например, вы можете использовать функцию Live в Gemini, чтобы помочь вам на собеседовании, готовясь и репетируя вместе с вами, а также предлагая ключевые навыки, на которые следует обратить внимание во время собеседования. Кроме того, будущие функции позволят Gemini использовать вашу камеру во время сеансов Live, что облегчит обсуждение вашего окружения.

Более глубокая интеграция с приложениями

Скриншот из Google I/O, показывающий товарища по команде AI рядом с докладчиком.
Google

Gemini 1.5 Pro также будет сосредоточен на усовершенствовании чат-бота с искусственным интеллектом, чтобы он мог функционировать как универсальный цифровой помощник, специально предназначенный для управления повседневными задачами. Для этого Google интегрирует Gemini с Google Calendar, Tasks и Keep, которые вскоре будут внедрены посредством расширений, представленных на платформе Bard в прошлом году.

Это поможет пользователям беспрепятственно выполнять такие действия, как суммирование электронных писем в Gmail, доступ к Документам Google или Диску и даже загрузку изображений для таких задач, как добавление событий в Календарь Google или элементов в список покупок в Google Keep. Мультимодальные возможности и предлагаемые функции Gemini, такие как распознавание списков школьных мероприятий по фотографиям или объединение ингредиентов рецептов в списки покупок, предлагают оптимизированный подход к организации повседневных обязанностей.

Google даже анонсировал новую функцию AI Teammate для пользователей Workspace , которая позволяет вам развертывать виртуальных коллег в вашей компании или организации.

Персонализированные драгоценные камни

Скриншот из Google I/O со слайдом на экране о драгоценных камнях.
Google

Подписчики Gemini Advanced вскоре получат возможность создавать Gems — специальную версию Gemini для более персонализированного взаимодействия. Если вам нужен компаньон во время тренировки, помощник по приготовлению пищи, соавтор по программированию или наставник по письму, Gems можно настроить в соответствии с вашими предпочтениями.

Просто наметив задачи и желаемые ответы, Gemini уточнит ваши инструкции одним щелчком мыши, создав Gem, отвечающий вашим уникальным требованиям.

Gemini почти всегда затрагивал анонсы в рамках основного доклада, в том числе обновления для Android , Поиска, Gmail , Google Lens , Google Photos и других.