Amazon представляет новое семейство базовых моделей Nova
Генеральный директор Amazon Энди Ясси вышел на сцену на конференции компании re:Invent во вторник, чтобы продемонстрировать шесть новых моделей генерации текста, изображений и видео, которые компания называет Amazon Nova.
Это новое семейство мультимодальных генеративных ИИ включает Nova Micro, текстовую модель, созданную для недорогих ответов с малой задержкой; Nova Lite, недорогая мультимодальная модель для обработки входных изображений, видео и текста; и Nova Pro, мультимодальная модель общего назначения, которая сочетает в себе «точность, скорость и стоимость для широкого круга задач», согласно сообщению компании . Nova Premier — это «наиболее мощные… мультимодальные модели Amazon для решения сложных логических задач», в то время как Nova Canvas — это специальный механизм преобразования текста в изображение, а Nova Reel специально создан для создания видео.
Текстовые модели оптимизированы для 15 различных языков. Micro предлагает контекстное окно на 128 000 токенов, в то время как Lite и Pro могут обрабатывать до 300 000 токенов (около 225 000 слов или 30 минут видео). Компания планирует расширить контекстные окна своих более крупных моделей до 2 миллионов токенов к началу следующего года.
Canvas позволяет пользователям создавать и редактировать изображения, используя подсказки на естественном языке. Reels, которые будут конкурировать с такими устройствами, как Gen-3 Alpha , Kling и Dall-E 3 , могут генерировать клипы длиной до шести секунд как из текстовых подсказок, так и из эталонных изображений. Видеогенератор также предлагает управление движением камеры, включая панорамирование и масштабирование.
«Мы продолжали работать над нашими собственными передовыми моделями, — сказал Ясси собравшейся толпе, — и эти передовые модели добились огромного прогресса за последние четыре-пять месяцев. И мы решили, что если бы мы находили в них ценность, вы, вероятно, нашли бы в них ценность».
Ясси также говорит, что эти модели являются одними из самых дешевых в эксплуатации и самых быстрых в своем классе, хотя компания еще не опубликовала контрольные данные, подтверждающие эти утверждения. «Мы оптимизировали эти модели для работы с проприетарными системами и API-интерфейсами, так что с помощью этих моделей вы можете гораздо проще выполнять несколько организованных автоматических шагов — поведение агентов», — сказал он. «Поэтому я думаю, что это очень убедительно».
Модели Micro, Lite и Pro (а также Canvas и Reels) в настоящее время доступны клиентам AWS. Премьера намечена на первый квартал 2025 года.