Это новое волшебное приложение — искусственный интеллект Рона Бургунди для вашего телефона.

Несмотря на то, что OpenAI откладывает функцию преобразования текста в речь для ChatGPT, аудио-стартап ElevenLabs в среду выпустил приложение Reader для iOS — модель, которая обещает читать вслух слова практически из любого источника контента, включая новостные статьи, PDF-файлы, электронные публикации и информационные бюллетени. — даже вставка веб-ссылок.
Сегодня мы запускаем iOS-приложение ElevenLabs!
Он позволяет вам слушать любую статью, книгу или документ, используя голоса, сгенерированные искусственным интеллектом.
Посмотрите это pic.twitter.com/zQ9ISG8NUn
— Аммаар Реши (@ammaar) 25 июня 2024 г.
Пользователи смогут выбирать из библиотеки « высококачественные человеческие голоса » для прослушивания и контролировать, насколько быстро голос, модулированный искусственным интеллектом, читает им текст. Приложение Reader доступно на iPhone, iPad и iPod Touch (всех устройствах, работающих под управлением iOS и iPadOS 15 или новее) для пользователей в США, Великобритании и Канаде. Компания планирует выпустить программное обеспечение в ЕС « через пару недель » примерно 11 июля. Версия для Android в настоящее время находится в разработке, и компания предлагает список ожидания для заинтересованных пользователей.
ElevenLabs уже рассматривает обновления для сервиса, включая автономное воспроизведение, доступ к RSS-каналам, обобщение AI и возможность делиться фрагментами с друзьями. Компания также стремится расширить разговорные языки до всех 29 языков, поддерживаемых ее многоязычной моделью.
«Создать лучшие в своем классе аудиомодели искусственного интеллекта недостаточно», — говорится в объявлении ElevenLabs в среду. «Творцам нужны инструменты, с помощью которых они могут творить. А потребителям нужны интерфейсы, через которые они могут потреблять аудио». В конечном итоге компания начнет взимать плату за эту услугу (учитывая, что на ее веб-сайте указано, что первые три месяца использования бесплатны), хотя пока нет информации о том, сколько может стоить эта подписка.
Согласно предыдущему отчету Digital Trends, голосовые модели ElevenLabs, созданные с помощью искусственного интеллекта, обучаются на общедоступных данных, данных, полученных по соглашениям с коммерческими партнерами, и общедоступных данных. С их помощью компания может предлагать различные услуги: от дубляжа и автоматического перевода до клонирования голоса и автоматического повествования — даже создания голосов ИИ для неигровых персонажей, созданных на Unreal Engine.