Я позволил Gemini превратить сложные исследования в подкасты. Я никогда не вернусь

Отход от Google Assistant и переход к эпохе Gemini находится почти на последней стадии. Можно испытывать ностальгию по одноименному виртуальному помощнику, но нельзя отрицать, что появление Gemini действительно изменило то, что может сделать для нас агент ИИ.

У Близнецов понимание языка намного лучше .Разговоры естественны , взаимодействие с приложениями плавное, интеграция с другими продуктами Google доставляет удовольствие, и даже в бесплатном состоянии Gemini берет Siri в чистку даже на iPhone .

Однако есть несколько уловок, которые ставят Близнецов в совершенно другую лигу. Deep Research — одна из тех агентских функций , которыми я пользуюсь ежедневно и до сих пор удивляюсь. В марте Google добавил в арсенал Gemini еще одну полезную функцию: аудиообзоры.

Превращаем все это в подкаст

Подсказка аудиообзора в Gemini.
Надим Сарвар / Digital Trends

Представьте себе, что вы превращаете свои скучные документы, откровенно сложные исследовательские работы или академические материалы для чтения в оживленный двусторонний чат подкаста. По сути, в этом вся суть аудиообзоров. Эта функция впервые появилась на глубоко недооцененном NotebookLM от Google и, наконец, была перенесена в базовый интерфейс Gemini на мобильных устройствах и в Интернете.

Вам не нужно проходить через какие-либо технические сложности или писать сверхспецифическую текстовую подсказку, чтобы получить эти изменения звука. Просто загрузите файл из средства выбора вложений, и прямо над окном чата появится надпись «Создать обзор аудио». Нажмите на него, и начнется генерация подкаста.

Это может занять несколько минут, но тем временем вы можете безопасно переключиться на другое приложение (или окно). Как только процесс завершится, вы получите уведомление о том, что подкаст готов для прослушивания или обмена с другими людьми.

Аудиообзор обычно представляет собой свободный чат двух человек в пугающе естественном тоне. Такое ощущение, будто вы общаетесь с Gemini Live, который сам по себе кажется значительно более естественным, чем любой чат-бот с искусственным интеллектом, который я до сих пор использовал в режиме голосового разговора.

Я бы сказал, что эти подкасты, созданные искусственным интеллектом, в целом довольно хорошо сделаны. Но я тяготею к ним по нескольким причинам. Во-первых, я смотрю на экран, читаю исследовательские статьи и пишу свои собственные материалы, почти целый день.

Создание подкаста Gemini в процессе.
Надим Сарвар / Digital Trends

Это оставляет мало места для дальнейшего использования текстового материала, будь то академический, связанный с работой или даже развлекательный. Однако, если бы я мог просто изменить сенсорный режим, чтобы работать с этим материалом, моя усталость от чтения отошла бы на второй план.

Аудиоподкасты предлагают совершенно новый способ более захватывающего взаимодействия с текстовым материалом. Это подводит нас ко второму преимуществу — сенсорной стимуляции или вариативности. Эта формула хорошо документирована и с ней экспериментировали в академических кругах и профессиональном коучинге.

Как мне это помогло?

Усталость от текста берет свое. Из-за этого даже захватывающая работа кажется рутинной работой, которую нужно закончить только потому, что вы не можете позволить себе ее пропустить. Однако участие в одной и той же работе или ее сути через разные сенсорные средства подавляет страх перед перегрузкой текстовым материалом. На самом деле это помогает и в нескольких других отношениях.

"Задействование нескольких органов чувств укрепляет память. Когда мы слушаем и взаимодействуем — будь то посредством чтения, письма или действий, — мозг создает более прочные связи, благодаря чему нам легче вспоминать позже", — говорит Ясир Насим, эксперт-лингвист, чья исследовательская работа сосредоточена на модернизации и геймификации методологий обучения.

Насим, который в настоящее время является экспертом по учебным программам в ведущей фирме в области образовательных технологий, говорит мне, что нельзя полагаться исключительно на одну среду обучения. Вместо этого, говорит он мне, для получения максимальной пользы нужно комбинировать разные методы, начиная от сентиментального воздействия и заканчивая сохранением памяти.

Близнецы создают аудиообзор.
Надим Сарвар / Digital Trends

Исследование, опубликованное в журнале «Компьютеры и образование», также показало, что студенты считают аудиофайлы лучшим материалом для обучения и повторения. Гибкость и сенсорная универсальность сыграли важную роль в том, что они предпочли подкасты другим средствам массовой информации.

«Истинное понимание и долгосрочное удержание достигаются, когда прослушивание сочетается с визуальными эффектами, обсуждениями или практическими занятиями», — добавляет Насим. Мой собственный опыт использования аудиообзоров Gemini подтверждает его совет. Я лучше помню знания, которые я получил с помощью аудиоподкастов, по сравнению с чтением того же материала .

Видите ли, эти аудиоподкасты — это не просто преобразование текста в аудио. Вместо этого они разбивают скучную стену текста на разговор двух человек, для которого вы, по сути, являетесь единственной аудиторией. Это благо для любого текстового материала, который не вызывает мгновенного любопытства и не побуждает к мгновенному чтению.

В моем последнем эксперименте аудиоподкаст Gemini помог мне понять значение статьи, в которой обсуждается «структура интерпретируемого нейронного обучения, основанная на локальных теоретико-информационных целевых функциях». Проще говоря, в исследовании обсуждалось, как нервные клетки организуются.

Вы поняли, что я пытаюсь здесь сказать, верно?

Удобство превыше всего

Gemini AI создает аудиоподкаст на основе исследовательской работы.
Надим Сарвар / Digital Trends

Удобство играет важную роль при усвоении информации. А также энтузиазм и волнение по поводу всего процесса. Согласно статье, опубликованной в журнале «Компьютеры в поведении человека» , подкасты «повышают удобство, гибкость и доступность информации и знаний». Мне не потребовалось много времени, чтобы это осознать.

Живя в столице страны, проводя 2–3 часа в пробках или в общественных поездках, это для меня повседневная реальность. Но больше всего болит не только дискомфорт от всего этого, но и потеря времени. Аудиоучебные материалы предлагают наиболее удобный способ продуктивно использовать это время.

С Близнецами у вас есть еще одно важное преимущество. Вам не нужно полагаться на наличие аудиозаписи определенной книги, новостной статьи или академического материала. Вы можете просто скачать любой материал, который есть в вашем распоряжении, и Gemini превратит его в беседу в стиле подкаста.

Существует множество междисциплинарных исследований, подтверждающих преимущества аудиоподхода к обучению. И речь идет не только о том, чтобы слушать, но и о том, чтобы разложить вещи по полочкам и представить их в более доступной форме.

"Некоторые люди сказали… им нравится тот факт, что мы даем им кое-что, о чем они не читают в газетах. Им нравится тот факт… что мы пытаемся представиться по-другому", – говорится в исследовательской статье со ссылкой на редактора новостей. Статья, любезно предоставленная Сиракузским университетом, была опубликована в 2006 году, на заре популярности подкастов.

Создание подкаста с обзором аудио в Gemini.
Надим Сарвар / Digital Trends

К 2025 году подкасты стали настоящим явлением для потребления информации, от образовательных материалов до развлекательных материалов. По данным исследовательского центра Pew , почти половина американцев слушают подкасты. Более половины опрошенной аудитории слушали подкасты для обучения, развлечения или для прослушивания аудиоматериала во время других занятий.

Почти треть хотела услышать мнение других людей, а еще один такой же большой сегмент был подключен для того, чтобы они могли следить за новостями и текущими событиями. Моя помолвка не сильно отличалась от вышеупомянутой модели. Для длинных журналистских историй или расследований я часто находил их версию подкаста более приятной.

Еще и эффективнее

Интересно, что подкасты, похоже, также способствовали практическим изменениям. Примерно две трети слушателей заинтересовались книгой или фильмом после прослушивания подкаста, более половины аудитории начали следить за человеком в социальных сетях, а треть из них изменила образ жизни, например, начала заниматься спортом или изменила диету.

Исследование, опубликованное в Журнале маркетинга в социальных сетях, выдвинуло на первый план такие концепции, как замена СМИ и функциональное сходство в контексте прослушивания СМИ и готовности аудитории. Основная идея заключается в том, что пользователи оценивают среду и выбирают тот, который им больше всего подходит.

«Что касается уникальности содержания подкастов, то влияние на готовность слушать и замену медиа является положительным, что позволяет предположить, что уникальное содержание, высокое качество и широкое разнообразие вызывают у людей желание слушать подкасты», — говорится в статье. Я также могу лично подтвердить этот вывод.

За последние несколько дней я «подкастировал» множество исследовательских работ, в которых обсуждалось влияние потребления клетчатки, мяса и упакованных продуктов питания на режим сна, когнитивное здоровье и здоровье кишечника. По сравнению с откровенно техническим тоном научных статей, когда два ведущих излагали результаты «сентиментальным» и «убедительным» тоном, это оказало на меня заметно более глубокое воздействие.

Думайте об этом как об изучении социального этикета или культурной чувствительности из книги. И спустя годы увидеть их в действии собственными глазами. Или подумайте об изучении иностранного языка по книге самостоятельно, и о том, как изменится ситуация, когда вы учите его от человека, который вкладывает все эти знания в ваши уши.

Последний подход дает лучшие результаты. И это в первую очередь потому, что комплексный эффект мультисенсорного взаимодействия ускоряет процесс обучения или просто делает его более эффективным. Обзоры аудио Gemini создали аналогичный эффект и очень мне помогли.

Несколько загвоздок

Как бы продуктивно это ни звучало, аудиообзоры Gemini таковыми не являются. Они могут истощить истинную суть со вкусом написанной истории в попытках «подкастификации» или упустить несколько мелких деталей. Есть и пара функциональных странностей. Длина аудиообзора, которая напрямую соответствует глубине исходного материала, может быть совершенно произвольной.

Ответ предоставлен Gemini Deep Research.
Тип исследовательской работы, которую можно превратить в подкасты. Надим Сарвар / Digital Trends

Например, когда я скормил ему 260-страничную книгу на тему спряжения и морфологии глаголов персидского языка, аудиообзор, созданный Gemini, длился чуть более семи минут. Качественно он охватывал самые важные части, но упускал из виду более мелкие детали.

В другом случае я превратил четырехстраничный документ Deep Research в аудиоподкаст. Продолжительность этого ролика составила около 13 минут. К сожалению, чип автоматической задачи Gemini не позволит вам регулировать длину или глубину разговора в аудиообзоре.

Если вы используете Google NotebookLM, где впервые появилась функция аудиообзора, вы можете написать подсказку, которая будет определять, насколько глубоким будет разговор подкаста. Несколько недель назад я создал аудиоподкаст со средой выполнения 59 на NotebookLM.

Близнецы не позволят вам этого сделать. Еще нет.

Первый этап обработки PDF-файла Gemini в приложении «Файлы от Google».
Автоматическое распознавание документов Gemini в приложении «Файлы». Надим Сарвар / Digital Trends

Кроме того, у нас есть языковой барьер, поскольку Google в настоящее время находится в процессе тонкой настройки всего процесса разработки за пределы английского языка. Еще одной проблемой было англизированное произношение. Например, ведущий подкаста AI неправильно произнес персидский мир «Раф-Тин» как «Рааф-Тин».

Для неподготовленного уха, не знакомого с двуязычными нюансами англо-персидского перевода или с тем, как акценты меняют слуховое восприятие слов на другом языке, ведущие подкастов с искусственным интеллектом вполне могут извергать полную тарабарщину.

Подводя итог моему опыту, можно сказать, что обзоры Gemini Audio не являются революцией. Они просто предлагают другую, более увлекательную среду для взаимодействия с контентом. Это не работает постоянно, но определенно избавляет от скуки чтения страниц текста, которые в противном случае усыпили бы вас.