Я могу добиться цели одним словом. Эти 7 инструментов искусственного интеллекта стали для меня неотъемлемыми инструментами повышения производительности. ИИ полезен.


Голос — это среда, которая «мёд для одного человека и мышьяк для другого». Друзья, которых засыпали 60-секундными голосовыми сообщениями в WeChat, лучше всех знают, каково это.

Вы сказали, что голосовой вывод быстрый, но мне кажется, это звучит неудобно. Вам кажется, что голос более эмоционален, мне кажется, что текст более понятен. Позиции противоположные, и отношение к произношению тоже разное.

К счастью, искусственный интеллект, который уже изменил многие продукты, наконец-то оставил свой след в голосовых инструментах. Это может заставить вас подумать, что голос не так уж и раздражает.

Компания APPSO выбрала несколько инструментов преобразования речи в текст и поделилась конкретным опытом использования на основе 4 различных сценариев. Чистых рекомендаций не существует, и в процессе есть ошибки и ошибки.

Помимо обработки голосов других людей, мы также можем использовать эти инструменты для записи идей, повышения эффективности и даже открытия двери в новый мир в ранее неожиданных сценариях.

Если вы считаете, что есть какие-то полезные продукты, поделитесь ими в комментариях!

Вдохновляющие произведения, которые поразят ваше воображение

——Шуаньняньская ракушка, Голосовые заметки

Хотя прослушивание речи делает людей раздражительными, вывод речи происходит быстрее, чем ввод текста. Другими словами, голос — это менее трудоемкий способ уловить мимолетные мысли.

Но здесь есть проблема: информация, записанная в голосе, является грубой, неинтуитивной и неудобной для извлечения. После окончания разговора нам все равно приходится в ней разбираться.

Приложение «Shing Nian Shell» (пока доступно только в версии для iOS) учитывает болевые точки, существующие уже давно.

▲ Специально разработанный первый экран отдает дань уважения «Тысячелетнему соколу» из «Звездных войн».

Вам не нужно беспокоиться о паузах, разговорных выражениях или логической путанице: просто высказывайте свое мнение напрямую. Искусственный интеллект может автоматически систематизировать контент и добавлять теги для удобного управления и поиска.

После создания текста вы также можете использовать предустановленные слова-подсказки, чтобы одним щелчком мыши переписать контент в различных стилях, таких как списки дел и копирайтинг Xiaohongshu, или пообщаться с искусственным интеллектом, чтобы улучшить свои идеи.

Я диктовал распорядок дня редактора и просил разбить его на задачи. Когда я говорил, я говорил обо всем, что приходило мне в голову, но ИИ может организовать его по временной шкале.

Когда я вывел некоторые рецензии на романы и фильмы в более непринужденной манере и сравнил записи, я обнаружил, что ИИ помог мне опустить некоторые модальные частицы, такие как «ах» и «гм», а также будет использоваться бессмысленное «тогда». Удаление означает, что после повторного произнесения неверного слова правильная версия сохраняется.

После того, как ИИ завершит работу по уборке, мы сможем снова с ним пообщаться. Прочитав это, я чувствую, что лучше всего общаться с ИИ, который знает обо всем понемногу.

Однако в тексте, написанном ИИ, могут быть ошибки, которые ИИ может исправить или доработать вручную после нажатия на страницу.

Основные функции не остались без внимания. Shannian Shell сохраняет записи и текст одновременно, а также может экспортировать записи, что делает нам более удобным исправление ошибок.

Несколько прискорбно, что «баллы» бесплатного пользовательского опыта ограничены, а продолжительность записи не может превышать 1 минуты. Чтобы продолжать использовать, вам придется заплатить (19 юаней в месяц, 149 юаней в год, 198 юаней на всю жизнь). Функция AI без ограничения времени записи.

Voicenotes, зарубежное приложение для голосовых заметок, имеет схожее позиционирование и функции с Shannian Beike: сохранение записей, добавление тегов, ручное исправление ошибок транскрипции, стиль переписывания ИИ и передача идей с ИИ, но дизайн интерфейса более минималистичный.

▲ «Эксклюзивный музей слонов богача» на самом деле является «Музеем мадам Тюссо».

Голосовые заметки доступны в Китае. Язык приложения — английский. В настройках поддерживается изменение языка ввода и транслитерации на упрощенный китайский.

Аналогичным образом, Voicenotes требует подписки (68 юаней в месяц или 328 юаней пожизненно) для записи продолжительностью более 1 минуты и использования лучших больших моделей, таких как GPT-4o и Claude Opus.

Пожизненный секретарь, который дает инструкции в одном предложении

—— Майли

Помимо мозгового штурма и рабочих дел, в нашей жизни есть и более ежедневные, более легкие сценарии, состоящие из одного предложения. В настоящее время вы можете попробовать Miley AI, личную память, ориентированную на искусственный интеллект «запись + интеллект», доступную в настоящее время только. на iOS.

Он очень удобен для записи того, что вы съели, сколько потратили, внезапного вдохновения или того, что вам нужно делать дальше, чтобы держать день человеческого NPC в порядке, когда печатать неудобно.

Самое интересное, что Майли может разумно анализировать различные типы вопросов на основе введенного вами контента.

Когда вы упоминаете приятные вещи, ИИ может распознавать ваши эмоции и отмечать их соответствующими выражениями. Вы сообщаете мне, сколько вы потратили на обед, и ИИ будет отслеживать это за вас. Если вы боитесь упустить время заказать еду на вынос, ИИ может установить баннер-напоминание.

Даже если вы хотите установить небольшую ежедневную цель по физическим упражнениям, вы можете разрешить Apple использовать данные о состоянии здоровья, чтобы отслеживать, выполняется ли она каждый день. Например, если вы скажете ИИ проходить 2000 шагов каждый день, а прогулка по городу — 17 800 шагов по выходным, этот пункт можно проверить.

Просто говоря небрежно, у нас есть бухгалтерская книга, спортивные записи, напоминания…

В этом преимущество ИИ: теперь сортировка фрагментированного контента занимает не так много времени, как раньше. Даже ленивые люди вроде меня, которые не любят строить планы, готовы попробовать. мини-дневник формируется, и достижения будут чувствовать себя в сердце.

Однако для бесплатных пользователей квота на распознавание речи и анализ агентов ограничена, особенно на анализ агентов, который легко достичь вершины. В настоящее время требуется «денежная сила», которая составляет 28 юаней в месяц или 188 юаней за человека. год по подписке.

▲При слове «совещание по выбору темы» ИИ определяет, правильно оно или нет.

Что еще влияет на пользовательский опыт, так это то, что точность распознавания речи недостаточно высока. Хотя он поддерживает модификацию, это повлияет на первоначальную цель нашего использования — ИИ должен избавить от проблем, а не усложнять их.

Творческие инструменты, которые меняют привычки вывода

——Записка Мо Вэня

Когда дело доходит до творчества, мы представляем такую ​​сцену: сидим перед компьютером, печатаем на клавиатуре, и наши глаза почти приклеены к экрану…

Можно ли использовать более непринужденный и жизненный голос в более длинных произведениях? Если вы хотите узнать, можете ли вы говорить связно, вам стоит начать с «Записок Мо Вэня».

Mowen Notes — это апплет WeChat. Его голосовая функция AI поддерживает запись до 10 минут для каждой заметки. В настоящее время она бесплатна.

▲ Нажмите и удерживайте знак «+» внизу, чтобы вызвать голосовую функцию.

Один из дизайнов очень интересен. Mowen Notes поддерживает вывод в реальном времени. Вы можете видеть транскрибируемый текст во время разговора, а не только время записи.

Но эта функция также может быть помехой, которая мешает нашему результату. Хотя она постоянно исправляется, точность транскрибируемого текста необходимо повышать.

После завершения вывода нажмите кнопку «Стоп», и ИИ отполирует текст, в том числе сегментирует его, исправит опечатки, удалит слова, которые повторяются по причине ерунды и т. д. Однако ИИ не может исправить все ошибки, и мы также можем его модифицировать. вручную позже.

Наконец, мы составили заметку, сохраняющую голос, которая может быть видна только нам самим или публично.

Mowen Notes позиционирует себя как «инструмент для творчества». Когда вы открываете мини-программу, первое, что появляется, — это ее слоган: «Запись — это творчество».

Обычно я не чувствую ничего плохого, глядя на экран компьютера, но говорить по мобильному телефону в течение 10 минут все еще довольно сложно. Мало того, что у меня пересыхает рот, я также чувствую бессилие после долгого поиска. не имея ничего сказать.

Небольшие программы, которые обеспечивают легкий опыт, действительно могут сделать мышление привычкой.

Помощник по повышению эффективности обработки сложных голосовых сообщений

—— Фейшу Мяодзи, iFlytek Listening, Tongyi Listening and Proceating

Большинство из приведенных выше голосовых сценариев не являются обязательными требованиями и могут быть воспроизведены в игровой форме.

Когда мне нужно использовать голос на работе, я предпочитаю Фейшу Мяодзи. По крайней мере, привыкните к этому: «Продвинутые команды, сначала используйте Feishu», корпоративный аккаунт действительно хорош.

В течение десятков минут или даже часов автономных пресс-конференций и интервью я брал свой мобильный телефон и использовал «Feishu Miaoji» в приложении Feishu для записи звука, затем обрабатывал звук на веб-странице Feishu и экспортировал его с метками времени. . письменные записи.

Таким образом, если возникнут проблемы с записью текста, вы сможете точно определить соответствующее положение звука и исправить его во время прослушивания.

Feishu Miaoji также поддерживает загрузку локальных аудио- и видеофайлов. Если подключение к Интернету плохое, вы можете использовать для записи инструмент записи, который поставляется с вашим мобильным телефоном, а затем позволить Feishu Miaoji обработать его. Чем больше базовых потребностей решено, тем более плавным будет пользовательский опыт.

До Feishu я часто пользовался iFlytek. В Feishu также есть такие функции, как импорт аудио, распознавание динамиков, воспроизведение с двойной скоростью и поиск по ключевым словам.

Однако, хотя запись iFlytek бесплатна, основная услуга взимается: чтобы преобразовать аудио в текст и экспортировать его, вам необходимо приобрести пакет транскрипции записи (непрерывная ежемесячная подписка на 18 юаней) или пользоваться пакетом (непрерывная ежемесячная подписка на 79 юаней).

iFlytek теперь имеет бонусы ИИ и поддерживает предварительный просмотр глав и вопросы. Я попросил чат-бота «Сяо Ди» подвести итог 40-минутного интервью о «медитации». Ключевые моменты были достаточно систематизированы, что в некоторой степени помогло при написании статей. Но функция AI не бесплатна и включена в пакет транскрипции записи и пакет Enjoy.

Если Feishu Miaoji используется в автономном режиме и на мобильных телефонах, то Tongyi Tingwu завершает онлайн-сценарий.

У Tongyi Tingwu есть веб-страница, плагин для браузера и апплет WeChat, и он более «готов к использованию». Вы можете автоматически получать 10 часов транскрипции каждый день при входе в систему, что по сути эквивалентно бесплатному использованию. .

Tongyi Listening также поддерживает преобразование локального аудио и видео в текст, что позволяет различать говорящих и обеспечивать перевод, но я больше использую функцию преобразования речи в текст в реальном времени.

На веб-странице поделитесь вкладкой с Тонги Тинву. Когда мы проводим встречи, смотрим видео и следим за пресс-конференциями, у нас будет инструмент, который может записывать и предоставлять субтитры в режиме реального времени.

Если задействованы иностранные языки, Tongyi Listening также поддерживает двуязычные субтитры в реальном времени. Сначала выберите язык аудио и видео, затем выберите язык перевода, а затем включите запись в реальном времени.

▲ Вверху — понимание на слух Тонги, внизу — двуязычный перевод на основе субтитров CC.

Однако скорость перевода при прослушивании Тонги замедляется, и результаты перевода также будут меняться в зависимости от изменений в исходном тексте. Это нормально. Английские предложения длиннее и содержат много атрибутов. Значение можно узнать только после завершения предложения. Даже если есть субтитры, иногда всё равно путаешься.

▲ Tongyi Listening корректирует результаты перевода в режиме реального времени.

Таким образом, по моему реальному опыту, для субтитров в реальном времени Tongyi Listening работает лучше на китайских конференциях, чем на английских. Немного нестандартный китайский язык, такой как Lei Jun, очень подходит для Tongyi Listening.

После публикации Tongyi Listening может предоставить расшифрованный оригинальный текст, разумно резюмировать содержание и извлечь ключевые моменты, что очень подходит для написания материалов.

У iFLYTEK есть «Маленькая правда», а у Tongyi Listening — «Маленькое просветление». Вы можете задавать ему соответствующие вопросы на основе текстовых записей, щелкнуть временную метку в ответе, а также найти исходный контент.

Но старая проблема распознавания речи все еще возникает: произнесение неправильного имени. Кими стал «км», а секретная башня стала «медовой башней». Отличить и исправить ее предстоит пользователю.

Преобразуйте речь в текст и подождите, пока ИИ сделает это снова

Преобразование речи в текст в некоторой степени является необходимостью.

Мы можем использовать его для расшифровки сообщений чата, отслеживания интервью, встреч и пресс-конференций, а также для записи мозговых штурмов и фрагментов жизни.

По сути, эти новые продукты преобразования речи в текст, в которых больше внимания уделяется присутствию ИИ, на самом деле ориентированы на более интеллектуальную и глубокую обработку контента, включая транслитерацию и доработку текста, организацию контента по тегам и типам, поиск и расширение контента посредством диалогов. , и т. д. .

В то же время, желать лучшего еще предстоит.

  • Точность преобразования речи в текст все еще нуждается в повышении, а сохранение записей и поддержка ручного редактирования едва ли компенсируют эту проблему.
  • Функция креативная, но недостаточно совершенная и даже становится отвлекающим фактором, мешающим записи.
  • Порог взимания платы очень низок. После небольшого количества первых пользователей вам необходимо подписаться, но в этом нельзя винить разработчиков. Все хотят зарабатывать деньги самостоятельно.

Независимые разработчики конкурируют на пути преобразования речи в текст, но перспективы неясны.

Flash Capsule, выпущенная Smartisan Mobile в 2017 году, стала «Белым лунным светом» в сердцах многих людей.

Нажмите и удерживайте кнопку «Домой» или среднюю кнопку пульта дистанционного управления гарнитуры, чтобы начать голосовой ввод и записать свои мимолетные мысли. Текст и запись будут сохранены, и вы сможете снова редактировать текст.

Записанные «капсулы» можно перетаскивать в заметки, вставлять в поле ввода WeChat и превращать в списки дел…

Такие системные функции требуют меньше шагов для вызова и использования и больше соответствуют нашей интуиции. Только не усложняя записи, мы можем по-настоящему повысить эффективность.

Таким образом, несмотря на нынешний взрывной рост количества продуктов, последнее слово в будущем все равно останется за производителями операционных систем, используя атаки на консолидацию и уменьшение размерности на уровне системы, такие как Apple Intelligence.

Раньше я видел шутку о том, что основная операционная система в Китае — не iOS или Android, а WeChat.

В этом есть доля правды. Мой коллега, который занимается подкастером, привык записывать вдохновение в дороге. Он перепробовал множество инструментов преобразования голоса в текст и, наконец, остановился на простоте. Он отправил голос помощнику по передаче файлов. затем преобразовал его в текст.

Высококачественные ингредиенты часто требуют только самых простых способов приготовления. Поток идей сам по себе является самым ценным. Иногда нам не нужны никакие вспомогательные функции искусственного интеллекта. Мы просто хотим быстро записывать события. Самый распространенный способ достижения конечной цели одним щелчком мыши часто является наиболее эффективным методом.

Он остер, как осенний мороз, и может отвести злые бедствия. Рабочая электронная почта: [email protected]

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo