Почему все продукты искусственного интеллекта, от Дубао до Кими, содержат плагины для браузера?
Мой браузер уже окружен различными плагинами AI.
Они не только занимают панель инструментов в правом верхнем углу, но и собираются в плавающем окне в правом нижнем углу, заставляя минималистов нервничать.
Со времен Войны Сотни Модельей главным противоречием зрелого работника стало противоречие между хорошей необходимостью повышения производительности и сложностью выбора ИИ-помощника.
С этой точки зрения необходимо найти другой способ изготовления плагинов. Продолжительность времени, в течение которого я его использую, на самом деле зависит от того, какой ИИ возьмет на себя инициативу прийти ко мне.
Более легкие функции, более широкое общение
Текущие плагины браузера AI можно условно разделить на три категории.
Одна категория — сопутствующие товары, основанные на собственных больших моделях.
8 июля умный помощник Кими запустил плагин для браузера, и мы как можно скорее написали опытную статью . Раньше плагин «Kimi Copilot» делали и сторонние разработчики, но на этот раз он был официально реализован лично.
Зачем запускать плагин? Дело в том, что мы не можем сделать все на основном сайте Кими с полноэкранным диалогом, но плагин позволяет использовать функции ИИ в любое время на любой веб-странице.
Представьте, что, просматривая новостной сайт, чтобы прочитать статью, мы не понимаем терминологию и не узнаем имена людей. При написании онлайн-документа мы не уверены в определенном вопросе, но не хотим. прервать текущее состояние и переключиться на другие страницы для поиска.
В это время плагин Kimi может мгновенно осуществлять поиск, отвечать на вопросы и обобщать полный текст… Несмотря ни на что, плагин также играет роль в привлечении трафика, позволяя перейти на основной сайт Kimi с помощью один клик.
То же самое видит герой и конкурент Кими, Дубао, который раньше запустил плагины. Он может все, что может Кими. В разных сценариях чтения и создания функции плагина Doubao немного отличаются.
Выберите отрывок на веб-странице, и плагин Doubao поддерживает поиск с помощью искусственного интеллекта, объяснения, вопросы, перевод и т. д.
Когда вы открываете онлайн-документ и выделяете абзац, помимо вышеперечисленных функций плагин Doubao также поддерживает коррекцию грамматики и настройку тона.
Что я считаю наиболее практичным, так это две дополнительные функции Дубао, которые опережают функции Кими.
Одним из них является сводка видео, интеллектуальная карта, сортировка по временной шкале и функции перехода, которые применимы как к YouTube, так и к Bilibili. Плагин Kimi пока не может суммировать видеоконтент.
Также имеется функция сбора. Если вы найдете интересные моменты, обновления Weibo или увидите полезный абзац в статье, вы можете сохранить его на главном веб-сайте Doubao одним щелчком мыши и прикрепить исходный URL-адрес для удобного просмотра позже. Чтобы создавать продукты, вам все равно придется смотреть на байты.
Вторая категория AI-плагинов для браузеров — это продукты-«оболочки», основанные на существующих моделях, представителем которых является Моника.
Это плагин, основанный на крупных моделях, таких как GPT-4o и Claude 3.5, и поддерживающий такие поисковые системы, как Google и Bing.
Мы можем поговорить с ним и позволить ему искать, писать, переводить и интерпретировать выбранный текст, обобщать PDF-файлы, веб-страницы, электронные письма, видео на YouTube…
Короче говоря, универсальный ИИ-помощник, который может общаться, искать, переводить и обобщать, соединяет ряд продуктов ИИ с подключаемыми модулями и обеспечивает работу «все в одном».
Однако по сравнению с бесплатными плагинами Kimi и Doubao у Monica есть ограничения по квоте, и для разблокировки большего количества функций требуется подписка. В лучшем случае это дешевле, чем подписка на несколько продуктов ИИ по отдельности.
Существует также тип плагина для браузера с искусственным интеллектом, который внедряется в вертикальную дорожку и отвечает потребностям маленьких и красивых. С точки зрения наших технологических редакторов, есть два наиболее часто используемых.
Первый — это Tongyi Listening, который осуществляет преобразование речи в текст на различных веб-страницах и поддерживает двуязычные субтитры в реальном времени. После записи вы можете суммировать контент и извлекать ключевые моменты, что очень удобно для просмотра пресс-конференций.
Второй — иммерсивный перевод, реализующий двуязычный перевод различных веб-страниц, видео и даже PDF-файлов. В отличие от Google Translate, который охватывает исходный текст, серфинг становится лучше и удобнее проверять информацию.
В то же время Immersive Translation запустил функцию экспертного перевода для различных сценариев, таких как игровые веб-сайты и социальные сети, — по сути, это серия тщательно разработанных слов-подсказок. Нам не нужно копировать текст в ChatGPT, мы пишем свои собственные слова-подсказки и позволяем ИИ перевести его для нас в определенном тоне и индивидуальности.
Команда Kimi утверждает, что плагин Kimi похож на «облегченный поиск», который помогает решать небольшие проблемы фрагментации. Это предложение также применимо к плагинам браузера других продуктов искусственного интеллекта. Плагины — это легкая попытка реализовать ИИ.
Независимо от того, читаете ли вы, пишете или смотрите видео, какую бы веб-страницу вы ни открыли, одна или несколько из них могут играть вспомогательную роль в умственной деятельности человека, компенсируя неудобные детали и недостатки предыдущего опыта работы в Интернете.
Плагины со слишком сильным ощущением присутствия иногда могут отвлекать.
Однако, как и в случае прошлогоднего поиска больших моделей и ИИ в первой половине этого года, конкуренция между плагинами также ожесточена, есть дублирующиеся функции и даже начались драки.
После добавления на панель инструментов плагины искусственного интеллекта, как правило, имеют высокую отслеживаемость и надеются показать свое присутствие пользователям.
Они всегда у вас под рукой, и их можно вызывать с помощью сочетаний клавиш. Они появляются в виде плавающих кнопок в углу экрана и в виде боковых панелей в правой части веб-страниц. Они также быстро выскакивают, когда вы выбираете предложение и хотите его предоставить. вы с услугами.
▲ Выберите предложение, и появятся Моника, Дубао и Кими.
Однако они также могут задерживаться. Будет ли Кими отображать плавающую кнопку и будет ли кнопка всплывать после выбора текста, не является обязательным. Дубао и Моника также поддерживают скрытие кнопок.
Плагин искусственного интеллекта общего назначения, ориентированный на производительность, имеет большие и комплексные функции и в основном отвечает следующим потребностям: подчеркивание объяснений, помощь в создании, краткое изложение контента…
Основные потребности пользователей в работе в Интернете могут быть только этими немногими. Если они одновременно удовлетворяются несколькими плагинами AI, вам будет сложно сделать выбор. Среди них Дубао и Моника, скорее всего, пересекутся.
Посмотрите видеоролики на YouTube, Дубао и Моника помогут вам подвести итоги и указать сроки.
При использовании Google для традиционного поиска Дубао и Моника будут отвечать на вопросы в правой части страницы результатов. Например, если вы введете в Google запрос «Знакомство с Дубао», Дубао представится, а Моника представит деликатес под названием Дубао.
Однако у Doubao есть еще одна функция, чем у Моники: если вы выделите ссылку мышкой, но не щелкнете по ней, Doubao также суммирует для вас контент, а затем вы сможете открыть ссылку, чтобы просмотреть подробности.
Что касается вспомогательного создания, то оно еще более преувеличено практически в любом поле ввода, включая ChatGPT, Weibo и Douban, появится «фиолетовая точка» Моники.
Нажав на него, вы увидите «Помощник по написанию». ИИ спросит вас, нужно ли вам что-то написать, будь то сопроводительное письмо или электронное письмо. После того, как контент будет сгенерирован, вы сможете напрямую вставить его в него. поле ввода.
Аналогично, в Doubao также есть функция «Напиши мне». Введите тему и помогите вам сгенерировать копирайтинг в стилях Xiaohongshu, Douyin и т. д., а затем вставить его в поле ввода одним щелчком мыши.
Древние говорили, что везде, где есть место, где можно напиться из колодца, можно спеть Лю Ци. Теперь у этого предложения может быть интернет-версия: любое пустое место, где нужно создать копирайтинг, можно оставить для шедевра, созданного ИИ.
Но, возможно, мы просто хотим сами написать жалобу или пообщаться в ChatGPT. В данный момент значок кажется немного навязчивым и его нужно закрыть вручную.
Эти высокопроизводительные плагины чем-то напоминают талисман Microsoft «Big Eye Clip», который использовался для обучения новых пользователей использованию Office примерно в 2000 году. В то время, когда вы создавали новый документ или набирали «Дорогой», чтобы написать письмо, папка с большим глазом внезапно появлялась без каких-либо объяснений.
Проблема с большими зажимами для глаз в том, что они могут только помочь. Они потеряли работу после запуска Office XP. Microsoft считает, что сам продукт прост и удобен в использовании.
Проблема с плагинами в том, что они полезны, но их функции схожи. Если они не являются строго необходимыми, они иногда могут показаться «навязчивыми».
Как и раньше, я спросил коллегу, может ли он порекомендовать полезный плагин для перевода YouTube. Ответить на данный момент он не смог, так как подобных плагинов было слишком много, и он бы их забыл, если бы не закрепил их на панели инструментов.
ИИ стал входом к информации, а браузеры доступны везде, где вы не знаете, как нажать.
Уже существует множество производных плагинов для продуктов ИИ. В то же время существуют и сторонние плагины, которые обслуживают продукты ИИ.
Одним из них является плагин Google AI Home Tab. Функция очень простая, но концепция очень интересная.
Он может установить ваш любимый основной веб-сайт AI в качестве домашней страницы браузера, а также вы можете изменить его обратно на домашнюю страницу по умолчанию.
Основная функция этого плагина — незаметно изменить наши онлайн-привычки.
Чтобы стать поисковой системой Safari по умолчанию, Google каждый год платит Apple огромную сумму. Видно, что «по умолчанию» играет такую же важную роль в развитии привычек пользователей, как и гравитация.
Если наш информационный портал напрямую станет различными инструментами поиска ИИ, возможно, мы будем все больше и больше привыкать и научимся общаться с ИИ через окно поиска для получения ответов вместо того, чтобы вводить URL-адрес в Google для поиска поиска ИИ.
Однако опасаться иллюзии искусственного интеллекта все равно нужно, и для этой цели был создан плагин под названием SeekAll.
Это многоэкранный браузерный помощник, который поддерживает открытие нескольких поисковых систем одним щелчком мыши и сравнение результатов поиска. Он поддерживает как поиск AI, так и традиционный поиск. В настоящее время он поддерживает до трех поисков одновременно.
Благодаря большему количеству плагинов и большему количеству прямых входов в будущем наш онлайн-опыт действительно может стать «никуда не нажимать».
Что означает этот технический термин? Как оптимизировать предложения в этом документе? Можно ли преобразовать субтитры YouTube в текст? Вы можете подождать, пока ИИ выскочит и поможет вам ответить. Плагин Beanbag может даже суммировать недавний подкаст Little Universe.
И наоборот, с точки зрения стартапа, занимающегося искусственным интеллектом, разработка плагинов — это все равно, что переходить реку, нащупывая камни. Хотя продукты искусственного интеллекта появляются бесконечно, они по-прежнему ищут более сегментированные сценарии, накапливают больше пользовательских данных и обучают более мощные модели.
Браузеры являются для нас важным инструментом для работы в Интернете. Чтобы выяснить, какие высокочастотные потребности пользователей могут быть удовлетворены с помощью ИИ, подключаемые модули браузера, которые можно гибко интегрировать в веб-страницы, могут стать идеальной формой тестирования.
Не устанавливайте сначала границы, а затем увидите больше возможностей.
В будущем нет четкого определения того, как будет выглядеть пользовательский интерфейс при серфинге в Интернете и как мы будем взаимодействовать с ИИ. Но небольшие шаги и быстрые итерации плагинов приближают нас к браузеру на базе AIGC.
# Добро пожаловать на официальную общедоступную учетную запись WeChat aifaner: aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.
Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo