Perplexity AI получила очередную огромную сумму финансирования, но в то же время попала в «спор о плагиате».

28 июня, 2024 Дядя Влад

Согласно последнему отчету Bloomberg, Vision Fund № 2 группы SoftBank собирается инвестировать в американский стартап в области искусственного интеллекта Perplexity AI.

По словам людей, знакомых с ситуацией, сумма инвестиций SoftBank составляет от 10 до 20 миллионов долларов США, а общий объем финансирования Perplexity в этом раунде превысил 250 миллионов долларов США.

Ожидается, что раунд финансирования утроит оценку Perplexity до потенциально $2,5–3 млрд, что сделает ее одной из самых ценных компаний в отрасли.

Целью Perplexity является использование искусственного интеллекта для конкуренции с поиском Google.

Их основной услугой, как начинающей компании-единорога, является предоставление «системы ответов», которая фундаментально отличается от традиционных поисковых систем.

Вместо того, чтобы просматривать множество результатов в поисках основного источника вашего вопроса, пользователи напрямую получают ответ, который Perplexity находит для вас.

Аравинд Шринивас был научным сотрудником OpenAI. Покинув OpenAI, в августе 2022 года он основал Perplexity.

Perplexity хочет предоставить пользователям быстрые и точные ответы, не требуя от них просеивать горы информации.

Аравинд Шринивас также сказал в интервью The Verge:

Мы заботимся о подлинности и точности.

Интерфейс ответов Perplexity, как «первой в мире диалоговой системы ответов», очень понятен. На странице результатов вверху расположены источники информации, посередине — ответы, а внизу — дополнительные вопросы.

Его уникальная особенность заключается в том, что он сочетает вопросы и ответы в стиле ChatGPT со списком ссылок традиционных поисковых систем, создавая новые возможности поиска.

В более раннем интервью Wired Хуан сказал, что он «использует Perplexity».

Конечно, он также считает, что ChatGPT очень хорош. Во время интервью Хуан Жэньсюнь особенно интересовался областью компьютерного открытия лекарств. Он «почти каждый день использовал этих двоих» для исследований:

Возможно, вы хотите узнать о достижениях в области компьютерного открытия лекарств.
Затем вам нужно сначала построить структуру вокруг темы, а затем задавать более конкретные вопросы на основе этой структуры.

Хотя бизнес-модель Perplexity теоретически привлекательна, ее роль посредника может вызвать беспокойство у некоторых создателей контента.

Подобно Arc Search и Google Gemini, Perplexity предоставляет результаты ответов сразу после поиска вопроса.

Если вы это сделаете, это обязательно повлияет на трафик и доходы от рекламы на сайте с оригинальным контентом.

В традиционных поисковых системах, таких как Google и Baidu, большая часть информации автоматически сканируется сканерами, чтобы облегчить пользователям поиск по ключевым словам.

Сканер может быстро получить и систематизировать информацию веб-сайта, но он не будет бездумно сканировать весь контент. При обычном создании веб-сайта будет установлен файл протокола Robots (т. е. robots.txt).

С помощью этого файла веб-сайт может сообщать сканерам поисковых систем: какие веб-страницы можно сканировать, а какие нет. Это необязательное соглашение, которое в первую очередь зависит от соблюдения требований разработчиками сканеров.

Большинство поисковых систем и разработчиков сканеров будут соблюдать Соглашение о роботах и не будут сканировать контент, сканирование которого явно запрещено на веб-сайте. Это делается для уважения конфиденциальности и авторских прав веб-сайта, а также во избежание юридических проблем.

Если этот протокол не будет соблюден, сканер принудительно получит доступ к содержимому веб-сайта. Другим последствием этого является то, что некоторые системы платного доступа на веб-сайтах могут стать неэффективными.

Не так давно кто-то использовал Perplexity и попытался обобщить секретный проект Эрика Шмидта по созданию дронов.

Однако в результатах Perplexity видно, что несколько роликов взяты из эксклюзивных репортажей Forbes, а также приведена оригинальная иллюстрация, созданная Forbes.

Позже Forbes также активно пытался использовать Perplexity для генерации контента. Проанализировав темы нескольких статей, они обнаружили, что в ответах Perplexity часто появлялся собственный текстовый контент.

Среди них многие статьи представляют собой эксклюзивные репортажи с платным доступом. Perplexity обходит платный доступ Forbes и использует множество оригинальных изображений и текста без разрешения.

Более того, источник информации не указан в тексте ответа, данного Perplexity. Единственное указание — это несколько значков, которые ссылаются на эти носители, но они очень маленькие и их легко пропустить.

Помимо Forbes, в суд с Perplexity подает еще одно известное издание Wired.

Wired ранее написал статью о Perplexity, в которой также сообщалось, что Perplexity пытается использовать сканеры для сканирования заблокированного содержимого веб-сайтов.

Но затем произошло нечто странное: Perplexity «украл» эту статью у Wired – хотя статья была о ней самой, а Wired явно заблокировал доступ Perplexity к соответствующим документам на своем сайте.

Разработчик Wired Робб Найт изучил данные за кулисами.

После тщательного анализа Wired определил конкретный IP-адрес, который с высокой вероятностью был связан с Perplexity и не входил в диапазон общедоступных IP-адресов Perplexity.

Стремясь успокоить настроения на сайтах по созданию контента, коммерческий директор Perplexity Дмитрий Шевеленко заявил в интервью "Семафору", что Perplexity разрабатывает планы распределения доходов с издателями.

Подробности об этих партнерах Perplexity пока не раскрывает, но Дмитрий Шевеленко заявил, что объявит о своих планах как можно скорее.

Аравинд Шринивас также ответил на этот вопрос в интервью Fast Company:

Фактически, Perplexity не игнорирует файл robots.txt, он просто использует сторонний сканер, который его игнорирует.

Однако Аравинд Сринивас отказался назвать имя стороннего парсера и не пообещал попросить парсер прекратить нарушать файл robots.txt.

Если вы попытаетесь спросить Недоумение: «Как поисковая система с искусственным интеллектом, что вы думаете о цитировании статей других людей без разрешения?»

Он даст следующий ответ:

Похоже, что Perplexity сама знает, что это в определенной степени рискованно и незаконно.

Возьмем, к примеру, журналистику. Если бы вам пришлось написать новую статью, что бы вы сделали?
Вы бы сказали «по данным New York Times», то есть цитировали кого-то другого. Это именно то, что мы делаем.

Так сказал Дмитрий Шевеленко, генеральный директор Perplexity.

В любом случае, я все еще надеюсь, что Perplexity сможет продолжать создавать более инновационные инструменты искусственного интеллекта, соблюдая при этом правила.

# Добро пожаловать на официальную общедоступную учетную запись WeChat Aifaner: Aifaner (идентификатор WeChat: ifanr). Более интересный контент будет предоставлен вам как можно скорее.

Ай Фанер | Исходная ссылка · Посмотреть комментарии · Sina Weibo