GPTZero: как использовать инструмент обнаружения ChatGPT

10 августа, 2024 Дядя Влад

С точки зрения технологий, меняющих мир, ChatGPT действительно оказал огромное влияние на то, как люди думают о написании и программировании, за то короткое время, что он был доступен.

Однако у этой возможности есть существенный недостаток, особенно в сфере образования, где у студентов возникает соблазн использовать ChatGPT для своих работ или экзаменов . Этот вид плагиата мешает учащимся учиться как можно большему и создает у учителей совершенно новую головную боль: как обнаружить использование ИИ.

Учителя и другие пользователи сейчас ищут способы обнаружить использование ChatGPT в работе учащихся, и многие обращаются к таким инструментам, как GPTZero, инструменту обнаружения ChatGPT, созданному студентом Принстонского университета Эдвардом Тианом. Программное обеспечение доступно каждому, поэтому, если вы хотите опробовать его и оценить вероятность того, что определенный фрагмент текста был написан с использованием ChatGPT, вот как вы можете это сделать.

Что такое GPTZero?

Рендеринг MidJourney: студент и его друг-робот перед доской. — MidJourney

GPTZero — это веб-приложение и сервис, предназначенные для определения того, был ли текст написан человеком или искусственным интеллектом . В настоящее время система якобы может обнаруживать выходные данные различных крупных языковых моделей, включая ChatGPT, GPT-4 и Claude, а также то, что они были написаны человеком в сотрудничестве с ИИ.

Он был разработан и первоначально выпущен в январе 2023 года Эдвардом Тианом, 22-летним студентом, изучающим информатику в Принстонском университете и бывшим стажером в области разработки программного обеспечения в Microsoft. Анонсируя платформу на X (ранее Twitter), Тиан отметил, что анализ основан на исследовании доктора философии из Принстона. кандидат Сриджан Кумар и работа Принстонской группы обработки естественного языка.

анализ основан на текущих исследованиях с @sreejan_kumar и @princeton_nlp . надеюсь, мы скоро опубликуем что-нибудь эмпирическое. но в то же время это было забавное приложение
— Эдвард Тиан (@edward_the6) 3 января 2023 г.

GPTZero бесплатен?

GPTZero был разработан для преподавателей, но каждый может использовать его бесплатно. С бесплатной учетной записью вы можете сканировать 40 документов в час и получить доступ к панели управления GPTZero. План Essential стоимостью 10 долларов в месяц будет сканировать до 150 000 слов в месяц и предоставлять доступ к «премиальным» моделям обнаружения искусственного интеллекта, а также к «сканированию на плагиат» и обратной связи «Продвинутая грамматика и письмо». Премиум-пакет стоимостью 16 долларов в месяц увеличивает количество слов до 300 000 в месяц и предлагает «расширенное глубокое сканирование с использованием искусственного интеллекта» и многоязычное обнаружение искусственного интеллекта в дополнение к преимуществам уровня Pro. Подписка Professional высшего уровня стоимостью 16 долларов в месяц обеспечивает 500 000 слов в месяц, а еще 10 миллионов слов «избыточны». Это много воспринимаемого плагиата.

Является ли GPTZero точным?

Хотя GPTZero рекламирует свой сервис как высокоэффективный, некоторые пользователи считают точность сервиса «непостоянной, часто ошибочно маркируя написанный человеком текст как созданный искусственным интеллектом и борясь с определенными типами сгенерированного текста». По предложению пользователя Reddit Smellz_Of_Elderberry я попросил ChatGPT написать краткий рассказ о книге «Старик и море», как если бы это был ученик старшей школы. GPTZero не обманул.

ChatGPT пишет так, как будто это старшеклассник — Изображение использовано с разрешения правообладателя

Я попробовал еще раз, изменив текст, добавив в него неправильную пунктуацию, неправильное время глагола и другие небольшие ошибки, но GPTZero все равно заявил: «Ваш текст, скорее всего, будет полностью написан искусственным интеллектом».

Сканирование правильно угадало происхождение ИИ отрывка даже при использовании генераторов текста, отличных от Claude или GPT-4. Я попросил Gemini 1.5 Pro написать отдельный отчет о «Старике и море», но GPTZero уловил и это.

Точность GPTZero все еще оценивается, но, судя по этим неподтвержденным тестам, кажется, что он работает хорошо.

Если вы используете GPTZero, важно помнить, что возможны ошибки. При использовании GPTZero для обнаружения AI или ChatGPT для помощи в написании документа все равно нужно проверять работу на наличие ошибок .

Как работает GPTZero?

Оценка текста AI в GTPZero включает статистику запутанности и взрывоопасности. — Изображение использовано с разрешения правообладателя

GPTZero анализирует случайность текста, известную как «недоумение», и однородность этой случайности внутри текста, которая в статистике называется «взрывностью». ИИ очень последователен в своей запутанности и взрывоопасности, в то время как писатели-люди изменяют эти характеристики без всякого ведома.

Работа еще не завершена, и Тиан отмечает, что будут добавлены дополнительные тесты для повышения точности обнаружения текста ИИ. В частности, неявная предвзятость — это область, которая исследуется как еще один способ определить, создан ли текст искусственным интеллектом.

мы все еще изучаем неявную предвзятость в тексте, сгенерированном LM, поэтому, надеюсь, добавим еще несколько тестов и факторов для улучшения модели.
— Эдвард Тиан (@edward_the6) 3 января 2023 г.

Как я могу использовать GPTZero?

GPTZero доступен на его веб-сайте. Просто скопируйте текст, который хотите проверить, и вставьте его в большое поле с надписью « Попробуйте» .

Веб-сайт GPTZero довольно прост и состоит из текстового поля и кнопки отправки. — Изображение использовано с разрешения правообладателя

Также можно загрузить документ PDF, Word или текстовый файл и нажать кнопку «Получить результаты» . Вам также необходимо будет установить флажок, означающий, что вы согласны с условиями обслуживания.

Альтернативы GPTZero

GPTZero — не единственный детектор плагиата на базе искусственного интеллекта, представленный сегодня на рынке. OpenAI предлагает свой детектор вывода GPT-2 и, как сообщается, разработала обновленную версию , хотя нет информации о том, когда и будет ли она выпущена. Content at Scale AI Content Detection, ZeroGPT (не знаю, как это прошло мимо ведомства по товарным знакам), Writefull GPT Detector и Originality.ai — все они предлагают схожие услуги с разной степенью точности.

Почему мое письмо помечается как ИИ?

Наряду с появлением ChatGPT и появлением инструментов обнаружения искусственного интеллекта, теперь и писатели, и читатели начинают беспокоиться о том, как определить, создан ли контент искусственным интеллектом и помечается ли подлинный текст как исходящий от искусственного интеллекта. Это особенно проблема для студентов, которые могут столкнуться с последствиями со стороны своих школ или университетов, если будет обнаружено, что они используют ИИ. Некоторые студенты теперь привычно прогоняют свои собственные оригинальные работы через детекторы, такие как GPTZero, и обнаруживают, что они помечают предложения как написанные ИИ, даже если это не так.

В 2024 году писатель The Atlantic Ян Богост описал свою собственную оригинальную работу с помощью программного обеспечения для обнаружения плагиата и обнаружил, что первоначально ошеломляющие 74% его работ были помечены как плагиат. Благодаря тщательной проверке и исключению ему удалось свести это число к нулю, но для этого ему потребовалось несколько часов проверки и корректировки настроек.

Обнаружение ИИ похоже на обнаружение плагиата, поскольку оба могут отражать только лучшие предположения о том, является ли произведение оригинальным и созданным человеком или нет. И эти инструменты требуют тщательного изучения, поскольку оба могут давать ложные срабатывания . Если вы обнаружите, что ваша работа помечается на GPTZero как созданная искусственным интеллектом, хотя это не так, то это может быть по самым широким причинам, например, вы не являетесь носителем английского языка, слишком повторяетесь в своих идеях или используете такой инструмент, как Grammarly.

Если ваша работа помечена как AI, дважды проверьте, правильно ли отформатированы все ваши цитаты и цитаты, и постарайтесь избегать использования автоматических инструментов, таких как Grammarly, для внесения изменений.

И помните, это черный ящик GPTZero, запатентованный алгоритм, являющийся «коммерческой тайной», который утверждает, что ваше письмо статистически похоже на другие примеры, найденные во всем общедоступном Интернете. Компания не собирается объяснять в суде, как на самом деле работает ее продукт, или демонстрировать, что он работает точно. Так что, если вы окажетесь под угрозой из-за предполагаемого генеративного плагиата, это будет ваше слово против их слова. Привлеките адвоката и заставьте их доказать свою работу.

Действительно ли нам нужны проверки на плагиат?

Выйдя далеко за рамки исследовательской лаборатории, с которой были связаны многие ИИ, генерирующие текст, OpenAI выпустила ChatGPT для широкой публики в конце ноября 2022 года . К январю 2023 года у ChatGPT было более 100 миллионов пользователей, что сделало его самым быстрорастущим общедоступным приложением.

Это означает, что любые опасения по поводу плагиата будут только возрастать, поскольку помощь ИИ станет доступной во всех уголках жизни. Microsoft внедряет технологию OpenAI в поиск Bing, а Google тестирует свою собственную версию, известную как Gemini (ранее Bard) .

Цветное изображение смеющегося робота, созданное Dall-E. — Изображение использовано с разрешения правообладателя

Кстати, генераторы изображений искусственного интеллекта, такие как Dall-E и Stable Diffusion, находятся под пристальным вниманием на предмет потенциальных нарушений авторских прав. Все эти службы искусственного интеллекта прошли обучение по написанию, фотографиям и произведениям искусства, найденным в Интернете и созданным миллиардами людей.

В каком-то смысле ИИ заимствует у человеческого интеллекта, а не творит самостоятельно. Если я занимаю деньги у другого человека, я должен дать кредит и, возможно, заплатить лицензионный сбор. При использовании генеративного ИИ становится сложнее цитировать источник, поскольку каждый текст или изображение разбивается на разрозненные элементы, а затем снова собирается для создания нового фрагмента с использованием тысяч или миллионов источников.

Нам нужно либо переосмыслить свое отношение к авторскому праву и плагиату, либо найти инструменты, которые помогут идентифицировать материалы, созданные ИИ, и, возможно, разработать метод признания заслуг огромного числа людей, которые вносят свой вклад в каждую работу, созданную ИИ.