GPTZero: как использовать инструмент обнаружения ChatGPT

С точки зрения технологий, меняющих мир, ChatGPT действительно оказал огромное влияние на то, как люди думают о написании и программировании, за то короткое время, что он был доступен. Возможность подключить подсказку и получить поток почти достаточно хорошего текста — заманчивое предложение для многих людей, которые не уверены в своих навыках письма или хотят сэкономить время. Однако у этой возможности есть существенный недостаток, особенно в сфере образования, где у студентов возникает соблазн использовать ChatGPT для своих работ или экзаменов . Это мешает им учиться как можно большему, что доставляет учителям совершенно новую головную боль, когда дело доходит до выявления использования ИИ.

Учителя и другие пользователи сейчас ищут способы обнаружить использование ChatGPT в работе учащихся, и многие обращаются к таким инструментам, как GPTZero, инструменту обнаружения ChatGPT, созданному студентом Принстонского университета Эдвардом Тианом. Программное обеспечение доступно каждому, поэтому, если вы хотите опробовать его и оценить вероятность того, что определенный фрагмент текста был написан с использованием ChatGPT, вот как вы можете это сделать.

Что такое GPTZero?

Рендеринг MidJourney: студент и его друг-робот перед доской.
Изображение использовано с разрешения правообладателя

GPTZero — это веб-приложение и сервис, предназначенные для определения того, был ли текст написан человеком или искусственным интеллектом . Тиан, 22-летний студент, изучающий информатику в Принстонском университете и бывший стажер по разработке программного обеспечения в Microsoft, является разработчиком GPTZero.

Впервые о GPTZero было объявлено в твите Тиана 2 января 2023 года как об инструменте, помогающем обнаруживать плагиат ИИ. Тиан отметил, что анализ основан на исследованиях доктора философии из Принстона. кандидат Сриджан Кумар и работа Принстонской группы обработки естественного языка.

GPTZero бесплатен?

GPTZero был разработан для преподавателей, но каждый может использовать его бесплатно. Вряд ли так будет всегда. В условиях обслуживания упоминается, что за некоторые услуги может взиматься плата . Также упоминается 30-дневная бесплатная пробная версия для новых пользователей, которые зарегистрируются.

В условиях обслуживания GPTZero упоминаются комиссии.
Изображение использовано с разрешения правообладателя

GPTZero не является проектом с открытым исходным кодом, и Тиану пришлось бы столкнуться с высокой платой за хостинг, если бы не помощь Streamlit, платформы приложений Python с бесплатным облачным сервисом для приложений Streamlit. Хотя трафик GPTZero составляет лишь малую часть того, что получает ChatGPT, даже OpenAI решила начать взимать плату , чтобы компенсировать свои затраты.

Хотя хостинг Streamlit бесплатен, это обычно ограничивает пропускную способность и ресурсы на этой общей платформе. Это ограничило бы использование такого популярного приложения, как GPTZero.

Streamlit в настоящее время помогает Тиану, увеличивая объем памяти приложения и размер хостинга GPTZero. Если он продолжит расти быстрыми темпами, ситуация может измениться.

Является ли GPTZero точным?

Были утверждения, что GPTZero можно обмануть. По предложению пользователя Reddit Smellz_Of_Elderberry я попросил ChatGPT написать краткий рассказ о книге «Старик и море», как если бы это был ученик старшей школы. GPTZero не обманул.

ChatGPT пишет так, как будто это старшеклассник
Изображение использовано с разрешения правообладателя

Я попробовал еще раз, изменив текст, добавив в него неправильную пунктуацию, неправильное время глагола и другие небольшие ошибки, но GPTZero все равно заявил: «Ваш текст, скорее всего, будет полностью написан искусственным интеллектом».

Ключевое слово здесь «вероятно», и разработчик никогда не обещал, что GPTZero идеален. Точность GPTZero все еще оценивается, но, как ни странно, для большинства людей он работает хорошо.

Если вы используете GPTZero, важно помнить, что возможны ошибки. При использовании GPTZero для обнаружения AI или ChatGPT для помощи в написании документа все равно нужно проверять работу на наличие ошибок .

Как работает GPTZero?

Оценка текста AI в GTPZero включает статистику запутанности и взрывоопасности.
Изображение использовано с разрешения правообладателя

GPTZero анализирует случайность текста, известную как «недоумение», и однородность этой случайности внутри текста, которая в статистике называется «взрывностью». ИИ очень последователен в своей запутанности и взрывоопасности, в то время как люди-писатели изменяют эти характеристики без всякого ведома.

Работа еще не завершена, и Тиан отмечает, что будут добавлены дополнительные тесты для повышения точности обнаружения текста ИИ. В частности, неявная предвзятость — это область, которая исследуется как еще один способ определить, создан ли текст искусственным интеллектом.

Как я могу использовать GPTZero?

GPTZero доступен на веб-сайте или через интерфейс прикладного программирования (API). Чтобы использовать веб-сайт, просто скопируйте текст, который вы хотите проверить, и вставьте его в большое поле с надписью «Попробуйте» .

Веб-сайт GPTZero довольно прост и состоит из текстового поля и кнопки отправки.
Изображение использовано с разрешения правообладателя

Также можно загрузить документ PDF, Word или текстовый файл и нажать кнопку «Получить результаты» . Вам также необходимо будет установить флажок, означающий, что вы согласны с условиями обслуживания.

Почему мое письмо помечается как ИИ?

Наряду с появлением ChatGPT и появлением инструментов обнаружения искусственного интеллекта, теперь и писатели, и читатели начинают беспокоиться о том, как определить, создан ли контент искусственным интеллектом и помечается ли подлинный текст как исходящий от искусственного интеллекта. Это особенно проблема для студентов, которые могут столкнуться с последствиями со стороны своих школ или университетов, если будет обнаружено, что они используют ИИ. Некоторые студенты теперь привычно прогоняют свои собственные оригинальные работы через детекторы, такие как GPTZero, и обнаруживают, что они помечают предложения как написанные ИИ, даже если это не так.

В 2024 году писатель The Atlantic Ян Богост описал свою собственную оригинальную работу с помощью программного обеспечения для обнаружения плагиата и обнаружил, что первоначально ошеломляющие 74% его работ были помечены как плагиат. Благодаря тщательной проверке и исключению ему удалось свести это число к нулю, но для этого ему потребовалось несколько часов проверки и корректировки настроек.

Обнаружение ИИ похоже на обнаружение плагиата, поскольку оба могут отражать только лучшие предположения о том, является ли произведение оригинальным и созданным человеком или нет. И эти инструменты требуют тщательного изучения, поскольку оба могут давать ложные срабатывания . Если вы обнаружите, что ваша работа помечается как созданная искусственным интеллектом на GPTZero, хотя это не так, то это может быть по самым широким причинам, например, вы не являетесь носителем английского языка, слишком повторяетесь в своих идеях или используете такой инструмент, как Grammarly.

Если ваша работа помечена как AI, дважды проверьте, правильно ли отформатированы все ваши цитаты и цитаты, и постарайтесь избегать использования автоматических инструментов, таких как Grammarly, для внесения изменений.

Действительно ли нам нужны проверки на плагиат?

Выйдя далеко за рамки исследовательской лаборатории, с которой были связаны многие ИИ, генерирующие текст, OpenAI выпустила ChatGPT для широкой публики в конце ноября 2022 года . К январю 2023 года у ChatGPT было более 100 миллионов пользователей, что сделало его самым быстрорастущим общедоступным приложением.

Это означает, что любые опасения по поводу плагиата будут только возрастать, поскольку помощь ИИ станет доступной во всех уголках жизни. Microsoft внедряет технологию OpenAI в поиск Bing, а Google тестирует свою собственную версию, известную как Gemini (ранее Bard) .

Цветное изображение смеющегося робота, созданное Dall-E.
Изображение использовано с разрешения правообладателя

Кстати, генераторы изображений искусственного интеллекта, такие как Dall-E и Stable Diffusion, находятся под пристальным вниманием на предмет потенциальных нарушений авторских прав. Все эти службы искусственного интеллекта прошли обучение по написанию, фотографиям и произведениям искусства, найденным в Интернете и созданным миллиардами людей.

В каком-то смысле ИИ заимствует у человеческого интеллекта, а не творит самостоятельно. Если я занимаю деньги у другого человека, я должен дать кредит и, возможно, заплатить лицензионный сбор. При использовании генеративного ИИ становится сложнее цитировать источник, поскольку каждый текст или изображение разбивается на разрозненные элементы, а затем снова собирается для создания нового фрагмента с использованием тысяч или миллионов источников.

Нам нужно либо переосмыслить свое отношение к авторскому праву и плагиату, либо найти инструменты, которые помогут идентифицировать материалы, созданные ИИ, и, возможно, разработать метод признания заслуг огромного числа людей, которые вносят свой вклад в каждую работу, созданную ИИ.