Как Антиплагиат распознаёт нейросеть
Принцип работы ИИ-детекторов и способы обхода проверок при использовании сгенерированного текста в академических и научных работах.
Содержание:
- Насколько сгенерированный текст виден при проверке
- Как программы Антиплагиата распознают ИИ: механизмы и алгоритмы проверки
- Как сделать так, чтобы Антиплагиат не видел ИИ-текст
О том, что рефераты, эссе, курсовые и даже дипломные проекты можно сгенерировать за несколько часов знают и студенты, и преподаватели. Однако вместе с новыми ИИ-помощниками появляются системы, которые обучены отличать машинный текст от написанного человеком, что создаёт дополнительные сложности для студентов, которые используют нейросети на постоянной основе. В материале рассмотрим механизмы работы ИИ-детекторов, узнаем, как Антиплагиат понимает, что текст сгенерирован ИИ, и какие правки внести, чтобы «очеловечить» материал.
Насколько сгенерированный текст виден при проверке
Нейросети помогают учиться и экономят время: ИИ можно использовать для создания черновиков или планов работы, поиска идей и новых подходов к избитым темам. Главное – воспринимать нейросеть как инструмент, а не готовое решение, потому что ИИ-текст, сгенерированный на скорую руку без вычитки и правок, будет бросаться в глаза из-за типичных словесных конструкций, но чаще всего, если содержание академической работы устраивает преподавателя, материал не отправляется на переработку. Однако с ростом популярности нейросетей учащаются случаи неэтичного использования ИИ при написании научных и академических работ, что грозит снижением качества образования в стране. В 2023-м году появилась возможность выявлять машинный текст благодаря обновлению сервиса «Антиплагиат» (популярной системы выявления плагиата в белорусских вузах и колледжах). Программа обозначает сгенерированные фрагменты так: делит текст на части и выявляет признаки ИИ с помощью алгоритмов, разработанных на основе исследований по обработке естественного языка. «Подозрительные» участки выделяются красным цветом, однако окончательное решение о том, является ли текст результатом работы нейросети, остаётся за человеком. Это связано с тем, что ИИ-детекторы могут давать ложные срабатывания, особенно если текст слишком формальный или шаблонный (хотя разработчики уверяют, что вероятность ошибок системы составляет не более 1 %).
Проверка на ИИ-контент платная и необязательная: строгого правила, по которому все академические работы должны проверяться на искусственную генерацию, пока не ввели. Чаще всего достаточно стандартной проверки на заимствования, которая выявляет совпадения с существующими материалами из открытых сайтов в интернете.
Чем новее версия нейросети, тем меньше вероятность, что сгенерированный текст будет обнаружен, особенно, если уделить время редактированию и доработке материала вручную: добавить уникальных мыслей, фактов и примеров.
Официального закона, который обязывает ссылаться на нейросеть, нет, однако ведутся дискуссии о том, чтобы авторы научных работ самостоятельно упоминали наличие ИИ-контента (название нейросети, промпт, полный диалог с чат-ботом и т. д.).
Как программы Антиплагиата распознают ИИ: механизмы и алгоритмы проверки
Антиплагиат работает в двух основных направлениях: ищет заимствования и анализирует стиль. Поиск заимствований сравнивает текст с базами данных в интернете, научными публикациями и другими источниками и, если обнаруживаются совпадения, система выдаёт процент плагиата. Однако сгенерированный текст не является плагиатом в классическом смысле, так как создаётся с нуля, а не копируется из интернета. Для выявления сгенерированных материалов используются ИИ-детекторы, которые анализируют лексику, стиль и структуру текста. Основные характеристики, по которым можно определить, как Антиплагиат понимает, что текст написан с помощью ИИ, включают:
- Предсказуемость структуры. Тексты, созданные нейросетями, выделяются типичными синтаксическими конструкциями (изобилием двоеточий с последующим пояснением материала) и оборотами (например, «не только, … но и», «не просто, … а»). Также ИИ-материалы отличаются чрезмерной конкретностью, потому что генерируются по шаблонам, предсказывают следующее слово в предложении и не умеют разбавлять материал абстрактными рассуждениями.
- Особенности лексики и стиля. ИИ-помощники «грешат» слишком сухим и формальным стилем, который обычно нехарактерен для студентов, используют общие фразы, клише и шаблонные выражения (алгоритмы проверки анализируют, как часто встречаются определенные слова и их комбинации), скупятся на жизнеспособные примеры и стирают в тексте фигуру автора (персонализированный стиль), делая работу безличной. Причина в том, что нейросети имитируют опыт миллионов людей, а не отражают личного взгляда автора.
- Сомнительную научную значимость. Сгенерированные тексты без ручного редактирования не могут похвастаться глубиной и экспертностью, так как не являются результатом реальных научных исследований автора: не отражают личные наблюдения и многочасовой анализ и кажутся поверхностными.
- «Эффект рыбки Дори». Такую отличительную особенность выявил исполнительный директор АО «Антиплагиат» Юрий Чехович в интервью Российскому союзу ректоров. «Эффект» проявляется в частых повторах сказанного или противоречащих друг другу выводах, из-за чего создаётся впечатление, что автор либо забыл о том, что уже писал, либо внезапно поменял точку зрения.
- Галлюцинации и выдуманные факты. Нейросети могут вводить недостоверную информацию или даже выдумывать факты, если у них недостаточно данных для освящения темы в полной мере и обнаружить грубое нарушение можно только в том случае, если автор работы напрямую укажет на ошибку.
Несмотря на продвинутые алгоритмы, детекторы иногда ошибочно принимают текст, написанный человеком, за сгенерированный. Это происходит, если материал слишком «пресный» или шаблонный, однако если ответственно подойти к ручному редактированию материалов, следы использования нейросетей можно скрыть.
Как сделать так, чтобы Антиплагиат не видел ИИ-текст
Перед началом работы важно понять, до какой степени нужно «маскировать» использование нейросетей. Для этого стоит обратиться к преподавателю или научному руководителю, чтобы узнать, через какие системы проверки будет проходить готовый материал: если планируется только поиск заимствований, достаточно проверить текст на основные ИИ-маркеры, если же сгенерированные материалы будут искать намеренно, придётся поработать с текстом тщательней и выделить бюджет на самостоятельные проверки, которые покажут, на что обратить внимание.
Чтобы обойти алгоритм распознавания, рекомендуется:
- Добавить «человечности». Перечитайте работу и обратите внимание на слабые места в тексте: преподаватель обязательно заметит сухие факты без анализа, шаблоны и смазанные выводы. Добавьте личное мнение, примеры и цитаты из работ реальных исследователей, убедитесь, что повествование ведётся естественным языком.
- Изменить структуру. Разбейте длинные абзацы на короткие, придерживайтесь научного стиля, обратите внимание на логические переходы между абзацами и разделами, отсутствие противоречий и общий тон текста.
- Перепроверить факты и поработать над промптом. Убедитесь, что каждая дата, фамилия и событие, упоминаемые в материале, – реальные. Также важно грамотно ставить задачи: нейросети не могут написать диплом или курсовую с нуля, получив в качестве ТЗ только тему работы. Чтобы сгенерировать качественный текст, нужно чётко формулировать запросы, указывать объём и самостоятельно ссылаться на источники, из которых необходимо брать информацию.
- Генерировать небольшие отрывки. У ИИ есть проблемы с логикой в больших текстах, поэтому лучше работать по частям и каждый раздел писать отдельно с подробным промптом и учётом рекомендаций научного руководителя.
Чем больше усилий вы приложите при переработке текста, тем меньше вероятность, что Антиплагиат распознает материал как сгенерированный. Если же на обход ИИ-проверки нет времени, с этим могут помочь специалисты Зачётки: отправляйте текст с ТЗ и в ближайшее время получите уникальную работу, которая пройдёт любые системы контроля.
Вопросы и ответы
Как Антиплагиат понимает, что текст сгенерирован нейросетью?
Системы Антиплагиата выявляют ИИ-тексты по следующим признакам:
- частым повторам смысла или противоречивым выводам;
- слишком формальному стилю и использованию шаблонных фраз;
- «галлюцинациям» – выдуманным фактам или недостоверной информации;
- предсказуемой структуре текста;
- отсутствию персонализации, при которой материал кажется безличным.
Как быть, если Антиплагиат распознаёт ИИ-текст и из-за этого работу не принимает преподаватель?
Если в уставе учебного заведения или правилах выполнения работ нет прямого запрета на использование нейросетей, то формальных оснований для отказа нет. Однако важно помнить, что сгенерированный текст должен быть качественно доработан и соответствовать требованиям задания. Если работа содержит ошибки, недостоверные факты или шаблонные формулировки, преподаватель может вернуть её на доработку, как некачественный материал.
Частые ошибки студентов: как Антиплагиат видит нейросеть?
Основные ошибки включают: использование сгенерированного текста без доработки, игнорирование фактов и логических противоречий, отсутствие персонализации материала. Также студенты часто не учитывают важность анализа и выводов, что делает текст поверхностным.
В чём опасность использования ИИ в научных и академических работах?
В пользовательских соглашениях чат-ботов, которые редко кто внимательно изучает, некоторые разработчики прописывают, что все материалы, созданные их системой, являются интеллектуальной собственностью компании. Это значит, что использование таких текстов в своих работах без разрешения может быть расценено как нарушение авторских прав владельца сервиса.