13 действенных способов как обойти антиплагиат и 3 причины этого не делать
Чтобы быть во всеоружии, недостаточно только читать наш телеграм-канал. Хотя информация там действительно полезная и поможет написать любую работу без труда. А если хотите экономить, заходите в группу.
Но что делать, если хочется не писать, а просто взять откуда-то готовую информацию и выдать ее за свою?
Сегодня каждый преподаватель использует интернет для поиска «злостных нарушителей» – тех, кто выполнял задание (реферат, контрольную, курсовую) не самостоятельно, а скачивал его из интернета. Чаще всего для повышения оригинальности текста используют программу «Антиплагиат вуз».
Что такое антиплагиат? Это краткий отчет, который позволяет быстро определить подлинность и покажет кусок заимствованного текста.
У многих вузов своя база учебных работ или они пользуются расширенной версией программы. Все это усложняет процесс подготовки работы.
Как же студенты пишут курсовые, дипломные, диссертации, если эти труды обычно на 70% состоят из заимствований (терминов, цитат, теорем, формул и т.д.)?
Давайте начистоту: если писать работу полностью самостоятельно, то и процент уникальности будет высоким. Но такой труд отнимает много времени и сил, поэтому студенты идут на хитрость и «копипастят».
Перечисленные ниже методы повышения уникальности текста лучше не использовать! Мы лишь приводим примеры, как с этой задачей справляются другие. Вам же настоятельно рекомендуем вручную перерабатывать всю информацию.
Актуальность и уникальность работы: как обойти антиплагиат?
Чем более популярна тема, тем сложнее написать уникальную работу. Большинство трудов состоит из уже написанного ранее: цитат, терминов, формул и т.д. Студент добавляет лишь собственную точку зрения и выводы, к которым пришел в ходе выполнения.
Можно выбрать современную и актуальную тематику работы. Но в таком случае часто непонятно, где брать качественную информацию для курсовой или реферата. Да и преподаватели не всегда успевают за стремительно развивающимся миром и не могут проверить правильность расчетов и результатов.
Со старыми и стандартными темами все как-то спокойнее. Найти нужный материал гораздо легче, но дотянуть его уникальность будет сложнее.
Есть еще одна причина, которая может превратить работу с антиплагиатом в настоящий кошмар: неадекватные или очень строгие требования преподавателя. Если при написании курсовой или диплома обычно хватает 70-80% уникальности текста, то иногда особо требовательные преподаватели могут повысить планку до 90%.
Но как тогда написать реферат или курсовую без плагиата? Мы провели тщательное расследование и спешим поделиться с вами своими результатами, как с этим справляются другие.
6 стадий уникализации текста
Перед тем как изучить эффективные способы антиплагиата и повысить оригинальность реферата или любой другой работы, предстоит выполнить простой алгоритм действий, чтобы избежать коварных ловушек преподавателя:
- Выбор сервиса проверки уникальности. Старайтесь выбрать популярный и максимально строгий сервис с обширным функционалом. В университете вашу работу будут проверять серьезными платными программами. И выбор заведомо мощного ресурса поможет избежать проблем с уникальностью. Особенно строгими среди студентов числятся следующие сервисы проверки текста на антиплагиат: ETXT, Advego Plagiatus, ресурсы Text.ru, Findcopy и Antiplagiat ру.
- Проверка уникальности. С помощью специальной программы или сервиса запустите проверку текста на уникальность. Интересно то, что разные программы/сервисы могут показывать разный процент уникальности текста (например, в программе Advego Plagiatus – 95%, а в ETXT – 60%). Хитрость в разных алгоритмах работы. Так, одни программы работают по методу шингла (определенного количества последовательных слов), другие – по оценке всего текста.
- Сохранение изначального варианта. Обязательно делайте резервную копию начального текста, даже если у него зафиксирован низкий процент уникальности. Так вы всегда можете вернуться к началу, если уже обработанный текст покажется перенасыщенным, бессмысленным и невосстанавливаемым.
- Выбор способа обхода антиплагиата. Сразу после создания резервной копии выберите оптимальный метод обхода системы проверки уникальности. Их будет много, и более предметно обсудим их далее в статье.
- Повышаем итоговую уникальность на 5-10% больше необходимого. Дело в том, что вузовские или любые другие платные программы, которыми может воспользоваться преподаватель, работают с продвинутыми инструментами. В итоге они почти всегда сильно занижают процент уникальности.
- Сохранение готового варианта. Как только работа сделана, несите ее на проверку! Самое время узнать, как вы справились с задачей.
Итак, мы определили примерную последовательность действий для повышения уникальности текста. Самое время рассмотреть действующие методики, как пройти антиплагиат диплома, курсовой, реферата или другой работы в 2022 году бесплатно. Советы собраны от опытных специалистов и прошаренных студентов из просторов всемирной паутины.
13 способов обойти систему антиплагиат и повысить оригинальность диплома/курсовой/реферата бесплатно
Остановимся на самых популярных и проверенных бесплатных способах обхода системы антиплагиат в 2022 году.
Глубокий рерайт
Самый честный и проверенный способ, как обхитрить систему и повысить оригинальность текста в антиплагиате самостоятельно – это написать то же самое, но своими словами. Это и есть глубокий рерайт. По крайней мере, отзывы об этом методе самые лучшие (даже у преподавателей). Да и обманом системы, если уж на то пошло, этот способ назвать нельзя.
Просто берете неуникальные куски текста, которые сервис считает плагиатом, и перерабатываете их, переписывая ту же мысль своими словами. Старайтесь опустить излишние детали, выделить тезисы и главные мысли.
Добавление синонимов и эпитетов
Часто используемые слова старайтесь заменить близкими по значению понятиями. При этом не обязательно должен меняться порядок слов в предложении.
Эпитеты также помогают преобразить исходный текст, делая его красочным и ярким. Но вот для сухого научного труда такой прием вряд ли подойдет.
Гораздо сложнее иметь дело с таблицами и формулами. Тут уж никакие эпитеты и синонимы не помогут.
Откроем секрет: вставляйте таблицы и формулы в работу картинками (делайте скриншоты, например).
Если этого не сделать, сервисы проверки будут расценивать информацию в таблицах как дубли с других ресурсов. А вот распознавать текст на картинке они еще не научились.
Синонимайзеры
Этот способ настоятельно не рекомендуется использовать для крупных кусков текста, потому что получится откровенная ерунда. А вот для подъема уникальности всего на пару процентов может быть достаточным.
Итак, находите на просторах всемирной паутины подходящую программку, вводите отрывок текста и получаете обработанный кусок, который и поднимет его уникальность на заветные несколько процентов!
Использование автоматических переносов
Этот способ поможет поднять оригинальность текста лишь в малой степени. Но это хороший прием, если нужно лишь «подмарафетить» курсовую или диплом.
Итак, в документе MS WORD выставляете автоматический перенос слов. Как это сделать, посмотрите на картинке ниже:
Как это поможет обойти программу « Антиплагиат вуз » ? Дело в том, что при копировании такого текста в другие сервисы часть слов как бы обрезается, что позволяет программе воспринимать их как уникальные.
Метод шингла
Шингл – это определенное количество слов в определенной последовательности в тексте. На основе метода шинглов работает большинство программ проверки уникальности.
Изменяя одно слово из этой цепочки, вы меняете процент оригинальности текста.
Помните, что каждое последующее слово может начинать новый шингл или быть частью предыдущего. Так образуются своеобразные цепочки из фраз.
Если программа показывает, что не уникален целый абзац, попробуйте изменять каждые 2-3 слова. Так вы поменяете практически все шинглы, существенно повысив уникальность.
Иногда для повышения оригинальности изменяют каждое первое и последнее слово шингла. Но это не всегда легко, так как неясно, где он начинается и заканчивается.
Перевод текста на другие языки и обратно
При переводе текста на другой язык изменяется его структура. А при обратном переводе с иностранного новая структура сохраняется. Кроме того, автоматические переводчики часто заменяют оригинальные слова текста синонимами.
В качестве достойной альтернативы постарайтесь найти источник информации на зарубежных сайтах, так как большинство антиплагиат-сервисов занимается поиском совпадений на русскоязычном пространстве.
Замена русских букв на греческие
Многие модернизированные системы проверки видят замены латинскими буквами и обходят их стороной. Хотя со старыми системами и этот фокус может получиться.
А вот до греческого языка «дошли» немногие. Некоторые умельцы заменяют отдельные буквы в русском тексте на аналогичные буквы греческого алфавита.
Изменение часто повторяющихся слов
В тексте могут часто встречаться одни и те же слова. Просто замените их синонимами, фразами, местоимениями и другими подходящими по смыслу словами. Так вы повысите оригинальность.
Изменение предложения с конца
Речь идет о сложносочиненных и сложноподчиненных предложениях. Достаточно грамотно поменять две части местами, как автоматически повышается и уникальность документа.
Проследите, чтобы не менялся смысл текста.
Использование слов-паразитов
Например, слово «непосредственно» можно использовать практически в любом предложении, так как оно обязательно подойдет по смыслу хоть к какому-то слову.
В словарном запасе активного читателя обязательно найдется с десяток таких слов, которые можно чередовать и использовать во всем тексте. Но не переборщите! Лишняя вода в тексте не сыграет на руку при проверке. Перегруженный словами текст доносит основную мысль менее эффективно. Если же мыслей нет, лейте воду.
Помощь со стороны
Если есть хороший знакомый, можно доверить ему доработать ваш текст. Пусть перескажет работу своими словами, а вы перепишете.
Кстати! Если знакомых нет, можно обратиться в специальный студенческий сервис, где за чисто символическую сумму повысят уникальность или вовсе создадут работу с нуля. К тому же, для всех наших читателей сейчас действует скидка 10% на любой вид работы.
Маленькая хитрость: если не хотите заморачиваться с повышением уникальности текста, а работу сдать надо, отнесите ее преподавателю не в электронном виде, а распечатанную. Вряд ли у него хватит терпения и сил на сканирование, распознавание текста и последующее исправление ошибок, чтобы выявить плагиат.
Хотите удивить его еще больше? Напишите работу от руки. Конечно, такой способ больше подойдет для подготовки реферата, а не такого объемного труда, как дипломная или курсовая работа. Иначе вы рискуете остаться без руки. Руководитель явно будет шокирован, но и придираться будет меньше. Даже если он уверен, что содержимое скопировано, студент хотя бы приложил усилия, чтобы прочитать, а потом еще и переписать текст. Значит, все же что-то в его голове отложилось.
Методы уникализации текста, которые не работают
Не используйте для повышения уникальности старые способы обхода антиплагиата, такие как:
- замена букв кириллицы латинскими буквами;
- вставка большого количества вводных слов, эпитетов;
- синонимайзинг крупного отрезка или всего текста.
Умные программы уже давно могут определить, где в тексте присутствует неуместная латинская буква. Это делается путем прогона информации через проверку орфографии.
Эпитеты и вводные слова не подходят для текстов узкоспециализированной и научной направленности.
Синонимайзинг больших отрезков текста – отличный способ и самому вдоволь насмеяться, и преподавателя рассмешить.
Не стоит использовать и следующие приемы:
- Перестановка членов предложения местами. Так программу не обманешь: разработчики уже давно настроили инструменты на поиск переставленных слов.
- Перестановка абзацев или предложений. То же самое работает по отношению изменения мест предложений и абзацев. Вспомните про шинглы, повторяющиеся последовательные слова и т.д. Программе важна не последовательность предложений, а их содержание.
- Склейка или разбивка предложений. Некоторые пытаются искусственно соединить отдельные предложения или разбить сложное предложение на простые. Говорим сразу: не пройдет!
- Изменение знаков препинания. Запятые, точки, тире, двоеточия – программе все равно, какие знаки препинания стоят в тексте. Она учитывает только слова.
- Изменение фона текста. Некоторые «умельцы» дополняют основной текст разной ерундой, которую потом просто закрашивают белым цветом (меняют цвет шрифта, поэтому текст не виден). Эта попытка сразу обречена на провал, так как при копировании и вставке всего текста в область для проверки на антиплагиате отображается весь текст, даже невидимый. И если преподаватель увидит эту хитрость, кому-то не поздоровится.
- Применение программ для повышения уникальности текста. В сети можно найти массу сервисов по изменению уникальности текста. Но скажем сразу: все они основаны на тех принципах, перечисленных в пункте «Методы уникализации текста, которые НЕ РАБОТАЮТ». И воспользовавшись их помощью, вы рискуете получить в своем тексте сразу все запрещенные приемы, которые непременно будут обнаружены.
3 причины, почему не стоит обманывать антиплагиат
Есть несколько причин, почему лучше действительно поработать над курсовой или дипломом, а не искать надежные способы, как можно обойти антиплагиат и поднять оригинальность текста самостоятельно:
- вы рискуете попасться и провалиться;
- вы рискуете попасться и быть отправленным на повторную доработку;
- вы рискуете попасть на устаревшую программу.
В первом случае преподаватель просто отправит восвояси и не захочет больше иметь с вами дело. Не у каждого хватит терпения и сил простить того, кто пытался обмануть программу антиплагиат и препода.
Во втором случае у преподавателя хватит сил и мудрости вас простить, но он отправит вас доделывать работу по-человечески. То есть фактически потеряете время, которое было потрачено на переработку текста и повышение уникальности. При этом все равно нужно будет пойти и выполнить то, чего вы так усердно пытались избежать. А испорченная репутация теперь будет преследовать всегда.
В третьем случае есть вероятность использовать допотопную версию программы, в то время как у преподавателя будет полный набор модернизированных инструментов для « поимки преступников » .
Помните: с каждым днем программы и сервисы становятся все умнее. То, что вы использовали неделю назад, сегодня уже может не прокатить.
Как проверить реферат/курсовую/дипломную на плагиат онлайн
Допустим, вы подготовили материал и хотите проверить работу на плагиат бесплатно, чтобы идти на проверку во всеоружии. Для начала узнайте, каким сервисом пользуются преподаватели в вашем вузе.
Разные системы проверки текста на плагиат используют разные алгоритмы и дают разный результат.
Вот топ популярных сервисов, позволяющих проверить оригинальность реферата, курсовой или диплома на плагиат онлайн и бесплатно.
Не переживайте, если с первого раза ничего не получается. Если вы отчаялись и не знаете, как сделать, чтобы курсовая, дипломная, реферат или любой другой текст прошли антиплагиат, обратитесь в студенческий сервис. Мы помогаем решать любые вопросы, связанные с обучением.
Вопрос/ответ
Как проверить курсовую/дипломную онлайн?
Как повысить оригинальность текста в антиплагиате самостоятельно?
- Глубокий рерайт – тщательно переписываем работу своими словами.
- Добавление синонимов и эпитетов – заменяйте слова синонимами, а к существительным добавляйте прилагательные. Только не переборщите. Это же дипломная всё-таки.
- Синонимайзеры – используйте их только для небольших отрывков текста.
- Перевод текста на другие языки и обратно – когда переводишь с одного языка на другой, меняется структура предложения. Это нам и надо, чтобы повысить уникальность на пару процентов.
- Изменение предложения с конца – достаточно грамотно поменять две части местами, как автоматически повышается и уникальность документа.
- Использование слов-паразитов – например, слово «непосредственно» можно использовать практически в любом предложении, так как оно обязательно подойдет по смыслу хоть к какому-то слову.
Как не стоит уникализировать текст?
- Менять слова местами.
- Менять предложения и абзацы местами.
- Склеивать и разбивать предложения.
- Менять знаки препинания
- Изменять фон или цвет текста.
- Использовать устаревшие программы для проверки работы на плагиат.
- Контрольная работа от 1 дня / от 120 р. Узнать стоимость
- Дипломная работа от 7 дней / от 9540 р. Узнать стоимость
- Курсовая работа 5 дней / от 2160 р. Узнать стоимость
- Реферат от 1 дня / от 840 р. Узнать стоимость
Наталья – контент-маркетолог и блогер, но все это не мешает ей оставаться адекватным человеком. Верит во все цвета радуги и не верит в теорию всемирного заговора. Увлекается «нейрохиромантией» и тайно мечтает воссоздать дома Александрийскую библиотеку.
Модуль поиска “Перефразирований интернет” — как обойти
Антиплагиат – мощная система проверки уникальности студенческих работ, используемая более чем в 95% российских ВУЗов. Также ею пользуются отдельные высшие учебные заведения стран СНГ. Система страшит глубиной проверки загружаемых текстов. И это неудивительно – в нём используется большое количество дополнительных модулей, в отличие от традиционных систем проверки уникальности. Антиплагиат сравнит работу со сводной коллекцией ЭБС, коллекциями Гарант и РГБ, прогонит её по модулю поиска общеупотребительных фраз, сравнит с содержимым интернет-модулей. Одной из студенческих «страшилок» является модуль перефразирований интернет» – он «срезает» огромное количество работ, показывая низкую уникальность.
- 1. Модуль поиска перефразирований интернет — что это значит?
- 2. Как работает модуль поиска Перефразирований интернет?
- 3. Как обойти модуль поиска «Перефразирований интернет»?
- 4. Подключен ли модуль поиска перефразирований в моём ВУЗе?
- 5. Обход модуля перефразирований интернет на 100%
Модуль поиска перефразирований интернет — что это значит?
Занимаясь написанием работ, студенты ищут информацию в интернете. Здесь полно рефератов, докладов, справочных данных, выложенных ранее сданных дипломных работ. Добавлять найденную информацию в чистом виде – сродни самоубийству, так как Антиплагиат отреагирует снижением уникальности. Остаётся задействовать рерайт, позволяющий поднять уникальность. Причём переписывать тексты нужно как следует, а не просто менять отдельные слова. В противном случае показатель уникальности будет низким.
Для повышения уникальности рекомендуется использовать глубокий рерайт. Он подразумевает:
1. Изменение структуры предложений.
2. Изменение структуры абзацев и разделов.
3. Внедрение дополнительной информации.
4. Использование метода изложения.
Структура меняется, уникальность получается высокой. Только так можно обойти Антиплагиат.
Внедрение в 2018 году модуля поиска перефразирований интернет значительно усложнило жизнь студентам. Теперь им приходится перерабатывать заимствованную информацию максимально глубоко. Проверка настолько мощная, что простой заменой слов уже не обойтись. Приходится менять текст до неузнаваемости – читаем, анализируем, пересказываем своими словами. Использовать прежнюю структуру текста и предложений теперь не получится.
Как работает модуль поиска Перефразирований интернет?
Модуль поиска перефразирований определяет рерайт, последовательно сравнивая текст работы отрезками длиной в 2 слова – это второй шингл. Подвергая работу рерайту, необходимо менять уже не каждое третье слово, а каждое второе. Проверка невероятно глубокая, справиться с ней смогут лишь одарённые студенты, имеющие способности к работе с текстами. Если «гуманитарии» кайфуют, то «технарям» впору вешаться – они гении в технических моментах, но бессильны перед текстами и их набором. Таким студентам приходится тяжелее всего.
Как обойти модуль поиска «Перефразирований интернет»?
Первый способ самый эффективный, но самый сложный – нужно хорошо учиться, не спать на лекциях, писать рефераты, курсовые и дипломные работы самостоятельно. Но к помощи интернета прибегают и самые прилежные студенты – каждый хочет облегчить процесс написания и позаимствовать кусочек интересного материала. Студенты стараются переписать нужные участки своими словами, но модуль поиска перефразирований всё портит – он прекрасно видит, что студент переписал тот или иной участок, просто перефразировав его.
Второй способ – менять в исходном тексте каждое второе слово. Интересная методика, но не очень эффективная в силу большого расхода времени и сил. Сидеть и высчитывать каждое второе слово (в том числе междометия, местоимения, союзы и предлоги) – то ещё удовольствие. К тому же замену можно подобрать далеко не к каждому слову. Потраченные силы и время можно потратить на глубокий рерайт.
Третий способ – это упомянутый дважды глубокий рерайт, подразумевающий полное изменение структуры текста. Представьте, что вы пишете школьное изложение – прочитайте текст, переосмыслите его, изложите своими словами. Поверьте, уникальность получится очень и очень высокой – модуль не распознает перефразирование, так как оно очень глубокое. Аналогичным образом следует переработать все неуникальные участки – их количество и расположение можно увидеть в полном отчёте.
Четвёртый способ предполагает наличие денег в карманах:
1. Находим исполнителя, который сделает глубокий рерайт.
2. Оплачиваем услуги исполнителя.
3. Получаем готовый текст.
1. Большие финансовые расходы – нормальный рерайт курсовой стоит не менее 5000 руб.
2. Трудно найти нормального исполнителя.
3. Исполнитель может исчезнуть вместе с деньгами.
4. Исполнительно может затянуть сдачу работы.
Больше всего страшит большой бюджет, в случае с дипломной работы сумма вырастает в разы.
Пятый способ – заказать кодирование файла с текстом. Проверка кодированного файла в Антиплагиате покажет высокую уникальность. Воспользоваться данной услугой можно в нашем сервисе. Он не предполагает больших расходов – кодировка стоит от 100 рублей за файл.
Подключен ли модуль поиска перефразирований в моём ВУЗе?
Если для ВУЗа создана персональная версия Антиплагиата, можно уточнить использование модуля на сайте Антиплагиата.
Модуль перефразирований используется:
1. В МГУ – в этом можно было не сомневаться.
2. В МФЮА.
3. В ПГУ.
4. В ПензГТУ.
5. В СПбГУПТД.
6. В СВФУ и многих других.
Перечислять высшие учебные заведения можно довольно долго. Можно с уверенностью заявить, что модуль подключен более чем в 95% всех российских ВУЗов.
Поэтому о простом списывании и поверхностном рерайте можно забыть – либо учимся, либо заказываем написание работ за деньги.
Обход модуля перефразирований интернет на 100%
Возвращаемся к кодировке файлов под Антиплагиат. Мы разработали специальный алгоритм, кодирующий файлы со студенческими работами. Проверка всегда показывает их высокую уникальность. Пользоваться сервисом очень легко:
1. Загрузите файл объёмом до 4 Мб с неограниченным количеством страниц.
2. Выберите систему проверки уникальности.
3. Укажите нужную уникальность с помощью ползунка (требуемый порог следует уточнить в ВУЗе).
4. Оплатите стоимость услуги и скачайте обработанный файл.
Базовое кодирование стоит 100 рублей. Чтобы закодировать файл под все системы проверки уникальности, доплатите 50 рублей. Чтобы полностью скрыть следы кодировки, доплатите ещё 50 рублей – дополнительная маскировка избавляет от подозрений со стороны преподавателя.
1. Низкая стоимость услуг – 100-200 рублей, по сравнению со стоимостью рерайта, выглядят сущими копейками.
2. Гарантия результата – мы регулярно проверяем работоспособность наших алгоритмов, они работают на 100%.
3. Почти мгновенные результаты – с момента загрузки файла до скачивания закодированной версии проходят не более двух минут.
4. Возможность заказать проверку уникальности – стоимость услуги составляет 150 рублей с полным отчётом.
5. Возможность заказать справку из Антиплагиата – её стоимость составит всё те же 150 рублей с действующим QR-кодом, подтверждающим его легальное происхождение.
6. Не меняем содержимое текста и его смысл, не изменяем структуру и оформление – полное отсутствие внешних изменений.
Всего 2 минуты и 100-200 рублей до нужной уникальности:
1. Без длительного ожидания.
2. Без бессонных ночей.
3. Без стрессов и головной боли.
4. С возможностью последующего редактирования.
5. С небольшим запасом.
6. С гарантией прохождения проверки в Антиплагиате.
7. Без финансовых затрат.
Количество используемых в Антиплагиате модулей не имеет никакого значения – система покажет уникальность, выставленную в настройках самим пользователям.
«Трое в лодке, нищета и собаки», или как Антиплагиат ищет парафраз
Наступил новый учебный год. Студенты получили расписание занятий и стали задумываться о пьянках-гулянках-девушках-гитарах будущей сессии. Написание курсовых, дипломов, статей и диссертаций не за горами. А значит, грядут и анализ текстов на наличие заимствований, и отчеты о проверке, и прочая головная студенческая и администраторская боль. И у сотен тысяч людей (без шуток – мы посчитали!) уже возникает закономерный вопрос – как же обмануть «Антиплагиат». В нашем случае практически все способы обмана так или иначе связаны с искажениями текста. Мы уже научили «Антиплагиат» обнаруживать текст, «искаженный » с помощью перевода с английского на русский (мы писали об этом в первой статье нашего корпоративного блога). Сегодня речь пойдет о том, как обнаруживать самый эффективный, хотя и трудоемкий способ искажения текста – парафраз.
С русского на русский, или кстати сказать
С точки зрения нормального обычного человека, парафраз (перефразировка) – это переписывание текста другими (чаще всего своими) словами. При перефразировке стараются максимально сохранить смысл исходного текста, лишив при этом сам текст формального сходства с оригиналом. В целом все парафразы подчиняются определенным правилам, которые люди используют чаще всего, при этом даже не отдавая себе в этом отчета (см. например, статью Alberto Barrón-Cedeño).
Рассмотрим подробнее на примере всем известного рассказа «Муму» [ как и в названии статьи, в нем тоже фигурируют собака, люди и лодка 🙂 ], что же можно сделать с текстом, чтобы его смысл сохранился, а предложения выглядели по-другому.
1. Первое, что приходит в голову – это заменить большую часть слов синонимами. Это самое простое, что можно сделать с текстом. Смысл это не поменяет, а текст на первый взгляд изменится. Такой трюк и используют программы синонимайзеры. При этом они заменяют слова, не учитывая контекст, а просто выбирая слово из списка синонимов, поэтому обработанное такой программой предложение очень часто выглядит довольно несуразно. К этому способу парафраза относится и перИфраз – описательное обозначение объекта на основе выделения какого-либо его качества, признака, особенностей, например, «голубая планета» вместо «Земля», «однорукий бандит» вместо «игральный автомат» и т.п.
Оригинал | Парафраз |
---|---|
Барыня начала ее ласковым голосом подзывать к себе. | Боярыня начала ее обходительным голосом звать к себе. |
2. Замена одних частей речи другими тоже позволяет изменить структуру предложения. Например, очень часто заменяют глагол на существительное и наоборот.
Оригинал | Парафраз |
---|---|
В один прекрасный летний день барыня с своими приживалками расхаживала по гостиной. | Прогулка барыни с своими приживалками происходила в прекрасный летний день. |
3. Еще один простой способ изменить структуру текста – просто делить предложения на более простые, или же наоборот, объединять в длинные.
Оригинал | Парафраз |
---|---|
Герасим немного изумился, однако подозвал Муму, поднял ее с земли и передал Степану. | Герасим немного удивился, однако после подозвал Муму. Он поднял ее с земли и передал Степану. |
4. Существенно и весьма оригинально предложение изменяется при помощи страдательного залога.
Оригинал | Парафраз |
---|---|
Барыня велела позвать к себе старшую приживалку. | Старшая приживалка была позвана барыней. |
Это только типовые приемы. Очевидно, что хороший парафраз обнаружить очень сложно. Иногда это под силу только специалистам с глубокими знаниями в предметной области текста. Но для задачи, которую мы решаем, это и не требуется. Ведь глубокая перефразировка требует значительных усилий, а значит, и больших затрат времени. Скорее всего, студенту будет проще написать свою работу, чем тратить время на серьезную перефразировку чужого текста, которая, несмотря на затраты, может быть обнаружена при проверке.
Поэтому наша цель – это относительно простой парафраз, который может быть выполнен «спинным мозгом», т.е. без больших затрат мыслительных усилий и времени.
По сути перефразировка – это «родная сестра» перевода на другой язык. Слова меняются, но смысл остается. Можно сказать, что парафраз русскоязычного текста – это фактически перевод с русского на русский.
Именно поэтому алгоритм детектирования парафраза получился «близким родственником» алгоритма детектирования переводных заимствований. Итак, как же происходит процесс детектирования заимствований в данном случае:
1. Русскоязычный проверяемый документ поступает на вход.
2. Выполняется машинный перевод русского текста на английский язык.
3. Происходит поиск кандидатов в источники заимствований по проиндексированной коллекции англоязычных русскоязычных документов.
4. Производится сопоставление каждого найденного кандидата с английской версией проверяемогоым документаом – определение границ заимствованных фрагментов.
5. Границы фрагментов переносятся в русскоязычную версию проверяемый документа. При завершении процесса формируется отчет о проверке.
Важное отличие – настройка параметров алгоритма производится на других данных и с учетом специфики русского языка. При этом мы сохраняем стратегию настройки с ориентацией на точность, жертвуя полнотой. Наша задача ̶ минимизировать количество ложноположительных срабатываний, пусть даже ценой пропуска «некоторых целей».
Тюнинг от «высокого портного»
Парафраз – это, безусловно, трудоемкий способ искажения текста. При этом далеко не все способы переписывания одинаково полезны делают текст неузнаваемым. Пытаясь сократить затраты времени, автор использует самые простые способы модификации текста, которые детектируются алгоритмами системы и результата не приносят. Поэтому, после первой неудачной попытки завысить оригинальность, текст начинают «тюннинговать». Как это работает: используются различные комбинации способов, и после каждой такой комбинации модифицированный текст загружается в систему – для проверки того, насколько успешной была перефразировка и смог ли пользователь получить заветный процент оригинальности. В итоге получается цепочка текстов, каждый из которых был перефразирован с той или иной степенью тяжести. Извлечь такую цепочку – довольно простая инженерная задача. Наше исследование таких «цепочек» выявило (заодно подтвердив результаты того же Alberto Barrón-Cedeño) наиболее частые способы модификаций и дало богатый материал для обучения новых алгоритмов.
Проведем небольшой эксперимент. Возьмем небольшой отрывок из уже упомянутого рассказа Тургенева:
Заметим, что в каждом предложении заменено хотя бы одно слово. Такого, казалось бы, небольшого изменения достаточно, чтобы «обычный Антиплагиат» перестал сопоставлять переписанные предложения с оригиналом.
Теперь попробуем сравнить пары предложений исходного текста и переписанного с помощью нашего алгоритма. Для этого будем использовать косинусную меру сходства. Как и в алгоритме детектирования переводных заимствований, каждое предложение представляется в виде вектора большой размерности. Измеряя косинус угла между парой таких векторов, можно делать вывод, насколько эти векторы «похожи» друг на друга, и, соответственно, насколько похожи предложения, которым соответствуют эти векторы.
Вот что получилось после сравнения предложений нашим алгоритмом:
Для наглядности мы изобразили величину косинуса в виде тепловой шкалы. То есть, чем «горячее» цвет между парой предложений, тем больше величина косинуса и тем более похожими считаются предложения из этой пары. Заметим, что наименьшее значения косинуса получили предложения, в которых замены на синонимы очень плохо подходят к контексту. Например, «так» и «таким образом и» действительно очень часто являются синонимами, однако в данном контексте такая замена совсем не к месту.
Попробуем теперь себя сами в роли синонимайзеров и перепишем текст с сохранением смысла. Но в отличие от программы, все наши изменения грамматически согласованы и хорошо вписываются в контекст. Вот что у нас получилось:
И в этом случае алгоритм выдает достаточно высокую оценку похожести для большей части предложений. Предложения же, получившие низкую оценку, были подвержены достаточно глубокой трансформации: в них сильно изменена грамматическая структура. Даже человек не сразу ответит, похожи ли эти предложения, быстро пробежавшись по ним глазами.
И что теперь со всем этим делать?
Естественно, лучший способ понять, работает новый алгоритм или нет – это исследовать качество его работы на реальных данных. Поэтому мы поставили новый модуль обнаружения парафраза в продакшн и прогнали через него реальные запросы (пока не показывая результаты пользователям). Работы проверялись как действующим алгоритмом поиска заимствований – «дословное сравнение», так и новым алгоритмом – «обнаружение парафраза». Затем мы сравнили около 10 тысяч отчетов о проверках загружаемых работ, созданных обоими алгоритмами. Результаты получились интересные.
На это графике приведено распределение процента заимствований для обоих алгоритмов. Видно, что «обнаружение парафраза» в среднем на 10 процентов больше заимствований, чем «дословное сравнение».
На втором графике по горизонтальной оси отложена абсолютная разница между процентом заимствований предлагаемого алгоритма и текущего. Разница больше 0 означает, что «обнаружение парафраза» нашло больше, чем «дословное сравнение».
Выводы
- Парафраз как способ искажения текста реально используется при написании работ;
- Количество «срабатываний» не выросло радикально, алгоритм находит действительно перефразированный текст;
- Как и в случае с переводными заимствованиями, система Антиплагиат получила новый модуль – систему обнаружения парафраза;
- Ну и конечно, наше классическое — лучше творить собственным умом!
Модуль обнаружения парафраза развернут на продакшне и уже используется преподавателями и студентами при проверках текстов на заимствования.