Как распознать подделку

Интернет

Интернет, бесспорно, создал массу удобств, но при этом породил не меньшее количество проблем. Одна из них — использование «плагиата» при написании школьниками рефератов, студентами — курсовых и дипломных работ, соискателями научных степеней — диссертаций. К счастью, на любой прием найдется контрприем…
Cодержимое веб-пространства стало той доступной базой данных, кото¬рая способна убить любой творческий порыв у ленивого человека и свести его к банальному «копипейсту». Данные статистики красноречивы: 38 % студентов признаются в постоянном плагиате рефератов, остальные делают это эпизодически. Впрочем, не наше дело увещевать — своя голова должна быть на плечах… 

А вот в научном мире все куда серьезней. К сожалению, и в академических кругах находятся подобные «студиозусы», желающие снискать себе славы за счет трудов коллег. Механизмы поиска научных работ в Интернете постоянно совершенствуются. Заметен прогресс и в арсенале приемов присвоения чужой интеллектуальной собственности: распознавания, перевода, редактирования и т. п. Но воришки редко «пионерят» чужие мысли оторванными от текста, которым они изложены. Это их и выдает. 

Если реферат представлен в электронном виде, то задача проверки текста на плагиат для опытного преподавателя (эксперта) не составляет большого труда. Достаточно ввести в поисковике пять-шесть ключевых слов, выбранных из документов «вручную». Эффективным может оказаться поиск по фрагменту текста, реализуемый большинством поисковых систем — не только на веб-страницах, но и в файлах офисных форматов (DOC, RTF или PDF). В качестве «идентификаторов» текста также могут рассматриваться типичные опечатки. 

Документы Microsoft Word могут содержать скрытую информацию — имена создателей документов, пользователей, названия организаций, путь к файлу документа и т. п. Извлечение этой информации требует знания нюансов программного продукта, однако также может быть аргументом при выявлении клона чужого документа. 

Как правило, описанных выше приемов хватает для уличения несознательных учеников. Но иногда требуется обработать огромное количество «творений» или провести экспертизу на предмет автоматического перевода либо машинной правки. Тогда на помощь приходят продвинутые автоматизированные системы распознавания плагиата. В качестве баз данных для сравнения текстов можно использовать готовые базы данных поисковых систем (Google, Яндекc), которые охотно предоставляют API для доступа к своим ресурсам. 

К тому же любой текст, написанный определенным человеком, характеризуется параметрами, присущими именно этому человеку. Они определенным образом и «привязывают» текст к автору, В качестве таких параметров можно рассматривать среднюю длину слова и предложения. 

Среди простейших инструментов автоматического поиска совпадений можно назвать коллекцию рефератов. Поиск по ней ведется с помощью Яндекса. Эта подборка сама по себе является неплохим подспорьем как для плагиаторов, так для их разоблачителей. 

Бесплатный, доступный в Интернете инструмент поиска плагиата WCopyFind был разработан профессором физики Лу Блюмфилдом в университете штата Вирджиния. Это несложная программа, которая анализирует курсовую работу, сравнивая ее с базой данных, содержащей несколько тысяч документов. При этом она связывает найденные совпадающие фрагменты гиперссылками, чтобы указать первоисточник. Еще один бесплатный инструмент — Соруsсаре . Он предназначен для поиска плагиата на веб-сайтах. Этот сервис был запущен компаний Indigo Stream Technologies и базируется на поиске Google. 

Пожалуй, самой популярной из профессиональных программ поиска плагиата является система Turnitin, разработанная компанией iParadigms, LLC. Ее база данных содержит более 25 ТБ информации (рефератов, курсовых и т. п.). Преподаватели могут заносить в сервер до 1000 файлов за один раз. Система сравнивает материалы со своей базой и текстами из «коллекций рефератов», а также с ранее представленными работами. Сервис работает на коммерческой основе и требует предварительной регистрации.
Для русскоязычного контента самым удачным оказалось решение компании «Анти-Плагиат». Ее главное преимущество — возможность выявления плагиата на любом языке. 

Концепций построения систем борьбы с плагиатом сегодня множество — от вероятностных, лингвистических, до психологических. Наибольший прогресс все же ожидается от использования концепции Text Mining, которая подразумевает построение механизмов выделения фактов и аномалий, присущих тексту, построение текстовых массивов и т. п. 

Правда, на пути широкого внедрения средств антиплагиата встречаются и проблемы. Например, недавно была подвергнута сомнению правомерность действий службы Turnitin. После проверки система включает в свою базу данных работу студента, получая выгоду без выплаты компенсации автору.
Несмотря на это Объединенный комитет по информационным системам вузов Великобритании организовал на базе Turnitin собственный сервис поиска. 

Следует отметить, что и в Украине создано несколько программных комплексов борьбы с плагиатом, в частности в Украинском языково-информационном фонде НАН Украины и в Национальном авиационном университете. Вместе с тем украинские вузы не спешат внедрять эти программы. 

Авторы одного из таких комплексов утверждают, что это связано и с тем, что сегодня дипломно-курсовым бизнесом занимаются не только студенты, но и преподаватели. По их мнению, для внедрения «антиплагиаторов» необходимо государственное регулирование. В конце концов государство должно быть заинтересовано в решении проблемы: ведь чем меньше студенты будут списывать — тем больше профессионалов получит страна.

Оцените статью
ЗнайКак.ру
Добавить комментарий