知网查重样例–学术不端文献检测系统的产生及应用概况

2017-09-29 作者：小编

知网查重样例--学术不端文献检测系统的产生及应用概况

在上，20世纪70年代就开始了利用技术手段检测不端行为的研发工作。90年代以后，提出了数字指纹等检测方法，并得到了应用，如论文作业抄袭检查平台turnitin，研发后应用于多所高校及科研机构，包括美国加州大学伯克利分校、杜克大学、德国汉堡大学等；加拿大sciworth公司开发的mydropbox，提供学生作业抄袭检测服务；mydropbox使用微软搜索技术，可以检测互联网资源、可公共存取的部分数据库资源以及机构内部文档，等等。[3]

随后，我国的研发工作也陆续展开，具代表性的是中国学术期刊（光盘版）电子杂志社与同方知网公司的共同研发。他们首先建起了《中国学术文献网络出版总库》，该数据库收录了包括期刊论文、学位论文、工具书、年鉴、报纸、专利等在内的多种文献，覆盖了工程技术、信息技术、自然科学、农业、医学、哲学、人文社会科学、经济与管理等各个领域。它还是上大的连续动态更新的全文数据库，并成为随后研制的学术不端文献检测系统的比对数据库。

2006年下半年，中国学术期刊（光盘版）电子杂志社与同方知网公司开始合作研制学术不端文献检测系统，这“是一个系统工程，涉及检测方法设计、比对数据库建设、规范数据库建设、大规模数据测试、系统性能测试等多个环节。”[4] 2008年12月，学术不端文献检测系统开发完成，研发者宣布将在各相关机构开放使用。

学术不端文献检测系统的比对数据库为《中国学术文献网络出版总库》，检测时输入一篇文章，就能同数据库中的所有文章进行比对，从而发现这篇文章跟数据库中的哪篇文章、哪些句子是重复的。它还是上个以全文文献为比对资源的检测系统，国外的检测系统基本上是题录摘要的检测而非全文检测。

学术不端文献检测系统可用于期刊审稿、学位论文检测、职称评定、项目立项评审、项目验收评审和报告审查等方面。为了从多个角度反映文字复制情况，检测系统设计了总重合字数、总文字数、总文字复制比等多个检测指标。而对于篇幅较大的学位论文，除了设置总检测指标，系统对每一章节都设定了文字复制比、重合字数、引用复制比、段落数、大段长等多个子检测指标，用以检测每一章节的复制情况。该检测系统面世后，迅速地被各相关机构采用，不少机构还以公告形式宣布启用该系统。

例如《浙江大学学报（人文社会科学版）》，在检测系统刚面世的2008年年底，就正式建立了该系统的使用账号，在全国社科期刊中率先采用了这一系统，通过检测后的论文才能进入下一轮的专家审稿流程。《中国肿瘤生物治疗杂志》宣布：“稿件审查过程中，本刊编辑部将采用‘学术不端文献检测系统’，通过大量国内外学术文献的全文比对，对稿件进行学术不端行为的检查。”[5]目前，我国大部分学术期刊已使用该软件对来稿进行不端检测，高等学校、科研机构等也广泛采用了该系统。

以学术不端文献检测系统为标志的反剽窃软件的出现，反映了人们希望净化学术生态环境的良好愿望。然而，学术不端是一个非常敏感的话题，以技术手段检测学术不端行为是个更为敏感的话题。系统投入使用后，迅速引起各方的强烈反响，人们有着许多不同的看法。

“这个‘检测系统’还没正式应用，它的准确性和科学性便受到一些老师和学生的质疑，继而引发了一场争论。”[6]虽然学术不端文献检测系统的范围包括期刊论文、学位论文、职称论文、项目评审等多个领域，但目前对检测系统进行学术研究的多为期刊编辑，所以热烈的学术讨论也基本在期刊编辑中展开。

.—— END ——.

上一篇: 知网论文检测样例–本科生论文抄袭不可小觑

下一篇: 知网论文查重样例–学术不端文献检测系统的功用

推荐阅读

知网查重样例–学术不端文献检测系统的产生及应用概况