CNKI知网TMLC查重系统的检测原理

每逢毕业时节,毕业生对知网查重都比较发愁,担心自己的毕业论文在知网论文检测时过关不了。其实这种担心是没有必要的。如果是原创论文,自己亲自写的论文,知网查重肯定不会标示很高的重复率的,通过学校的论文查重是没有问题的。相反,如果论文大部分是抄袭的,那就别有侥幸心理,知网查重系统肯定会把你的论文揪出来的。那么,知网查重用的TMLC检测系统是如何检测学位论文的呢?下面我们来看看。

学位论文学术不端行为检测系统(简称“TMLC”)是以《中国学术文献网络出版总库》为全文比对数据库,实现了对抄袭与剽窃、伪造、篡改等学术不端行为的快速检测,可供用户检测学位论文,并支持用户自建比对库。其主要的检测原理就是基于CNKI自主研发的自适应多阶指纹分析技术的文献快速比对。也就是说把检测文献指纹化,比比对资源库也指纹化,通过对比指纹来快速得到检测结果。如下图所示:

知网检测原理

该检测技术又称AMLFP,是同方知网CNKI自主知识产权,具有检测速度快,准确率,召回率较高,抗干扰性强等特征。同时指出篇章、段落、句子各层级检测;支持文献改写,多篇文献组合等各种文献变形检测;支持研究生学位论文、图书专著等超长文献的学术不端检测。CNKI自适应多阶指纹技术原理图如下:

知网指纹比对算法

对任意一篇需要检测的文献,系统首先对其进行分层处理,按照篇章、段落、句子等层级分别创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引。这样的分层多阶指纹结构,不仅可以满足我们对超长文献的快速检测,而且,因为我们的最小指纹粒度为句子,因此,也满足了系统对检准率和检全率的高要求。原则上,只要检测文献与比对文献存在一个相同的句子,就能被检测系统发现。