清华同方知网CNKI学术不端行为论文检测系统的总检测指标

清华同方知网CNKI学术不端行为论文检测系统，又称知网查重系统，它的指标体系分为两部分，这篇文章描述第一部分的指标：总检测指标。

学位论文一般文献篇幅较大，字数多，硕士论文一般为3~5万字，博士论文则多达十多万字。因此，为了让用户对整个学位论文有一个快速的概况了解，知网查重系统特制定了以下指标体系：

1）总重合字数（CCA）

2）总文字复制比（TTR）

3）总文字数（TCA）

4）疑似章节数（QCA）

5）总章节数（TCA）

6）首部重合文字数（HCCA）

7）尾部重合文字数（ECCA）

上述指标从整体情况描述了论文的检测情况，便于用户快速了解该论文总的检测概况。下面对上述指标分别进行说明。

1.总重合字数（CCA）

学位论文一般篇幅大，少则3~5万字，多则十多万字，若以文字复制比来衡量一篇论文的文字重合情况，则不太合适。因为对于一篇十几万字的博士论文来说，10%就已达到1万字，文字复制情况已经非常严重。因此，对于博硕士论文检测，知网论文检测系统使用绝对字数即总重合字数作为检测结果的核心指标。如下图所示：

2.总文字复制比（TTR）

总文字复制比则是指学位论文中总的重合字数在总的论文字数中所占的比例。通过该指标，我们可以直观了解到重合字数在该知网论文检测学位论文中所占的比例情况。

3.总文字数（TCA）

总文字数是指该知网查重论文所有包含的字数，文字复制比与总文字数的乘积即为重合字数。

4.疑似章节数（QCA）、总章节数（TCA）

疑似章节数是则知网检测论文疑似存在学术不端行为的章节的数量。总章节数则是指学位论文总的章节数（对于不按章节显示，而是按照固定长度切分的论文，每一段落为一章节）。

5.首部重合文字数（HCCA）、尾部重合文字数（ECCA）

首部重合文字数指学位论文前1万字中重合的文字数量。尾部重合文字数是指除去前1万字，剩下的部分中重合的文字数量。对于学位论文，一般开头部分均是综述性的报告介绍，其重要性远低于论文尾部。