万方采用的是基于滑动窗口的低频特征部分匹配算法,能快速生成报告,加上不测互联网数据,万方报告一般来说几秒钟即可出来。知网采用的是保留文献段落信息,原版显示检测结果,结合海量独家文献资源、英文资源、网络资源、第三方资源,使检测结果更加细致,检测时长也在5分钟以上。知网的数据库是实时更新的,相对于这一点万方的数据库则是定期更新。另外万方的数据库没有知网齐全,查重的文章对比不到更多的文献,导致查重的结果具有片面性。因此论文如果拿去万方查重出来的重复率一般是要比知网低的。
▲ 知网论文库比Paperpass大很多,而且更新比较快,通常1-2次/年;而Paperpass主要收录了大量互联网资源。两者的论文库属于交叉状态,因此Paperpass检测出来重复的,知网不一定重复;Paperpass没检测出来重复的,知网不一定不重复。另外在格式规范的前提下,PaperPass不能科学地识别出声明、目录和参考文献等内容并会把这些内容当作正文来比对查重,paperpass还会将文章中的文字分为三种绿色、橙色与红色,分别表示该句与原文的重复度在40%以下、40%~60%、60%以上,除绿色以外其他部分都会被计算为相似度,而只会把你的文章中的句子分为两类:重复与原创。这些都会导致paperpass查重结果虚高,造成PaperPass和知网系统查重结果的不一致。
由于知网采用的数据库和查重技术和市面上的许多论文查重不一样,使得论文查重检测结果不匹配:知网没有查出重复的部分被计入重复率,知网判定重复的部分又没有计入重复率等。综上可知,不同系统的检测结果其实是没有任何可比性的。