曹广福:论文查重软件是否扯淡?

2012-05-09 11:39 来源:科学网 作者:曹 广福
字体大小
- | +

在论文大爆炸时代,如何发现论文抄袭成了大问题,查重软件应运而生。

查重软件真的可以发现抄袭论文吗?它所甄别的抄袭真的是抄袭吗?记得浙江大学学报编辑张女士在《科学》杂志上的一篇爆炸性文章曾惹得大家议论纷纷,张女士所统计的浙江大学学报论文70%以上存在抄袭现象的真实性如何?好像没有人做过深入的思考。

今天中大通知我,我在中大带的一位今年毕业的博士生论文经软件查重发现博士论文有5%以上的抄袭率。我感到很奇怪,学生的博士论文是我逐字逐句修改的,学生做的内容我也不陌生,从每个部分的撰写到正式发表直到最后博士论文的整理我都全程“监控”,从未发现有抄袭现象,软件竟然如此“聪明”,发现了抄袭现象。我当即通知学生把查重报告取回来核对,学生很快把报告拿来给我看,报告指出,博士论文正文有一部分与该博士生去年正式发表的论文有3.7%的重复率,论文的参考文献有29%与该生正式发表的论文后引用的参考文献重复,我看得啼笑皆非。该生正式发表的论文是博士论文的组成部分,如果只看正式发表的这部分,肯定100%重合,这也叫抄袭?可见仅仅依靠查重软件断言抄袭与否显然是件扯淡的事。查重软件充其量可以帮助我们发现疑似抄袭文章,最终是否构成抄袭,肯定还需要人来进一步判断,好在中大并未将软件查重结果当成权威定论,尚有解释的机会,否则岂不是冤枉了学生?

查重软件对数学基本是无能为力的,它只能检查文字的重复率,对数学公式一筹莫展,你哪怕真的是一篇抄袭文章,查重软件也未必检测得出来,只要你把文字部分作适当修改,用自己的语言重新叙述,公式可以不作任何修改,软件多半发现不了。浙江大学学报发现论文抄袭率居然达到70%,这的确是令世人震惊的事件!该学报上的论文真的这么糟糕吗?我虽然没有拜读过该学报上的文章,但凭感觉不太可能。文章质量姑且不论,该杂志的作者群不至于差劲到如此地步,竟然有70%的作者敢冒天下之大不韪。为什么会出现这样的结果?难道张女士造假?也不是,我认为是软件欺骗了张女士。浙江大学学报英文版的作者大多是国内的教师甚至学生,而且多半是刚出道不久的教师,他们的英文水平也许比我好不了多少,所以在撰写英文论文时便采取了拿来主义,尽量模仿别人文章中的语句,特别是前沿、整段的叙述部分可能存在套用别人文章的现象,说它是文字抄袭未尝不可,但是否构成论文主体--成果的抄袭就难说了,需要依靠人工进一步甄别。从这个角度看,张女士说浙江大学学报英文版70%以上存在抄袭现象有点过于依赖软件了,你最多可以说70%以上的作者存在文字抄袭现象,而不能笼统地说论文存在抄袭现象,论文抄袭是有特定含义的,这很容易让人误解为抄袭别人的成果。我想,假如《科学》的编辑们也认为浙江大学学报的抄袭只是文字模仿或抄袭,他们是不会发表张女士的那篇文章的,因为它不足以产生新闻轰动效应。

查重软件能不能查出抄袭者?我认为,它能发挥的作用有限,只能查出最拙劣的抄袭,即整段COPY别人的文章,这对于文科类文章还是比较管用的。我带过的一个教育硕士在定稿前将论文给我看,文章绝对一流,不仅文笔老练,从字里行间更可以看出作者是个教学经验十分丰富、理论修养颇为深厚之人,然而该生尚是个从没正式教过书的应届生,我读完该文的第一感觉是什么不言而喻。于是我对她说:“文章的确写得很好,一个没有多年教学经验积累的老师写不出这样的文章。”我又告诉她:“现在电脑技术很发达,像这类文章查重的准确率很高,一旦发现抄袭现象恐怕就不能参加答辩了,所以哪怕是别人现成的观点也一定要用自己的语言重新叙述。”如果你把一篇文章的主要论点、论据据为己有,但用自己的语言重新叙述,我相信查重软件是无能为力的。由此可见,查重软件只能对付那些不仅不愿意做学问甚至不愿意变相抄袭而是赤裸裸全盘照搬别人文章的人。

要检验我的判断很容易,找两篇现成的文章,一篇纯文字,全盘抄袭该文的论点、论据,但改头换面,用自己的语言重新叙述,看软件能不能判断出来,另一篇数学或理论物理文章,把公式全部换掉,保留文字的大部分,或者干脆只换个题目,换个作者名,再用软件检测一下重复率,我估计文字部分占多大比例,重复率就有多少。所以,不要迷信查重软件,我们可以用它来发现疑似抄袭,但要判断是否抄袭,尚需人工的进一步甄别。

编辑: zhongguoxing

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。