有多少科研论文不是原创的？

现代观点

2015年06月号

卷首语

抄袭的国民基础

医学进展

手机杂志

人物与学科

医学前沿

有争议的话题

现代观点

医生日记

真情无声

医学里程碑

疫苗推广：半个世纪的风风雨雨

在他乡

我的北美历程(五)：一生中最痛

有多少科研论文不是原创的？

作者：沈颖、高石

论文剽窃现象是否在阻碍着科学的发展呢？Citron和Ginsparg统计了发表于《美国国家科学院院刊》上含有抄袭内容的文献数量。结果，被他们鉴定为存在抄袭行为的作者，数量多得令人担忧，特别是有些国家的文献中有多达15%的文章涉嫌抄袭。《电气与电子工程师协会》杂志的编辑委员Michael Lesk同样认为，对所有已发表的文献进行剽窃排查是非常有用的。针对科研论文剽窃现象以及Citron和Ginsparg的研究报告，Michael在《美国国家科学院院刊》撰文发表了自己的评论。

Charles Babbage在1830年就对不可靠的科研结果进行了曝光。他讨论了欺骗、伪造、篡改数据以及拼凑（挑选有利数据）的现象。目前，可疑的论文可能涉及剽窃数据、伪造数据或曲解数据。而Citron和Ginsparg的这项研究结果则反映出了一个极端的问题：仅仅在一种期刊上，就“猖獗”地存在着科研剽窃。而更复杂的科研欺骗行为则可以在retractionwathc.com这个网站上查询到，包括伪造的或欺骗性的数据。Begley和Ellis曾针对伪造数据的研究进行了调查，他们发现，53项肿瘤研究中有高达47项实验无法被重复。

在科研结果逐渐丧失其可信度的现状下，应该怎样采取应对措施呢？仅2012年，就有超过200万篇文献发表。在这数量庞大的文献中，有一些发表于顶级科研期刊，例如《Nature》、《Science》、《Lancet》等，也有一些是通过唯利是图的出版商所发表的（只要付钱就会给予发表）。大学老师对于发表文章的需求尤为强烈，因为他们的考核制度就是基于其文章发表的数量和被引用的数量。如今这种追求h-指数（h-index）的现状，正应了那句俗话：“校长读不懂论文，他只会数论文”。有些国家甚至会给在顶级期刊上发表文章的作者颁发高额奖金，如中国浙江大学给那些在《Nature》或《Science》上发表文章的作者高达3万美元的奖励。

在这种奖励制度下，也就难怪一些作者开始挖空心思地想对策了。Delgado等研究人员就曾发表文章，论述了他们是如何伪造出6篇索引次数多达百次的论文的。其中一个作者成功使得其论文的影响因子升至2分，h-指数从10增加至15。

而评审工作，至少对部分期刊而言，显得非常不严谨。Citron和Ginsparg在文中提到，Bohannon曾尝试着将一篇伪造结果的论文向300个公开发行的杂志投稿，结果竟有超过一半的期刊接受了这篇论文。甚至，他还发现其中一份期刊竟然从另一份享有盛誉的期刊中抄袭了他这篇论文的内容。基于这种现状，网站 Scholarlyoa.com正在尝试归类出信用度低的出版商及其期刊。

而相对于完全伪造的论文，更加常见的是“最小可发表单元”，即将一篇论文拆分成多份可单独发表的短篇报告。不少出版商以及会议主办商都做过这样的“勾当”。 Whilhite和Fong曾发表文章，描述了一位编辑是如何要求论文作者增加对其期刊中文章的引用而提升期刊影响因子的。

欺骗和伪造的科学会影响现实世界。例如，数十年来，英国的教育系统一直非常看重11-plus（英国的一种旧考试制度，学生在11岁时参加考试，决定能否升入更高的学校)的测试结果，推崇由Sir Cyril Burt所提出的这套测试智商的理论。Burt对大量从小被分开抚养的双胞胎进行了研究而得出了这套理论。然而，在他去世后不久，他的研究结果就受到了质疑，因为研究结果太过完美，而且无法找到原始数据，其他共同研究者也失踪了。尽管存在着不少争议，Burt的支持者仍认为Burt只是比较粗心而并非论文造假，而且，其他研究遗传和智商相关性的研究也得出了类似的结果。

最近，两位经济学家Carmen Reinhart和Kenneth Rogoff发表的一份报告指出，国债若超过其国家生产总值的90%，国家经济增长将放缓。而在2年后，英国曼彻斯特大学发现该研究结果存在一些问题，例如，有一些排在字母表前面的国家并没有被纳入分析。为此，Reinhart和Rogoff交出了他们的演算表。更正后的演算结果并未显示出这样的经济规律。然而，该研究结论早已被应用于主要的经济体作为预算政策制定的评估工具。

如果论文的内容比数量更为重要，那么剽窃现象就不会如此猖獗。ArXiv网站就宣称不会对发表在上面的文章进行评审，因此，任何读者都必须自己来衡量每一篇文章的质量。这么做，就是将审评的重担从少数几位专家身上转嫁到了所有潜在读者身上。但不少读者可能只是学生或是其他专业的人员，无法对文章的好坏进行评估。这就是如今这种文章发表体系存在的必要性，但是，这种制度又被一些论文作者“钻了空子”，因为他们知道，在评选职称或晋升时，审评人员最主要的问题仍然是“发表了多少文章”。

其实，文章发表数量的多少并不重要。就好比古罗马帝国的Claudius，这个以“愚钝”闻名的皇帝在位期间，多次发动对外战争，曾占领不列颠、德意志、叙利亚和非洲北部，并且奠定了罗马帝国官僚机构的基础。作为一个例子，他就很好地证明：成败的关键不在于智慧的数量，而在于质量。与之类似，美国国家科学基金会明确要求那些提交科研申请的人只列举5条最具相关性且最重要的文献，而不是一长串的参考文献列表。

值得庆幸的是，Citron和Ginsparg在文中提到，剽窃现象比较集中：他们发现只有一小部分作者会集中性地发表令人质疑的文章。而且，这些文章的被索引率并不高，表明其影响力不大。此外，有许多重要的科研大国的剽窃率还是很低的。相反地，论文的剽窃行为依赖于内容的重复度，如果是将论文翻译为另一种语言或进行重新编辑而不加入任何实质的新内容，这些情况的抄袭是无法被检测到的。

那么，对此我们能做些什么呢？Cintron和Ginsparg在研究中发现，论文剽窃与科研氛围密切相关：有些国家在ArXiv所发表的论文抄袭率高达15%，而有些国家则非常低。因此，科学界是否能够通过软硬兼施的手段来给各国的科研机构施压并强化这方面的规范制度？毕竟现在极少有科研人员不隶属于任何科研机构了，通过机构来影响科研作风应该是比较有效的方式。

Michael 在文中举了个例子。她曾收到一位来自亚洲的研究者的美国博士后申请。而她发现，该申请者的研究自述中，前两段文字抄袭于一个美国的商业网站。那么，Michael是否会把这件事告诉该研究者所隶属的研究机构呢？目前来说，她们并不会这么做，一方面是觉得不礼貌，另一方面又担心会涉及法律纠纷。然而，当Citron和Ginsparg在文中写道，他们发现有些人剽窃了论文时，得到的回应却是询问哪些内容被发现抄袭了，而询问目的竟然是为了规避下次再被发现，这种反应简直是无可救药了。

对于实验性研究而言，要求实验数据的可用性是可行的一步。如果论文并非是由作者自己所撰写的，那么他很可能并没有论文背后的数据。当然，实验数据可以被抄袭，但这就增加了被剽窃排查软件探测到的几率，而且重新编辑数据比编辑文字更为复杂。

ArXiv正在尝试让读者对那些含有抄袭内容的论文进行标记。当读者发现论文有问题时，可以留言；而论文的作者并不一定要给予回复或撤回论文。目前为止，有些人对标记视而不见，有些人则坚称他是在做可接受的实践（acceptable practice）。这些反应表明，还需要增加其他的措施。

《Nature》杂志在2年前曾发表一篇文章，文章的作者Zhang和McIntosh建议制定一份黑名单。他们表示，这需要许多出版商共同做出努力，但没有人愿意负责这件事。而Michael则认为应该更进一步，精确找到剽窃问题严重的部门和研究机构。出版商应该告知研究机构，一旦发现有研究人员剽窃了论文内容，那么会将整个研究机构拉入黑名单。出版商可以采取一些适度的惩罚措施，例如延迟发表而非完全拒绝发表。

总体而言，Citron和Ginsparg主要调查了ArXiv上论文的剽窃情况。让人略感安慰的是，剽窃检测软件能有效地找到涉嫌抄袭的论文，而且这些抄袭现象集中在少部分作者和国家中，且抄袭的论文影响力不大。坏消息是，这些问题切实存在，且在一些国家中比较严重。如今，ArXiv正在对那些有抄袭内容的论文进行鉴别，并期待能抵制劣质论文的提交。对于出版界来说，也许是时候采取更加有力的措施了。

我国科学界也常常会曝出论文抄袭的丑闻，作为一个科研产量大国，政府和科研机构应该转变思路，更加关注论文质量，而非论文的数量或是h-指数。

(作者：沈颖、高石)

参考文献：Proceedings of the National Academy of Sciences 2015; 112:6-7