高温超导体的发现、DNA双螺旋结构的确定、第一次观察到宇宙扩张加速,所有的这些科学突破都赢得了诺贝尔奖和国际认可。然而,这些论文却没有一篇能够跻身世界引用次数最多的100篇学术论文行列。
“引用”是指,在科学论文中对先前研究所做的参考。目前,引用已经成为作者表明他们研究方法的来源、思想和研究发现的一种标准方法,而且引用也能够粗略衡量论文的重要性。50年前,美国科学家Eugene Garfield发表了著名的科学文献索引(Science Citation Index,SCI)。SCI是世界科学文献领域中第一个追溯引用文献的系统性工作。为了纪念这项工作,英国《自然》杂志邀请汤森路透(Thomson Reuters是SCI的拥有者)列出了至今引用率最高的100篇论文。该榜单的整理工作所涉及的论文覆盖了整个汤森路透的Web of Science网站。该网站是SCI的网络在线版本,其数据库覆盖了社会科学、艺术与人文、会议论文集以及一些书籍,并列出了1900年至今出版的所有论文。
整理的结果让研究人员大吃一
惊。他们发现,即使是Top100榜单的最后一名也有12119次的引用,然而,许多世界最著名的论文竟然落榜了。虽然一些经典的发现也进入了榜单,如第
一次观察到碳纳米管的论文,但是绝大多数的论文都是描述相关领域、目前已经成为研究所必须的的实验方法或软件。
例如,历史上引用最多的研究是一篇1951年关于描述溶液蛋白量检测阵列的论文。这篇论文的被引用次数达到了惊人的305000次。这样的一种认可程度甚至连这篇文章的主要作者——已故的美国生物化学学家Oliver Lowry生前都曾表示困惑。Lowry在1977年写道:“虽然我知道这其实并不是一篇伟大的论文,但我私下里也为这篇论文所获得的反响暗自开心。”
多年以来,科学界已经积累了
不计其数的学术文献,这就意味着,能够进入Top100榜的都是那些杰出的佼佼者。仅汤森路透的Web of
Science网站目前已经记录了5800万个条目。如果将所有论文按照被引用次数叠起来,并放大到乞力马扎罗山的高度,那么世界引用次数最多的100篇
学术论文(就是本次的前100名榜)仅占了1厘米。仅有14499篇论文的被引用次数超过1000次,而这些论文也仅占到了1米半左右。同时,仅被引用过
一次的论文大致占到了整座论文山的一半左右。
研究人员至今仍然无法完全理
解,为何那些Top100的学术论文并不是那些诸如《相对论》之类的名气响当当的论文。但是,学者们的惯例或许能够说明一些问题。Paul
Wouters是荷兰莱顿科学技术研究中心的主任,对此他表示:“许多关于研究方法的论文是学者必须引用的‘标准参考文献’,这是为了向其他科学家明确他
究竟在做什么研究。”另外一个科学领域的惯例也促使了真正的基础性研究论文(例如爱因斯坦著名的相对论)被引用的次数不能达到理应获得的程度:这些论文由
于实在是太重要了,所以很快就被写进教科书,或者被直接整合到论文正文中,因为人们认为这些论文已经成为常识性的结论,因此并不需要特别地进行引用。
就引用次数而言,还充斥着其
他令人费解的因素。引用次数的总量在不断上升,例如,时间越久远的论文拥有越长的时间去积累引用次数。生物学家比心理学家更加倾向于领域内的互相引用。而
且,各个不同领域的学术出版物的数量也不同。因此,文献计量学家很忌讳简单粗暴地计算引用次数来评价一篇论文的价值。相反,他们更倾向于在具有可比性的领
域中,比较同时期论文的引用次数。
在互联网上,汤森路透的名单
并不是唯一的排名系统,谷歌学术也为《自然》杂志编制了他们自己的Top100名单。由于是通过搜索引擎对更大的文献库(包括各种书籍)进行挑选参考文
献,因此,谷歌的排名在更大程度上依赖于引用次数。在谷歌的排名中,经济学论文具有更加突出的地位。谷歌学术的名单还涉及了大量书籍,而汤森路透却并未对
此进行分析。但是在所有科学论文中,很多论文同时出现在了这两份名单中。
但是,无论我们如何谨慎地看待这个排名,老式的名人堂仍然具有其价值;如果我们没有什么别的办法来进行衡量,那么这就是我们纪念科学知识的根本的良好途径。研究人员毕竟还是依靠相对没有被埋没的论文来描述试验方法、数据库和软件,从而取得了令人兴奋的进展。
在这里,《自然》杂志带领我们攀登了科学论文的乞力马扎罗山——也许并不是耀眼的明星,但它却深刻地影响着整个世界。
几十年来,Top100排名的论文一直都被蛋白生物化学统治着。1951年一篇描述Lowry蛋白定量法的论文至今仍无挑战者能够撼动其NO.1的地位,即便生物化学家一直表示Lowry法及其竞争方法——Bradford
阵列(排名第三)已经有点过时了。排名第2的是Laemmli缓冲液的论文,这种缓冲液在不同类型的蛋白分析中都会运用到。上述3项生物学技术至今仍具有
统治地位的原因主要在于其在细胞和分子生物学领域论文中的巨大引用量。而这3项技术在该领域中的确是不可或缺的研究工具。
在Top100排名所有描述
生物学技术的论文中,至少已经有两篇获得了诺贝尔奖。名列榜单第4名的论文是描述DNA测序的。这篇论文帮助已故的Frederick
Sanger(弗雷德里克•桑格)荣获了1980年的诺贝尔化学奖。排名第63的论文是论述聚合酶链反应(polymerase chain
reaction,PCR)的。PCR是一种复制DNA片段的方法,使得有限的DNA样品量能够无限放大,因此凭借PCR这篇论文,美国生物化学家
Kary Mullis赢得了1993年的诺贝尔奖。这2项技术帮助科学家探究和操作DNA,因此推动了遗传学革命性的进步。
一
些其他的方法虽然影响力不如前者,但是也得到了相应的肯定。上世纪80年代,意大利肿瘤遗传学家Nicoletta
Sacchi与波兰分子生物学家Piotr
Chomczynski在美国发表了一种快速、廉价的生物样品RNA提取方法。随着这项技术越来越流行(目前相应论文已经排名第
5),Chomczynski对该项技术进行了修改,并取得了专利权。同时,他甚至通过销售这种试剂做
起了生意。目前在纽约州布法罗市Roswell公园癌症研究院工作的Sacchi表示,虽然她并没有得到太多的金钱报酬,但是当看到越来越多的伟大发现是
建立在她的工作之上时,她感到无比欣慰。小RNA(非编码RNA)的研究目前已经成为热点,而这项技术在该研究领域中具有举足轻重的作用。“从科学上讲,
这才是我所珍视的,这才是给我的最大奖励”,Sacchi表示。
在Sanger发表DNA测
序的科研成果之后,遗传学测序技术快速发展,同时也帮助那些论述DNA序列分析方法的论文地位不断蹿升。一个典型的例子是基本局部比对的搜索工具
(Basic Local Alignment Search
Tool,BLAST)。20多年以来,对于那些想要弄清基因和蛋白功能的生物学家来说,这个工具简直是尽人皆知。用户只需用网页浏览器打开程序,并插入
一个DNA、RNA或者蛋白序列,几秒后用户就能看到各种生物体的相关序列以及这些序列的功能信息及相关文献链接。BLAST是如此流行,以至于这种程序
的两种版本分列榜单第12名和第14名。
但是,由于文献引用的习惯往
往反复无常,BLAST的排名已经被Clustal(同时比对多条序列的互补程序)超越。Clustal允许研究者对不同生物体序列间的进化关系进行描
述,在表面上无关的序列中寻找匹配,以及预测一段基因或蛋白上的某一个具体位点发生改变后是如何影响功能的。1994年一篇论述
ClustalW(Clustal的用户友好型版本软件)的论文在榜单上位列第10。而位列第28名的则是1997年一篇对更新版本ClustalX进行
描述的论文。
研发ClustalW的团队
来自于德国海德尔堡欧洲分子生物学实验室。该团队研发出了能够在个人电脑而非大型电脑上运行的程序。然而,1991年计算机科学家Julie
Thompson加入该实验室后,对这个软件进行了改进。Thompson现在就职于法国斯特拉斯堡的遗传学与分子细胞生物学研究院,他说:“这本来是一
个由生物学家编写的程序;而我只是用一个更加友好的方法将其表达出来。”为了适应基因组数据不断增长的数量和复杂性,Thompson对这个程序进行了重
新编写,同时也试图使其更加好用。
BLAST和Clustal背后的团队在他们论文的排名上也互相竞争,而这种竞争是良性的。Des Higgins是爱尔兰都柏林大学的生物学家,同时也是Clustal团队的成员之一。他表示,BLAST团队是游戏规则的改变者,该团队所获得的所有引用都是他们应得的。
另外一个乘着基因组测序这趟东风的领域就是系统发生学。这是一门专门研究物种间进化关系的学科。
在榜单第20名的是一篇介绍
“邻接法”的论文。“邻接法”是一种根据物种间进化距离(如遗传变异)进行衡量并把大量生物体同时放入一棵系统发生树的快速、有效的方法。这种方法把具有
亲缘关系的物种成对地连接起来,直至系统发生树最终确定下来为止。上世纪80年代,人类学家斋藤成野在加入休斯顿德克萨斯大学Masatoshi
Nei的实验室研究人类进化和分子遗传学(这两门学科在信息爆炸的年代也同时膨胀)时,参与发明了这项技术。
斋藤成野现在在日本国立遗传学研究院工作。他说:“我们人类学家当时正面临着某种程度上的大数据时代。”而这项技术使得利用大型数据集构建进化树同时又无需耗尽资源成为可能。(在Top100榜单中一篇关于异花受精的论文中,Clustal的算法也采用了相同的策略。)
位
列第41位的论文则关注了如何将统计学应用在系统发生学中。1984年,美国西雅图华盛顿大学的进化生物学家Joe
Felsenstein将统计学工具bootstrap用于推断进化树中不同部分的准确性。bootstrap法涉及在同一个集合中对数据进行多次重抽
样,然后利用产生的估计值变异来确定单个分枝的置信区间。虽然一开始这篇论文积累引用的速度很慢,但是随着分子生物学家逐渐认识到给论文预测的结论加上一
个置信区间的必要性,这篇论文迅速在20世纪90年代和21世纪初流行起来。
Felsenstein认
为,bootstrap法(由美国加利福尼亚斯坦福大学统计学家Bradley
Efron在1979年发明)的概念比他的研究工作更为基础、更为重要。但是,将bootstrap法应用到生物学问题中去,就意味着会有大量的研究者将
对其进行引用。Felsenstein的研究论文所获得的高引用次数与他当时的辛勤工作分不开。Felsenstein回忆称,他几乎将所有的研究结果都
硬塞到了一篇论文中,而并非就该主题发表多篇论文,因为这样可能会“稀释”引用次数。他说:“我不能在同一个事情上写四篇论文,这样做就太分散了,而且也
不能体现我的原则性。”
美国伊利诺伊州芝加哥大学统计学家Stephen Stigler是统计学历史的专家,他表示:“虽然在Top100榜单中充斥着关于统计学的论文,但是这些论文对于统计学家来说并不是最重要的。”相反,这些论文对于活跃在一线的科学家们是最有用的。
许多这种交叉学科的成功都来
源于生物医学试验中不断扩张的数据流。例如,引用次数最高的统计学论文(排名第11)是美国统计学家Edward Kaplan和Paul
Meier在1958年发表的。这篇论文帮助研究人员确定人群的生存模式,在临床试验中的应用极其广泛。这篇论文向人们展示了著名的Kaplan-
Meier估计。排在Kaplan-Meier论文后面的是1972年英国统计学家David
Cox的论文(榜单排名24)。这篇论文进一步深化了上述的生存分析,将性别和年龄等因素纳入了分析。
Kaplan-Meier论
文曾经也是被埋没的金子,因为直到上世纪70年代计算机计算能力得到了爆炸性的增强,这篇论文才脱离其几乎无人引用的惨淡状态,并被许多其他非专业领域和
人士所引用。Kaplan-Meier的方法简单易用,所以该方法在生存分析领域里迅速流行起来。英国统计学家Martin Bland和Douglas
Altman的论文位列榜单第29。该论文描述的是一项技术,这项技术现在称作Bland-Altman图。Bland-Altman图使得两种不同的衡
量方法的一致性能够用图表述出来,更加直观,更加可视化。虽然这个思想在14年前就被另外一名统计学家提出来了,但是Bland和Altman以论文的形
式向世人展示,并且获得了许多引用。
榜单中所有的统计学论文在不同的科学领域背景下都处理了同一个问题——数
据的多元比较。如果遇到多组间的比较,那么美国统计学家David
Duncan在1955年发表的论文(排名61)将会帮助研究人员解决这个问题。但是,遗传学和神经科学成像的数据分析中,需要比较的对数成千上万,而这
种数据规模在Duncan那个年代是难以想象的。在这种情况下,1995年以色列统计学家Yoav Benjamini和Yosef
Hochberg关于控制假阳性率的论文理想地解决了这个问题。正如Efron所言:“这其实是一个计算机的故事,计算机一开始运算极慢,然后发展到不那
么慢,然后计算机的运算速度在统计学理论和实践中的影响就逐渐显现出来了。”
当理论家希望对某些材料进行建模(无论是一个药物分子还是一片金属),他们经常会用软件来计算该材料的电子活动。软件计算的结果可用于对该材料其他属性的推测和理解,例如蛋白的反应活性或者环绕地核外层的液态铁的导热性。
大多数这种软件都是建立在密度泛函理论(density functional theory,DFT)上的。DFT是物理科学中最为广泛引用的概念。在Top100榜单中,有12篇论文都与DFT有关,其中2篇位列前10名。英国牛津大学材料物理学家Feliciano Guistino说,DFT本质上是一种近似法,使得不可能的数学运算变得简单。如果研究人员试图通过解释所有电子和原子核间的相互作用来研究硅晶体的电子活动,那么他将会面临1021万亿字节的数据分析——这个数据量已经远远超过了目前所有计算机的运算能力。DFT把数据要求降低到了仅仅几百千字节的量,而这个量在一台标准的笔记本上便能进行运算了。
理论物理学家Walter
Kohn在半个世纪前主持了DFT的研发,所发表的两篇论文分列榜单第34名和第39名。Kohn当时发现,通过假设每个电子都会与其他所有电子相互作用
(并不以单个电子进行作用,而是以模糊平均的方式),他或许能够计算一个系统的属性,如最低能量状态。大体上,这个数学运算也非常直接:一个系统的行为就
像一个密度随时变化的连续流体。因此,DFT的命名就由此而来。
但
是,Giustino表示,一直过了几十年研究者才真正将这个思想应用到现实中的物质。Top100榜单中有两篇论文分别提供技术路线,目前最为流行的
DFT方法和软件包正是基于这两个技术路线构建起来的。其中一篇(排名第8)的作者是加拿大哈利法克斯戴豪斯大学的理论化学家Axel
Becke;另外一篇(排名第7)的作者是三位美国理论化学家——Chengteh Lee、Weitao Yang和Robert Parr。1992年,计算化学家John Pople(与Kohn共同分享1998年的诺贝尔奖)在他著名的高斯软件包中纳入了DFT。
Becke
表示,即便软件用户并不完全理解DFT理论,但他们仍经常引用最为原始的理论性论文。Becke还说:“理论、数学运算以及计算机软件高度专业化,也是量
子物理学家和化学家所关注的热点。但是,其应用是无限的。在非常基础的水平上,DFT可以用于描述所有的化学、生物化学、生物学、纳米体系和物质材料。在
我们的地球上,万物都有赖于电子运动,因此,DFT理论上能够解释世上的一切事物。”
德
国哥廷根大学的化学家George
Sheldrick在上世纪70年代着手编写软件,试图解决晶体结构问题。当时他表示:“你不可能从这类项目中赚得盆满钵满。我的工作是化学教学,编写程
序是我业余时间的一种爱好而已。”但是在40年间,他的工作慢慢演变成了定期更新的计算机程序——SHELX软件套装,而该软件已经成为晶体X光散射图样(用于揭示原子结构)分析的最常见软件之一。
2008
年,Sheldrick发表了一篇关于该系统历史的综述,并建议,只要其他研究者使用了任何相关的SHELX程序,该综述就很可能被作为最基本的引用文
献。读者们当然也顺应了这个建议。从此,该软件的流行程度已经不言而喻了。在过去的6年中,这篇综述累积了3万8千次被引用次数,从而一跃成为榜单第13
名,并且在过去的20年中一直处于榜首位置。
Top100榜单中还分散着
其他关于晶体学和结构生物学基本工具的论文。其中包括论述分析X光衍射数据的HKL软件套装(榜单第23)的论文、论述用于分析假设蛋白结构是否在几何学
上奇异的PROCHECK程序的论文(榜单71)、以及两篇用于预测蛋白结构的程序的论文(排名分别为第82和第95)。“工欲善其事,必先利其器,而这
些工具正是确定晶体结构的基础”,美国国立卫生院的数据科学副总监Philip Bourne如是表示。
Top100榜单中位列第22位的是一篇1976年非同寻常的论文。该论文作者Robert Shannon是位于美国特拉华州威明顿市的巨头化学企业——杜
邦的研究人员,他为一系列不同物质的离子半径编制了一个综合性的列表。伦敦帝国学院的材料科学家Robin
Grimes表示,物理学家、化学家和理论学家在查询离子大小(离子大小能够较为准确地将物质的其他性质联系起来)时仍然会引用这篇论文。因此,这篇论文
一直以来都是正式被引用次数最高的数据库。
作为Grime研究团队中的
一员,Paul
Fossati说:“我们经常不假思索地引用这类论文。”当然,类似的情况也适用于Top100榜单中许多其他的方法和数据库。Top100榜单仅仅向我
们展示了计算机和大型数据集分析对研究的巨大影响。但是该榜单也提醒我们:任何一个具体的方法学论文或者数据库,他们能够位列榜单顶端,多少也与运气和当
时的时代环境有关。
本文对Top100榜单进行
了简单的回顾。在这个过程中,我们发现,其实该榜单中论文背后的故事也为研究者们好好地上了一课。正如耶鲁大学化学家所言:“如果你所想要的是你的论文被
高度引用,那么想办法去设计出一种方法。这种方法如果能够使得别人原本不能实现的实验成为可能,或者使得原本复杂的实验变得更加简单,那么你将会得到的何
止是揭开宇宙的秘密啊!”
(作者:费正弦、沈颖)
参考文献:Nature 2014;514:550-553