可以量化的学术影响力未必可靠
近日,中国教育部、科学技术协会、中国科学院、中国工程院、国家新闻出版广电总局联合发布了《关于准确把握科技期刊在学术评价中作用的若干意见》,并对基于学术论文的学术评价体系提出了一些思考,其矛头指向评价体系里的“标准单一化”“程序程式化”“方法简单化”“方式机械化”。这一《意见》的出台,说明现有的学术评价方式过于简单原始,远远落后于时代的需要。这也说明,学术界在思考对策上,超越了单纯造假的讨论,而开始思考到底什么样的学术成果有实质影响。
这些年来最著名的论文造假事件,是日本生物学者小保方晴子在《自然》所发的关于STAP细胞的论文,其研究被质疑后,论文被撤销。2015年11月2日,早稻田大学还取消了她的博士学位。2015年8月,德国施普林格出版集团也将旗下10本周刊的64篇论文撤下,其中有不少论文来自中国。
这些期刊多为“同行评议”的学术期刊,一般来说,比较公正、内行,少受外部因素干扰。人们一般不去评价这些期刊本身的公信力。可学术期刊多如牛毛,如何评价学术文章的重要性?2005年物理学者希尔什(Jorge E. Hirsch)提出了衡量个人作者学术影响力的方法,亦即h指数,这是指学者发表文章的数量和引用数量的交汇点,比如一个学者发表了100篇文章,其中有48篇至少被引用了48次,那么他的h指数是48。这种计算方法,理论上说可以衡量一个学者的产量和文章的影响力。而学术期刊的影响力,一般是通过“影响系数”计算。影响因子方法由科学信息协会创办人尤金·加菲德(Eugene Garfield)创立,具体算法是用学术期刊两年内发表的论文数(C),去除这两年内的该期刊内文章被引用的总次数(N)。例如,某学术期刊2013~2014年发表的总数量为50篇,被引用总次数为100,那么期刊的影响系数就是2,这种系数值越高越好。
2015年11月5日,《高教内参》发文称,这种影响系数的公信力非常可疑。学术期刊本身为了提高“影响力”,在影响系数上会做很多手脚。很简单,这种影响系数既然是C/N, 编辑就可以在分子或分母上做文章。在“引用数量”上,有一些期刊或明或暗地胁迫作者引用该期刊自身的文章,这样可以提高期刊论文被引用数量。而在论文数量上做文章的办法更多,比如,将知名作者的文章在年初发布,以便增加被引用的可能性。很多期刊在纸媒和网媒之间玩平衡,比如把很多可以发出来的文章发在网络上,当这些文章被引用,可计入“被引用数量”,而纸质文章的数量会大量下降,一下子可以提高“影响系数”。由于这些操纵,越“滑头”的期刊系数越高,越“老实”的期刊系数越低,已经和文章实质影响没有什么关系了。而这些手脚,对学术成果的发布、转化、传播极为不利。一些优质文章就此失去被发表的可能,造成资源的巨大浪费。
这些“影响系数”之所以被人看重,是因为“学术官僚”对于人才的评估能力有限,只能倚重这些外部的、貌似“客观”的数字。这种做法,在内部结构上有巨大的局限性。比如,在我所熟知的外语教育界,曾经存在一流的译著不被纳入学术体系,而发表垃圾论文会被计入“成果”的奇特现象。前者或许更能体现人的水平,但是领导不懂外语,也不知道怎么评估,所以意外地被“遗漏”。而学术文章数量可以数,质量可以通过各种影响系数去计算,评估变成了按照公式加加减减,亦即“数豆子”式的评估。这样的“客观”造成的讹误其实更大。过于迷信数字的客观,忘了数字可以被人操纵,这是很危险的事。
既然学术期刊可以通过网络发布文章,不如将其全部网络化,废除发行量不大、出版周期漫长的纸质期刊。现在有不少期刊直接在网上、或者通过应用程序发布。这种发布,也更容易统计相关下载、浏览数据,以获得更科学客观的影响系数。
与此同时,各种排名的关注者,包括高校管理层,也应该增强学术评估的水平。了解一个人的学术“身价”,比如在一个社会科学研究项目中,不能只通过数字评估,而应该增加更多质性研究的评估方法,这样才有真正的客观。(南桥)