方舟子的Blog

什么学术评价指标都难不倒中国人

23 06 2026年

要怎么比较准确地评价一个科研人员的学术成就，是一个比较麻烦的问题，在中国尤其麻烦。

理论上，由同行来做评议是最合理的做法，因为同行懂行，对你的成就知根知底。但是这种评价方法存在着问题。第一，比较麻烦，需要对某一个人发表的所有论文都有很详细的了解。第二，主观，没有一个客观的标准，好、坏是由同行说了算的。这就涉及到人际关系，尤其是在中国这种人情社会，同行评议往往变成了互相吹捧，就像中国搞的学术成果鉴定会一样。第三，不公开，外界的人没法知道。例如，职称评定时一般也有同行评议，但是评议结果外人是看不到的。

所以，就需要有一种既简单又客观而且是公开的评价科研人员学术成就的方法。有什么样的方法呢?

一个人的学术成果是通过论文发表出来的。一个最简单、最直观的指标就是看这个科研人员发表了多少篇论文。你看某一个科研人员的介绍，往往也会说到现在他发表了多少篇论文。但是这种简单的方法存在着很大的问题：只看数量，不看质量。发表的论文多不等于贡献就大。有可能发表的论文都是垃圾、灌水、没有什么人看的论文。

特别是中国现在搞论文大跃进，这个问题就更严重了。曾经有一段时间，中国有的大学为了鼓励人们在国际期刊发表论文，每发表一篇国际期刊论文就奖励几千、上万块钱，刺激了大家批量生产论文。有的中国科研人员一年能够发表几十、上百篇论文，这能够说明他的贡献就特别大吗？

中国的大学后来学乖了，强调不能发表了论文就算数，还要看发表的论文期刊的档次，发表高档次期刊的论文才给奖励，期刊档次越高，奖励越多。曾经有的学校开出，发表一篇最高档期刊的论文奖励一百万元。

要怎么区分期刊的高低档呢？一般用的方法是看这份期刊的影响因子的多少。所谓影响因子，可以简单地理解成，在过去的两年这份期刊发表的论文平均被引用的次数，被引用的次数越多，说明期刊的影响力越大。中国特别看重期刊的影响力，把它叫做几分，例如在影响因子10的期刊上发了论文，就说发表了一篇十分的论文。

但是这种方法也存在着问题。在影响力大的期刊上面发表论文不等于这篇论文的影响力就大。高档期刊的发表论文其实大部分都没有啥影响。而反过来，在影响力小的所谓的低档期刊期刊发表的论文，有的反而影响力很大。很多获得诺贝尔奖的工作是发表在所谓的低档期刊上的。发表论文的期刊的影响力并不等于论文的影响力。

能体现论文的影响力的是论文本身被引用的次数。有一种评价学术成就的办法是看这个人发表的论文总共被引用的次数是多少。很多人的简介往往会提一下到现在他发表的论文总共被引用了多少次。但是这个指标也存在着问题。如果一个人发表过一两篇被引用次数非常多的论文，但是他的其他论文引用次数都很少，就会夸大了他的学术成就。特别是那些引用次数非常高的论文不一定就是特别重要的论文。在生物化学领域，那些引用次数奇高，被引用过十几万、几十万次的论文，往往是因为发明了某种实验方法，大家都用了，在写方法与步骤的时候就都引用一下，当然引用次数非常高。但是那是技术问题，能说有多么重要吗？而且，被引用次数比较多的论文很多是综述文章，但是综述文章的重要性不如引用次数较低的原创文章。

所以去简单地算一个人发表的论文的引用总数是多少也不是一个很好的办法。那么为了避免这种情况，就平均一下吧，将某一个人发表的论文的被引用的总数除以他发表的论文的总数，得出一个他发表的论文的平均引用数。但是，这种方法也有问题，对那些发表论文比较少的人会有利，而发表论文比较多的人反而不利，即使发表过不少引用很高的论文，但是也有不少的引用很低的论文，平均了，重要性就降低了。

所以需要一种方法能够同时兼顾到论文的引用数和论文的篇数。在大约二十年前，加州大学圣地亚哥分校（UCSD）物理教授赫希，他是阿根廷的移民，提出了一种办法，叫做H指数，就是想解决这个问题的。这个方法提出来没多久，我就知道了。当时我碰巧去加州大学尔湾分校拜访一个在那里当物理教授的中学同学。他们系有一个物理教授，是从台湾来的，很关心中国大陆学术腐败的现象，听说我去了，来跟我见面。我谈到，现在中国学术评价存在着很大问题，看论文的数量，不看论文的质量。这个教授说，UCSD的一个教授新提出了一种评价的方法——H指数就是想解决这个问题的，你应该把它介绍到中国大陆。

回家之后，我就将赫希的那篇论文找出来看，觉得的确是一种比较合理的方法。我当时在《中国青年报·冰点周刊》有一个专栏，就写了一篇文章介绍H指数。后来，我到中科院的研究所或者中国的大学跟科研人员交流，也建议使用H指数作为一种评价的指标。那么什么是H指数呢？

H指数的定义是，如果某一个人的H指数是N，表明他发表的所有论文当中，有N篇的论文被引用次数不少于N。是一个很简单的定义。而要找出一个人的H指数也很容易。将这个人发表过的所有论文都找出来，根据这些论文被引用次数的高低，按序排列，往下查，直到某一篇论文的序号大于它被引用的次数，将这个序号减去1，就是这个人的H指数。比如说赫希，他提出H指数的时候，他发表的所有的论文按被引用次数排序的结果，从第50篇论文开始，被引用的次数比序号要小，将50减去1，49就是赫希在当时的H指数，也就是说，他到那个时候发表的所有的论文有49篇被引用的次数都不少于49次。

H指数有天生的缺陷，不适合评价那些比较年轻的低年资的科研人员，因为他们发表的论文太少了，不管他们发表的论文的被引用次数有多高，H指数也不可能大于他们发表的论文数。H指数只适用于评价那些高年资的科研人员，年资越高，越有利，因为H指数只会随着论文篇数和时间增加或不变，不会减少。不过这个问题不大，因为人们要知道的就是这些地位已确立的高年资的科研人员的学术贡献。低年资的还有发展前途。

另一个问题，是不同的领域H指数的情形不一致。生物医学领域因为发表的论文被引用的数量在所有的领域中是最多的，导致生物学家的H指数偏高，所以H指数不适合做跨领域的比较，不宜将一个生物学家的H指数跟一个物理学家做对比，说这个生物学家的学术贡献比那个物理学家要大。这个问题也不大。人们关心的是同一个领域的科学家的贡献的大小。如果用H指数来评价同一个领域的科学家的学术贡献，是比较准确的，美国顶级大学的教授的H指数一般比普通大学的教授的H指数高，美国科学院院士的H指数一般也要比顶级大学的普通教授的H指数高，而诺贝尔奖等科学大奖的获奖者的H指数又要比一般的美国科学院院士的H指数高。

这种评价方法因为比较合理，很快流传开去了，被各个大学、科研机构都采用。有一些网站、论文数据库，还会列出某一个人的H指数是多少，因为很容易算。中国也逐渐地采用H指数，中国科研人员也会说他的H指数是多少。

但是，H指数这种评价方法也是有不合理之处的，也有漏洞可利用。第一，在算一个人的H指数的时候，只看论文被引用的次数，不去区分引用是论文作者自己引用，还是别人引用。越来越多的科研人员，特别是在中国，很喜欢引用自己发表过的论文，甚至是大量引用自己发表的论文，就为了让自己论文的被引用次数显得特别高。这样就会导致H指数虚高。

第二，在算H指数的时候，不去看论文有多少作者，以及这些论文作者对这篇论文的贡献的多少。只要是一篇论文的共同作者，不管这篇论文有多少作者，不管这个作者只是挂名的，那篇论文都算是他的了。现在有一些论文共同作者非常多，甚至一篇论文有几百个、上千个作者，往往是一个很大型的项目等很重要的论文，被引用的次数很多，人人都有份，也会导致H指数虚高。

由于存在这些缺陷，而且问题越来越严重，导致H指数的重要性越来越下降了，已经没有那么可靠了。有人提出来，要对H指数进行改造。要去看论文被引用的情况，是别人引用，还是自己引用。要将自己引用的排除掉，不算在引用次数里。其次，要看论文的合作者的情况。一篇论文的引用次数，要主要归给最重要的作者，也就是第一作者和通讯作者（即课题负责人）；其他的作者，分给的引用次数就少一点，甚至没有。

但是，这么区分之后，就对每一篇论文都要具体分析，去看有多少作者，作者的贡献是怎么样的，引用的情况是怎么样的，是自己引用，还是别人引用。这样就变得麻烦了，就不再是一种简单的办法了。

即使采用了这么麻烦的方法，也没法防备有人弄虚作假去拔高自己的H指数。你想要区分自己引用和别人引用？那没问题，很多中国科研人员现在采用的做法是串通起来相互引用，被他人引用次数都升高了。这怎么去区分？一篇论文要只看最重要的第一作者和通讯作者？这也难不倒中国人。中国这十几二十年已经出现了一种趋势，一篇论文的作者有多个共同第一作者和多个共同通信作者。到最后也就变成了一篇论文前面一大堆的共同第一作者，后面一大堆的共同通信作者，没有别的作者了，也是变成了人人有份了。

我在最早向中国介绍H指数的那篇文章最后，已经预言了，H指数也会被中国科研人员玩坏的。不管什么再合理的、再复杂的评价学术的方法，都难不倒中国人去抓它的漏洞。中国人的智慧在弄虚作假方面是无穷的。

2026.5.1.录制

2026.5.8.整理