陈安的博客

评价，不得不做，但可以“排排座，不吃果果”

　　俺们早（至少5年前）就说过：评价，尤其是多指标专家赋权的排队评价，基本上每次评价结果出来，就会很容易地找到一个或多个反例，证明这个评价结果是荒谬的。

　　对于人，对于机构，几乎所有的评价都面临如此困境。

　　那么，究竟哪些评价才能避免这个问题呢？

　　答案是：明确的单指标评价，且有一个公认的度量技术。比如评价人，可以只用身高毫米数来分高矮，这个指标就很清楚。

　　比如：姚明就是比你高，你不服，那就站到人家跟前比比看。

　　可是，你如果要评价谁的篮球水平高——

　　此时把迈克尔-乔丹和姚明拉到一起评价，那姚明大概就不怎么占优了。

　　对于篮球水平这个东西，你会用什么指标来评呢？

　　老王说：应该看进球数和得分数。

　　老李说：应该看本队落后时这个人的表现，能否挽狂澜于既倒。

　　老赵说：得看他所在队得冠军的次数，或者本队胜过对手所在球队的次数。

　　老林说：还是看球员的身价比较合适，这个钱数是做不得假的。

　　如此等等，有更聪明的人出来说，那还是这些指标都拿来吧，综合一下不就全面了。

　　好，我们拿10个指标过来，可是接着就要解决权重设置问题，到底这四个方面是同等重要呢，还是某个更重要些？重要多少呢？

　　这就得弄来若干所谓的专家来合计合计了——这就是专家打分。

　　可是，这一拨专家觉得应该这样，那一拨意见恰恰相反，你准备听谁的？这就有选择专家的问题。

　　如此荒谬的过程，让了解评价内情的人去相信都困难。所以，在很多评价中，我们只能当它是“排排坐”。

　　可是，排排坐可以，你却不能真按照这个排排坐的顺序来确定谁优先吃果果！

　　幼儿园里，在排排坐的小朋友那里，因为大家都能吃上果果，无非是有1分钟的前后次序差异而已，这个没有关系，大家都能等得，且早吃和晚吃一分钟没有本质差别。

　　而现实中非小朋友们的排序之后，却是排到前面的有果果吃，后面的要么是很差的果果，要么就干脆没果果吃。

　　矛盾立刻凸显！那么，大家对于你的这个排队结果就可以去质疑一下了，如果发现其中有明显的反例存在还挺多，有的人还不得跟你急啊，并且抓紧时间嘲笑你一通还算轻的。

　　所以，我主张评价，但是主张在这个基础上一定要增加“申诉”机制。如果大家愿意申诉，则随时提供这样的渠道和答辩机会。

　　记得前段时间徐州师范大学和徐州医学院争夺博士点的授予权，结果，徐州医学院胜出。但是，徐州师范大学不服，不服就申诉，正常渠道不通，于是就申诉到新语丝上去了。

　　最后引起了更大范围的关注——江苏的高等教育管理机构的官员们究竟是干什么吃的？！他们的智商是否在50以下，大家看了公开的申诉之后大可去怀疑一番。

　　当然，现实中在我国的申诉往往是不给你渠道的，或者你去申诉他说收到了，然后用时间老人来把你拖到自己都感到没劲，也算一个解决方式。

　　可是，问题却依然存在，并没有解决或消除。

　　我建议，评价的时候分成档要比一个一个你前我后地评更好一些，人和人，机构和机构，即便有些差异，还能是革命性的？

　　比如，大学排名，更可以按照一档30所（985），二档100所（211），三档500所，四档1500所这样的层次拉开。

　　而我们的大学排名，还是喜欢第一和第二截然分来，哪怕分数差十万分之一呢，而结果最好是我是第一所以获得经费就比你多10个亿。直接将这样的排队结果和“吃果果”挂钩，那自然会带来一大堆的负面影响。

　　我在研究香港RGC资助项目的结果审定时，发现他们只有两档，合格和不合格，要说有的人做得很好，应该分个优良中差才对，或者百分制打一下分数，多清楚啊。

　　老兄，你是上学还没上够吧？

　　我们的基金委则是按照特优，优，良之类来评分，这个特优就可笑得很，我见过几个所谓得到特优评价的项目，主持项目的人抓到下一个方向的课题，这个方向就完全扔了。像这样的项目，给个不合格都可以。

此文于2010年8月19日星期四2:36 am发表于“事论”分类下。您可以通过RSS 2.0 feed来跟踪此文的所有评论。您可以留言，或者从您自己的网站trackback。