原文载于《中国行政管理》2015年第11期第45-49页。
基金项目:山东省社会科学规划项目“政府绩效评估的历史演进和国际比较”(编号:07CZZJ01)
作者:战旭英,山东社会科学院政治学所副所长、研究员,澳大利亚阿德莱德大学人文与社会科学学院客座教授,济南 250002
doi:10.3782/j.issn.1006-0863.2015.11.08
由于中国的政治体制和政府运行环境与西方国家迥然不同,中国的政府绩效评估制度有着非常强的本土色彩。采取的主要形式有:目标责任制、社会服务承诺制、效能监察、党政领导班子实绩考核等。[1]政府绩效评估是一种非正式的制度安排,但是在我国的政治发展过程中却发挥着重要作用,对政府的行为起着引导和指引作用。通过绩效评估使地方官员的行为与政府绩效联系起来,并以评估结果为依据进行奖惩,从而建立起激励和约束机制,使地方政府和地方官员的行为收敛于评估指标,从而贯彻上级政策、促进地方发展。但是正由于它是一种非正式的制度安排,制度设计不完善,制度供给不足,结果事与愿违,产生诸多悖论效果。
一、我国政府绩效评估的制度设计不尽完善,在发展过程中产生诸多悖论效果
(一)指标量化作为政府实现科学管理的一种努力,由于设计和权重配置的不合理导致“选择性关注”倾向及努力配置和资源配置的扭曲
绩效评估制度的核心是指标体系,指标可分为量化指标和非量化指标、弹性指标和刚性指标、职能指标和基础指标等,无论怎样划分,对责任人而言,各项指标的属性和意义是不同的,这决定了他们对这些指标采取的态度与行动是不同的。根据调查,普遍的情况是刚性指标和量化指标在指标体系中占据主导地位,不仅数量多,而且所占权重也更大;而弹性指标和非量化指标数量较少,所占权重也相对较低。
指标的量化实际上是政府实现科学管理的一种努力,量化指标具有可衡量性、明晰性和可比较性,完成如否、完成好坏一目了然,而且其所涉任务一般也具有刚性特征,并直接与责任人的升迁和整个集体的工资、福利等个人激励挂钩,因此在实际工作中更容易引起官员的重视。而非量化指标具有非可衡量性、模糊性和不可比性,不容易评估其产出和结果,其过程也不易监测,因而也难以与责任人的政绩、升迁挂钩,在实践中对这类任务往往不够重视,甚至采取应付的态度。这种现象被美国政治学家詹姆斯·威尔逊概括为“选择性关注”倾向。但这并不意味着这些非量化性任务不重要,有些甚至应该是各级政府的核心工作,在实际工作中却可能被忽视,造成努力配置的扭曲。
绩效评估与资源配置也有着不可分割的关系,虽然资源应该流向效率更高的生产和服务,还是应该转向效益较低的生产和服务以求改善,也就是奖赏成功还是弥补失败,在政治上的抉择是困难的,但毋庸置疑,在市场尚不能发挥配置资源决定性作用的情况下,政府在资源配置中发挥着重要作用,政府的关注度决定着资源的流向,因而努力配置的扭曲势必导致资源配置的扭曲。实践中,各级政府过度重视经济指标,片面重视可衡量的数量化指标,必然意味着对其他民生和社会指标的轻忽,对社会公平、社会福利环保、节能等可持续发展等的轻忽。
与私人部门主要追求利润最大化目标不同,政府具有多任务性,目标具有多样性,是多维度的综合体,除了追求效率和经济目标外,还需要追求社会公正、收入平等、环境保护、公共服务质量等其他目标,这些目标或任务存在着模糊性,孰轻孰重很难进行权衡,这就造成对不同任务、不同指标进行权重设置的困难。权重设置决定着指标的重要性和官员努力方向,并有着放大效应,设置不当会进一步加剧选择性关注倾向以及努力配置和资源配置的扭曲。
(二)基于偏好替代设计的指标体系在改革开放初期有一定的合理性,但体现的是评估方和上级领导的偏好,而非公众的偏好
作为委托人的全体公民或各个利益集团,其偏好是异质的,容易发生改变的,偏好结构是多样化的,而且根据阿罗不可能定理,将每个个体表达的先后次序综合成整个群体的偏好次序在绝大多数情况下是不可能的,因此公众的偏好显示是缺乏的。同时,我国的政府绩效评估采用的是自上而下、集中化的方式,上级机关控制着评估的全过程,从目标的设立、指标的设计和分配、到评估方法和评估结果的使用,都由上级机关决定,选择了上对下的评估角度,存在着单向性和不平衡性,被评估机构和公众、专家及第三方的参与明显不足。在公众偏好显示缺乏、上级组织掌握评估权、指标设置集中化的情况下,就会出现以上级组织的偏好、以GDP等经济指标偏好代替公众的偏好。这种基于偏好替代设计的考核指标更多体现了评估方和上级领导的偏好,难以真正反映公众的关切,评估缺乏社会相关性。
在改革开发初期,这种偏好替代有其合理性,因为当绝大多数人的温饱问题还没有解决的时候,经济发展、收入提高和生活改善当然是人们的最大需求。随着改革开放的不断深入,人们的偏好和需求也会趋于多元,这种多元化的偏好结构如何传导给政府公共服务部门和决策机构是中国政府治理面临的挑战。目前是掌握任免权的上级政府对下级政府进行评估,这种制度加强了地方官员对上级的回应和责任,却无法保证他们对公众偏好和需求做出有效的回应,使他们更重视上级的满意而不是公众的满意。
(三)相对绩效评估可以剔除干扰因素,增加评估的精确度,但在大国模式下可能是一种次优的考核方式
每年年底,上级政府会通过考核,对下级政府和部门进行排名,并根据排名进行晋升和其他奖惩激励,这是一种相对绩效评估。根据契约理论,它的好处是,当多个代理人从事的任务中涉及某种共同的未被观察的因素,比较代理人的相对绩效可以剔除这些共同因素的干扰,增加评估的精确度。但是这种制度正日益显现出它的弊端,譬如相对绩效评估会造成代理人之间相互拆台的恶性竞争,某些地方政府甚至为了在GDP竞赛中取得领先地位不惜采取以邻为壑的手段,最典型的是地方保护主义,以及由此造成的市场分割、地区分割和诸侯经济等,这些问题不仅制约地区分工和专业化水平,阻碍技术进步和制度变迁,而且损害我国长远的经济发展和国际竞争力。
相对绩效评估发挥作用的前提是代理人面临的冲击或风险是共同的,但是在中国这种大国模式下,各地区初始禀赋包括自然资源、历史人文、社会习俗、经济发展程度等的差异性、享受改革政策的差异性,会出现收益递增效应导致的经济增长差异,贫穷地区会相对越来越穷,而富裕地区则会相对越来越富,这就加大了相对绩效评估的噪音,上级政府很难区分各地的经济增长是收益递增机制造成的,还是地方政府努力的结果。由于富裕地区更多享受着先天自然优势、后天政策优势和收益递增机制的好处,使得经济落后地区的官员不能在相对绩效评估的机制下获得晋升激励。官员也是理性人,在晋升几率较小的情况下,会进行逆向选择,寻求替代办法,如贪污腐败等。
(四)基于考核的晋升锦标赛表面上实现了“激励相容”,实际上却造成“为增长而竞争”
当评估不可避免地与地位、荣誉、晋升或收入联系在一起时,指标体系的设计实际上成为奖惩激励体系的设计。上级组织主要根据经济增长来考核和提拔下级官员,因此下级官员有强烈的冲动推动经济发展,以求获得政治上的升迁,这就形成了实际上的晋升锦标赛。晋升锦标赛是指上级政府对多个下级政府的行政长官设计的一种晋升竞赛,竞赛优胜者获得晋升,竞赛标准由上级政府决定,它可以是GDP增长率,也可以是其他可度量的指标,它的主要特征是参赛人的相对位次而不是绝对成绩决定最终的胜负,因而易于比较和实施。晋升锦标赛是一种将行政权力集中与强激励兼容的政府官员治理模式,在上级拥有集中的人事权力、有可衡量的客观竞赛指标、相对竞赛成绩可分离和可比较、参赛官员可以控制和影响最终结果(主要涉及被考核指标与参赛人努力之间的关联是否足够大)、参与人不宜形成合谋等条件下,可以有效地实施[2],中国的绩效评估制度和官员任命制正可以满足这些条件。在一定条件下(譬如参赛人的风险倾向是中性的),锦标赛可以取得最优的激励效果。
这种官员晋升与地方政府政绩相联系的制度把地方官员的个人利益和地方经济增长联系起来,表面上看,实现了哈维茨所概括的“激励相容”。其最大收益是在地方政府之间引入了竞争机制,地方政府间的行政竞争推动了地区间的经济竞争,但是,这种行政竞争具有零和博弈性质,其推动的经济竞争一方面可以促进经济的发展,另一方面也会导致“为增长而竞争”,出现地方保护主义、重复建设等各种无序竞争、恶性竞争,有些地方官员甚至不惜一切代价,不惜违反劳动法和环境保护法,上马一些对资源、环境破坏严重、甚至危及子孙后代的项目,急功近利,竭泽而渔。
二、政府绩效评估悖论的形成有着深刻的观念原因、制度原因及个人原因
(一)过度依赖绩效合法性,过度重视经济增长对政府合法性的支撑
迈克尔·罗斯金在其《政治科学》中指出,政府获得合法性的途径之一是良好政绩的取得和维护。[3]改革开放以来,中国共产党执政的合法性很大程度上来自于政绩支撑,而且这种政绩更多是经济方面的,其潜在逻辑是:经济增长可以保障执政党的执政地位。这种潜意识导致各级政府对经济发展、经济增长的过度重视,反映在绩效评估上就是对经济指标的过度重视,由此也导致政府对经济的过度干预、对民生和社会问题的忽视等问题。2010年前,我国保持了很多年两位数的经济增长速率,经济的发展对于保持社会稳定、提升执政党的合法性和公信力发挥了重要作用,但是受制于资源和环境承载力的制约,这种政绩观指导下的依靠政府投资带动的经济增长和发展不可避免地会造成资源浪费和生态环境的恶化,难以长期持续。同时,随着社会的发展单纯经济绩效不能满足社会的需要,在温饱问题解决后,民众自然会对社会公平、社会福利、环保等问题有更多的关注,对政府有更多的期望,这些都应该反映到绩效评估之中,通过绩效评估的导向作用,促使政府更多地关注这些问题。
(二)绩效指标与组织使命、政府职能悖谬甚至冲突
政府绩效评估必须严格围绕组织使命和法定责任,绩效目标必须与组织使命保持高度一致,指标的设计必须与组织任务高度相关。然而在实践中,绩效指标与组织使命和任务脱节甚至冲突的情况时有发生。譬如:环保监察的目的是为了改善环境质量,但环保部门确定罚款额指标、评估排污费征收率的做法却实际上给企业传达了一个错误信息,即足额交纳排污费后就可以放心排。这不是目标主次位置的颠倒,而是目标对使命的错位,在这种情况下,绩效评估不仅不能实现管理的改善,反而会成为组织使命和核心价值实现的障碍。
政府绩效评估是针对某一级政府或某一个政府部门的某一项或几项职能的,因此,开展绩效评估的前提是科学认识、合理界定政府职能,只有这样,才能准确把握其绩效内涵,设计出科学合理的绩效指标。过去,我们片面强调政府的经济职能,导致在设计指标体系时过分注重经济指标、忽视其他社会指标,造成政府片面追求GDP和经济增长率,忽视社会公平、社会福利等问题。或者,由于对政府职能内涵把握不准,在政府角色错位、越位的基础上实施绩效评估,对一些政府“不该管”、“管不好”的事项进行评估,不仅不能改善相关工作,实际上还是一种误导和浪费,导致政府努力配置和资源配置的扭曲。
(三)作为理性人的政府官员会选择有利于提高自己的政绩和升迁的行为
根据理性选择理论,政府官员也是理性人,会以理性的行动来满足自己的偏好,并使效用最大化。在地方政府及其部门中,晋升是组织成员孜孜追求的核心目标之一,因而围绕晋升选择有利于提高政绩和升迁的行为是其必然的理性行为。改革开放以来的中国现代化是地方政府主导的现代化,在绩效评估过程中经济发展尤其是GDP及经济增长率指标成为衡量政府绩效的必选指标。在绩效评估的导向下,根据理性人原则,为了在较短的任期内快出成绩获得提拔,地方官员自然会选择则优先发展经济,由此导致片面追求GDP和经济增长速度,采取投资主导的急功近利的发展模式,“形象工程”、“政绩工程”泛滥,地方政府公司化,从守夜人角色一夜变成经济活动的主角。更严重的是,这不仅是各级地方政府的普遍选择,而且成为上级组织选拔任用干部的主要标准。新加坡学者邓永恒对中小城市官员升职概率与GDP增长的关系进行了实证研究,如果市委书记和市长任期内的GDP增长速度比上一任提高0.3%的话,升职概率会高于8%,如果任期内把钱花在民生和环保上,那么他们升官的几率是负值。[4]
(四)评估的民主性和开放性不足,被测评机构、被评估对象的相对人和公众的参与意愿不足,渠道匮乏
在评估过程中,通过公众参与,不仅将事实(资料数据)和价值观(公众感觉)结合起来,从而增加了绩效评估的社会相关性,而且为公众提供了评价政府、影响政府、进而改进政府的机会。[5]但是,在我国的实践中,一方面由于社会公众主观上监督政府工作的意识淡薄,参与意愿不足,客观上也不容易获取有关评估对象的必要信息,而且现实的评估体系对服务对象的意见重视程度有限,使得社会公众难以参与,即便参与也难以真正发挥作用。另一方面,参与渠道有限,仅在某些城市譬如沈阳、珠海、南京等开展了公民评议政府的活动,即以公众为主体对政府绩效进行评价,并将结果用于绩效的持续改善。这些公民评议政府的活动,开创了我国地方政府“自下而上”绩效评估的先河,是对我国传统的“自上而下”评估模式的有益补充,但是其范围还有待拓展。问题的关键是没有树立起绩效评估公众导向的理念,没有建立起公民参与的有效机制,没有有效措施保障公众参与渠道的畅通,因此公民对政府绩效的知情权、评价权和监督权难以落到实处。
(五)绩效评估目标错位,注重的是评估本身,而非绩效的改善,存在着为评估而评估的倾向
在我国,由于权力结构的集权化,绩效评估的实施过程更多的是对上级领导号召的响应,对于被测评机构而言,绩效评估只是外力强加的一种活动,将这一实践内化为机构内部管理工具的可能性较小,因而难以建立起真正有助于推进绩效评估和绩效管理的文化。在实践中往往表现为形式主义,为评估而评估,没有真正把评估和改善政府绩效,改善政府管理联系起来。因此,虽然很多地方制定了非常详尽的依据评估结果进行奖惩的措施,但是,却忽略了评估的根本目的:通过评估了解公众的需求和期望,寻找公众的需求和期望与政府所提供服务之间的差距,努力改善服务,缩小和消除这种差距,提高政府绩效,使公众真正满意。
三、观念转变与制度协调:完善政府绩效评估制度的关键
(一)破除GDP崇拜和高增长率的迷思,拓展合法性来源,使公众满意成为政府绩效评估的终极目标和政府合法性的新来源
哈耶克认为,高增长率有时候只能够证明人们在过去采纳了糟糕的政策,法律和制度方面的桎梏阻碍了人们有效使用资源,而不能证明他们现在执行的政策很英明。[6]我们现在持续增长的GDP和连续多年两位数的增长率是改革开放打破计划经济的桎梏、解放生产力的结果,也取得是高投资、高污染、高能耗换来的,是因为我们“采纳了糟糕的政策”。根据测算,我国的经济增长中,至少有18%是依靠资源和生态环境的透支获得的。我国单纯的经济增长战略、对GDP和高增长率的过度追求,导致越来越严重的结构失衡、环境污染负债、生态赤字和资源损耗、资源短缺等问题。在政府绩效评估中去除GDP指标,消除GDP崇拜,已经成为从中央到地方各级政府的共识,但是在地方各级政府领导的潜意识中GDP和经济增长率仍然是他们关注的重中之重,因为绩效评估多年来强调经济指标造成的思维定势和行为惯性不是一朝一夕可以改变的。
约翰·洛克曾说,“政治正当性来自被管治者的同意”,当今政府合法性的最普遍来源是实行民主政治和顺应民意,顺应民意公众才会满意,公众满意应成为政治合法性的新来源,而且应成为绩效评估的终极目标。在调查中我们发现有些地方没有设置公众满意度指标,官员更在乎的是发展经济让上级领导满意,而不是改善民生给公众带来实惠和满意。这是因为在相对集中的政治与权力结构下,下级官员通常对上级的意志较为敏感,在提供公共服务时,更为重视的是掌握绩效评估权的上级领导的满意度,而不是社会公众的满意度。[7]而且他们认为不能让老百姓对改善民生有太高的期望,期望值太高会降低他们的满意度。顾客(在西方,公众被视为接受公共服务的顾客)满意可以被解释为顾客接受服务的质量和期望得到的服务质量之间算术上的不同。[8]人的期望是主观的,是以从前的经验为基础的,是易于被操纵的。通过提高服务质量和降低人的期望两种方法,公众满意度可以实现可操控。要真正提高公众满意度,需要切实提供更好的服务,实现并增进公共利益,而非人为压抑公众的需求和期望,其关键在于确立公众满意是绩效评估的终极目标。
(二)在合理界定政府职能的基础上进行绩效评估,通过绩效评估进一步界定政府职能
政府绩效评估是指向某一级政府或某一个政府部门所具有的特殊职能的,它必须建立在职能明确、边界清晰的基础上,绩效评估与政府职能有着相互界定、相互促进的关系。一方面,绩效评估使政府职能进一步具体化、使制度转化为现实秩序。绩效评估有自己的评估指标体系与绩效等级划分标准,指标体系所包含量的规定性,即政府在其职能范围内做了多少(是不是职能范围内应做的事都做了),和质的规定性,即政府是如何提供公共服务的,结果如何(是否符合职能规定性、符合公众的需求),这两方面内容都是政府职能的具体化或具体体现。可以说,政府职能是一种制度的规定性,绩效评估使制度转化为具体的管理行为。
另一方面,绩效评估决定着政府角色和政府职能的内容,并促使政府根据社会发展的要求和公众的需求提供和改善公共服务。通过绩效评估,各个公共服务机构的绩效得以披露,可以引导公众做出选择,从而对政府机构形成压力,迫使他们完善服务内容、提高服务质量和效率;通过绩效评估,使公共服务供给部门包括政府公共部门、私营部门和非盈利部门展开竞争,如果私营部门和非盈利部门等第三方的绩效更佳,可以通过承包或合同转租等方式把这些职能转移出去,把政府“管不好”的事情剥离出去,进一步界定政府的职能。这样,可以创造市场动力、提高服务质量、增加顾客选择的机会以更好地满足顾客的需要。
(三)建立以结果为导向的评估机制
Q·威尔逊认为政府绩效评估意味着这样一种制度设计:在该制度框架下以取得的结果而不是以投入要素作为判断政府公共部门的标准。结果指标也称效能指标,它报告项目和服务的结果,表示产品和服务的结果或对服务对象和社会的影响,是对目标达成程度、需求得到满足程度以及预设目标实现程度的测量。[9]传统政府管理的特点之一是忽视结果,关注的焦点是投入要素,以政府活动的数量和规模作为判断其工作绩效的标准,忽视这些活动所产生的实际效果。我国的绩效评估,投入和过程导向依然是其特征之一。以治理超载为例,出动了多少次警力,设立了多少个检查站,发现并处罚了多少违规车辆等, 都是成绩汇报的着力点,而车辆超载的情况是否有所改善则湮没在上述指标中。建立以结果为导向的评估机制,可以促使政府更关心其组织使命和目标的实现,以及公民的满意程度,从而建立高效率、高效能和群众满意的政府。
(四)建立评估的全方位开放机制
目前通行的“指标体系模式”的评估方法是建立在量化技术基础之上的,评估本身的技术成本是极其庞大的,任何一个新指标的纳入和任何一个指标权重的变化都会导致量化因果关系的松弛和解体,而且这种封闭的指标体系与开放的、差异性的经济社会割裂开来,越来越细化的指标体系却离公众的感知越来越远,评估的社会成本也巨大。而“发展模式”(简言之,即评估既要看基础,也要看发展)和“环境模式”(简言之,即评估要依据环境因素、资源条件、功能定位、产业布局等分类进行),是将经济社会发展的外部因素纳入政治系统,这实际上是一种开放的思路,但是还不够。
建立评估的全方位开放机制应涵盖全过程:1.建立指标设计公开征询机制。指标设计过程要公开、透明,征询被评估方、被评估方服务对象、公众和专家的意见,避免被评估方的偏好和领导的个人好恶左右,使指标体系更具有社会相关性,从而增加评估的社会影响。2.建立外部责任型评估,通过公众、专家和第三方的参与使内部评估转变为外部评估。我国的政府绩效评估属于内部评估,评估的是所谓“成绩”,缺少的是对官员的质询和问责,公众参与、公众反馈就是着眼于外部问责,不问你做对了什么,而是追问你做错了什么,这种对抗性的评估才真正有助于建立广泛的公共问责机制,实现民主监督。3. 评估主体多元化,建立多元评估机制。目前,评估多由组织部门负责,评估部门化,而且主要是“内部评估”,外部评价较少,评估实际上是内部的自身改造。应增加评估的开放性,某些方面可以由独立的第三方机构和专家承担,他们是中立和不受政策效果影响的,而且具有很强的专业性。4.建立评估的民主机制,增加评估的民主性。变民众的被动参与为主动参与,变部分参与为全程参与,从指标体系的设计、评估方法、评估程序到评估结果的使用,重要的是破除体制障碍,通过制定法律法规保障公众的参与权利和参与渠道的畅通。通过公众满意度、居民幸福指数等指标的纳入,建立感受传递机制。公众通过对可以感知的政策结果作出价值判断,并通过民主程序传达给政策系统,达到改进政府工作的目的。5. 评估方法科学化,建立同类竞争机制。根据不同的经济实力、环境条件、区域特色、功能定位、产业布局等情况进行科学分类,实行分类评估制度,同类竞争,分别排序。6. 合理、规范运用评估结果,建立科学的结果使用机制。运用评估结果贯彻上级政策、引导和促进地方发展。