*本文系教育部人文社科基金“数据挖掘视域下我国县(市)政府绩效评估指标筛选研究”(编号:09YJC630126)、国家社科基金重大项目“幸福指数导向下我国政府绩效评估体系研究”(编号:11&ZD057)、江苏高校社科基金“县级政府绩效的公民满意度测评:面向江苏的探索性研究”(编号: 2010SJB630040)的阶段性成果。
[摘要]我国地方政府绩效评估出现了模式泛滥的局面,但政府绩效却依然不够理想。通过对42种模式指标体系的“直感强度”、“直感强度离中度”、“真实强度”、“真实强度离中度”的聚中、离中分析,我们发现这些模式的指标体系差别不大,只是在政治领域指标的设置上“模式”特色稍显鲜明,也有部分模式以个别指标的跳跃性赋权来彰显“模式”特色。基于这些发现,我们建议可以从国家制定共通性指标、各地依地方管理特色构造本地绩效评估指标、推行客观绩效数据挖掘以淡化“人为塑造”的痕迹、推进审议绩效评估等方面着手来破解模式“多样”但绩效依然低下的难题。
[关键词]绩效评估;地方政府;离中度
[中图分类号]D035[文献标识码]A[文章编号]1006-0863(2012)11-0018-07
一、引言
目睹西方国家政府绩效评估取得的巨大成功,我国逐渐加大了引进力度。据《中国人事报》调查,早在2007年,全国已经有三分之一的省(区、市)开展了与政府绩效评估相关的工作。2008年2月23日中央政治局第四次集体学习会上,胡锦涛总书记指出,要“推进以公共服务为主要内容的政府绩效评估和行政问责制度”,强调了要将政府绩效评价作为一项基础制度来予以推进。2010年7月20日,经中央纪委书记办公会批准,中央纪委监察部绩效管理监察室正式组建。2011年3月10日,国务院批复建立政府绩效管理工作部际联席会议制度,这标志着我国政府绩效评估的实践又跃升到了新的层面。随着这一系列改革的推开,我国政府绩效评估实践逐渐走向全国,在全国范围内初步形成了各种政府绩效评估“模式”。
以历史眼光来看,我国地方政府绩效评估的模式探索早在改革之初就已开始,在探索中形成了岗位责任制、社会服务承诺、效能监察、效能建设等各种形式。[1]当前,随着从国家层面开始推进政府绩效评估,全国出现了更多的“模式”,甚至可以说是“模式纷呈”,如“连云港模式”、“思明模式”、“兰州模式”、“北京模式”、“岳阳模式”,等等。应该看到,虽然 “模式”颇多,但地方政府绩效状况仍然不能令人满意。2010年,某公司曾调查了亚洲12个国家与地区的政府绩效状况,发现中国大陆地方政府仅以793的效率值排名第八,效率最高的新加坡效率值是我国的313倍。[2]唐任伍、唐天伟课题组通过对2000—2009年间不同区域政府效率的测度也发现,在我国东、中、西部的地方政府中,过去十年间中部、西部的行政效率相对都有所降低,东部地区的政府效率提升也不大。[3]与我国地方政府绩效低下相映成趣的却是各地绩效评估模式名目日益繁多,似乎每个地方都在通过绩效评估来改进绩效。这实际上是一种“模式割据”现象,每个地方只要推行绩效评估,总会冠以与其它地方不同的名号,尽管各地的治理情况并无太大区别,但每个地方却要重复再搞一套,这可说是政府管理改革中的“重复建设”问题,它造成了人力、物力、财力的浪费,阻碍了各地在政府绩效评估中的协同共进。
我国地方政府的绩效评估实践中的模式割据源自于改革初期,刚开始时主要是一些政府绩效评估的萌芽模式,如岗位责任制、效能监察、效能建设、社会服务承诺等,这一时期大约从改革开放始到1999年左右;中间割据时期是绩效评估规范化时期,主要有公民满意评价、第三方评价、电子政府绩效评价等形式,该时期大约从1999年到2007年;之后的时期可以界定为“模式多元割据”时期,这一时期涌现出了大量五花八门的模式,我们认为,目前已经到了需要进行一定的梳理和反思的时候了。
二、判断指标模式的标准
地方政府绩效评估模式割据的形成有其必然性。我国幅员辽阔,各地方政府在行政区划规模、地理位置、环境气候、经济发展水平、交通通讯、民族和文化背景等方面都存在较大差异,这种异质性自然会影响到各个地方政府在绩效评估改革中的探索。同时,这种绩效评估的模式割据又与主观因素密不可分。随着地方竞争的加剧,每个政府都希望突出自己的特色,彰显自己在管理创新中的政绩,哪怕两种并无二致的政府绩效评估,也要取不同的名称。本文的意图是探究这种模式割据的本质到底是什么,它是受客观条件的约束形成了确实不同的模式,还是人为地将本身并无多大区别的内容冠之以不同的模式称谓。如果属于前一种情况,则我们认为割据自有道理,而如果属于后一种情况,则是一种政府管理改革领域的“重复建设”。
判断异同,首先需要评判标准。从评估学角度来说,政府绩效评估是一个完整的过程,包括评估价值厘清、指标体系设计、依据指标体系获得证据数据、计算证据数据获得结果等环节。其中,绩效评估指标体系设计是最为重要的环节,它是绩效评价与绩效管理的“指挥棒”、“评判表”。[4]政府绩效评估能否有效地发挥其作用往往依取决于指标的科学性、合用性。正是从这个意义上来说,绩效指标代表了绩效评估的不同价值取向,有什么样的指标导向,就产生什么样的绩效评估,绩效指标就是判断绩效评估模式的标准。尼古拉斯·亨利曾指出: “由于评估者的偏见,评估标准模糊不清……公共部门绩效评估的可靠性和权威性受到影响。”[5]他所强调的标准问题,实际就是绩效评估指标问题。
地方政府绩效评估指标不仅是政绩评估的内容和标准,而且是地方政府的职责,是地方政府存在的依据。上级政府的绩效导向并决定着下一级政府的工作方向,是下级政府开展工作时必须遵循的行为准则,各级地方政府均需按照上级政府制定的绩效考核指标来安排本地的工作重点和发展重心。[6]由此可见,指标是地方政府绩效评估的灵魂,通过指标可以看出地方政府绩效评估的本质。正是基于这种判断,本研究计划从解构指标的视角来判断我国各类模式的本质,寻找它们的异同,为避免重复建设、切实提升地方政府绩效找到合适的路径。由于无法获得模式割据中的所有模式,我们只能采取“管中窥豹”的方式选择其中一部分来做典型研究,这也符合抽样统计的原则。
三、模式泛滥的实质
地方政府绩效评估模式繁多,无法在一篇论文中穷尽所有,在选取研究对象的过程中,我们主要撷取了获得过“中国地方政府创新奖”、参评过“中国地方政府创新奖”,或者被《中国政府绩效评估报告》推荐学习的42种模式,它们来自于东北、华北、华东、华中、华南、西南、西北7大区域。需要说明的是,每个地方政府并非只有一种绩效评估模式,它们为了凸显市、县、区与各类职能部门、开发区政府等的区别,开发了不同的模式。按照统计学原理来说,超过30个样本的抽样数据一般都会呈正态分布,对其进行研究能够发现一般性规律,[7]这些数据也能够使我们发现地方政府绩效评估模式割据的一般性规律。
从收集到的样本而言,多数“模式”都将指标体系层层分解,形成了从一级指标(指标维度)、二级指标(基本指标)到三级指标(具体指标)的三层逻辑指标体系。就评估学原理来说,在三级指标体系中,具有实质意义的只是三级指标,它们是真正有证据数据(Evidence Data)支持的评估工具,而一级指标与二级指标只具有类别的意义,更多地用来为评估之后的报告撰写做分类汇报之用。要分析指标的本质取向,只需要分析三级指标即可。本文正是基于这种判断,选取了42个模式的三级指标作为研究对象来探究不同模式的本质。
在审读、初步统计了所有指标的基础上,我们发现政府绩效评估指标主要聚焦在政治、经济、社会、文化、人民满意、资源环境、一票否决、加减分项目8个领域,为了考察这些指标的本质,我们决定从共性最大的这8个领域对抽选的42种模式的三级指标进行分析,这遵循了科学研究中“可比性”原则与“最大相似性”原则。[8]就收集到的模式而言,它们的指标都是这8个领域的真子集,单个模式的指标领域都没有超越这8个类别。表1是我们梳理的42种指标的具体解构情况。
为了探究这些指标所蕴含的不同模式的本质与区别,我们将表1中的资料作了变量化处理,形成了4个可计量不同模式异同的变量,即指标的“直感强度(ZG)”、“直感强度离中度(ZD)”、“真实强度(ZS)”、“真实强度离中度(ZL)”。
“直感强度(ZG)”是指特定模式下特定指标领域指标的设计数量,也就是人们看到指标之后直接感觉到该领域中指标的强度(数量强度),比如在辽宁模式中的“政治指标”领域内共有“政府能力建设”、“依法行政”、“政府效能建设”等6个指标,则该模式的“政治指标”的“直感强度(ZG)”就等于6。“直感强度离中度(ZD)”是指特定模式下的某个指标领域内指标的直感强度与我们考察的所有模式中有数据支撑的所有本领域中指标的“直感强度”均值的差,其计算公式为:ZDi=ZGi-1nni=1ZGi(n∈R+,n≤42),它表示特定模式中该指标域指标的直感强度与所有有数据支撑的模式的相同域的平均直感强度的差距之所以此处提出“有数据支撑的模式”是因为有一些模式中没有明确区分指标域内的具体指标,或者有的只区分了部分,另外的只有笼统、模糊的说法,比如贵州模式除了明确“政治指标”域有40个指标,其他都一句话笼统带过。,其度量了单个模式中该领域与所有模式中该领域平均趋势的偏离程度。偏离均值越多,说明该模式的该指标域特色越鲜明,“模式”特性就越强。“真实强度(ZS)”是指特定模式下特定指标领域的权重,比如在辽宁模式中,“政治指标”的指标域的权重为“95分”,它就是该指标域的“真实强度”。本研究在计算过程中对百分比制的权重直接采用了原始值,对非百分比制的权重做了百分比化的处理,比如辽宁模式中“政治指标”的真实强度值=95/(95+425+285+50+70+45)*100%=98%。 “真实强度离中度(ZL)”是指特定模式下的某个指标领域内指标的真实强度与我们考察的所有模式中有数据支撑的所有本领域中指标的“真实强度”均值的差,其计算公式为:ZLi=ZSi-1nni=1ZSi(n∈R+,n≤42),它表示特定模式中该指标域中指标的真实强度与所有有数据支撑的模式的相同域的平均真实强度的差距,其度量了单个模式中该领域与所有模式中该领域平均趋势的偏离程度。偏离均值越多,说明该模式的该指标域特色越鲜明。
编号
|
模式
|
政治指标
|
经济指标
|
社会指标
|
文化指标
|
人民满意
|
资源环境指标
|
一票否决
|
加减分项目
|
||
1
|
辽宁模式
|
政府能力建设、依法行政等6个
|
沿海经济带建设等23个
|
办学条件改善、住房保障等17个
|
文化体改和产业发展等2个
|
农村扶贫开发、农民人均纯收入等6个
|
人工造林、海洋环境治理等8个
|
0
|
加分共4个;减分:共10个
|
||
95分
|
425分
|
285分
|
50分
|
70分
|
45分
|
0
|
0
|
||||
2
|
福建模式
|
抽象行政行为合法率等15个
|
人均GDP 增长率等24个
|
出生人口政策符合率等31个
|
城镇居民人均文化娱乐费支出等4个
|
城镇居民人居可支配收入增长率等2个
|
单位GDP能耗比上年下降等10个
|
0
|
0
|
||
150
|
380
|
310
|
30
|
40
|
110
|
0
|
0
|
||||
3
|
百色模式
|
反腐倡廉宣传教育、效管理工作等30个
|
地区生产总值、税收收入、等32个
|
水利基础设施建设、教育专项工作等29个
|
0
|
0
|
耕地保护与利用、城乡清洁工程等10个
|
人口与计划生育工作责任制等3个
|
获得国家级表彰一次加2分等4个
|
||
权重虽有但数据不详
|
|||||||||||
……
|
……
|
……
|
……
|
……
|
……
|
……
|
……
|
……
|
……
|
||
……
|
……
|
……
|
……
|
……
|
……
|
……
|
……
|
||||
40
|
广东模式
|
政府网站绩效得分等3个
|
GDP增长率等11个
|
教育经费占GDP比重等13个
|
人均文体与传媒支出增长率等2个
|
城镇居民人均可支配收入等18个
|
工业固体废物利用率等10个
|
0
|
0
|
||
5.9%
|
23.5%
|
24.2%
|
3.2%
|
28.2%
|
15%
|
0
|
0
|
||||
41
|
厦门模式
|
国防动员综合考评、应急管理等28个
|
GDP增长率、GDP对全市贡献率等20个
|
出生人口政策符合率、学前教育等23个
|
财政文化事业经费投入增长率
|
社会治安满意率
|
环境质量、污染控制等7个
|
0
|
0
|
||
权重虽有但数据不详
|
|||||||||||
42
|
贵州模式
|
规范行政执法自由裁量权等等40个
|
不详
|
不详
|
不详
|
不详
|
不详
|
不详
|
不详
|
||
权重虽有但数据不详
|
表2 不同模式指标强度、离中度统计
|
||||||
编号
|
模式
|
指标领域
|
ZG
|
ZD
|
ZS
|
ZL
|
1
|
辽宁模式
|
政治指标
|
6
|
-4.86
|
9.8%
|
-24.65%
|
经济指标
|
23
|
17.25
|
43.8%
|
18.60%
|
||
社会指标
|
17
|
11.18
|
29.4%
|
7.05%
|
||
文化指标
|
2
|
1.40
|
5.2%
|
1.97%
|
||
人民满意
|
6
|
4.20
|
7.2%
|
-2.61%
|
||
资源环境指标
|
8
|
4.90
|
4.6%
|
-4.66%
|
||
一票否决
|
0
|
-0.44
|
0
|
-13.33%
|
||
加减分项目
|
0
|
0.00
|
0
|
0.00%
|
||
2
|
福建模式
|
政治指标
|
15
|
4.14
|
14.7%
|
-11.75%
|
经济指标
|
24
|
18.25
|
37.3%
|
12.10%
|
||
社会指标
|
31
|
25.18
|
30.4%
|
8.05%
|
||
文化指标
|
4
|
3.40
|
2.9%
|
-0.33%
|
||
人民满意
|
2
|
0.20
|
3.9%
|
-5.91%
|
||
资源环境指标
|
10
|
6.90
|
10.8%
|
1.54%
|
||
一票否决
|
0
|
-0.44
|
0
|
-13.33%
|
||
加减分项目
|
0
|
0.00
|
0
|
0.00%
|
||
3
|
百色市模式
|
政治指标
|
30
|
19.14
|
NS
|
NS
|
经济指标
|
32
|
26.25
|
NS
|
NS
|
||
社会指标
|
29
|
23.18
|
NS
|
NS
|
||
文化指标
|
0
|
-0.60
|
NS
|
NS
|
||
人民满意
|
0
|
-1.80
|
NS
|
NS
|
||
资源环境指标
|
10
|
6.90
|
NS
|
NS
|
||
一票否决
|
0
|
-0.44
|
NS
|
NS
|
||
加减分项目
|
0
|
0.00
|
NS
|
NS
|
||
…
…
|
…
…
|
……
|
……
|
……
|
……
|
……
|
40
|
广东模式
|
政治指标
|
3
|
-7.86
|
5.9%
|
-28.55%
|
经济指标
|
11
|
5.25
|
23.5%
|
-1.70%
|
||
社会指标
|
13
|
7.18
|
24.2%
|
1.85%
|
||
文化指标
|
2
|
1.40
|
3.2%
|
-0.03%
|
||
人民满意
|
18
|
16.20
|
28.2%
|
18.39%
|
||
资源环境指标
|
10
|
6.90
|
15%
|
5.74%
|
||
一票否决
|
0
|
-0.44
|
0
|
-13.33%
|
||
加减分项目
|
0
|
0.00
|
0
|
0.00%
|
||
41
|
厦门模式
|
政治指标
|
28
|
17.14
|
NS
|
NS
|
经济指标
|
20
|
14.25
|
NS
|
NS
|
||
社会指标
|
23
|
17.18
|
NS
|
NS
|
||
文化指标
|
1
|
0.40
|
NS
|
NS
|
||
人民满意
|
1
|
-0.80
|
NS
|
NS
|
||
资源环境指标
|
7
|
3.90
|
NS
|
NS
|
||
一票否决
|
0
|
-0.44
|
NS
|
NS
|
||
加减分项目
|
0
|
0.00
|
NS
|
NS
|
||
42
|
贵州模式
|
政治指标
|
40
|
29.14
|
NS
|
NS
|
经济指标
|
NS
|
NS
|
NS
|
NS
|
||
社会指标
|
NS
|
NS
|
NS
|
NS
|
||
文化指标
|
NS
|
NS
|
NS
|
NS
|
||
人民满意
|
NS
|
NS
|
NS
|
NS
|
||
资源环境指标
|
NS
|
NS
|
NS
|
NS
|
||
一票否决
|
NS
|
NS
|
NS
|
NS
|
||
加减分项目
|
NS
|
NS
|
NS
|
NS
|
The Paradox of More Performance Evaluations but Less Performance Achievements in Local Government: A Probe into 42 Evaluation Models in China
Shang Huping Zhao Panpan
[Abstract]In China, local government performance evaluations have evolved into a “model colonization” situation, and there are a lot of local governments who claim that they have already developed many new “models” of performance evaluation though they still remain in low efficiency. We probe into 42 “models” of performance evaluation in varied local governments to find that judged by the statistic results of “straight sense strength”, “distance between straight sense strength and the mean”, “real strength”, and “distance between real strength and the mean”, the models have no obvious differences in spite of the propagandas on how different the models are. On the basis of the findings, we propose to develop common indicators by the state level authorities, prepare special management modes according to local structures, implement performance data mining to weaken “artificial shaping” influences.
[Keywords]performance evaluation, local government,distance between strength and the mean
[Authors]Shang Huping is Associate Professor at School of Management, Lanzhou University; Zhao Panpan is Master Candidate at School of Management,Lanzhou University. Lanzhou 730000