基金项目:教育部哲学社会科学研究重大课题攻关项目“中国地方政府绩效评价体系与管理机制研究”(05JZDH0019);教育部人文社科重点基地重大项目“组织绩效评估的应用与正确政绩观的树立”(05JJD810205); 北京大学“国家治理协同创新中心”成果
作者:周志忍, 北京大学政府管理学院、政治发展与政府管理研究所教授;徐艳晴,海南大学政治与公共管理学院副教授,北京大学政府管理学院博士后,北京100871
doi:10.3782/j.issn.1006-0863.2014.11.23
[摘要]政府绩效评估一直为信息失真所困扰,博弈行为则是信息失真的重要原因。因此,博弈及其对策一直是国际绩效评估领域的重要研究主题。本文致力于国际相关文献的梳理综述,内容包括相关概念和博弈行为的类型划分、博弈致因的理论分析及其主要研究结论,目的是对中国相关研究提供理论视角和方法上的启示和借鉴。
[关键词] 绩效评估;信息失真;博弈行为;博弈致因
[中图分类号]D035[文献标识码]A[文章编号]1006-0863(2014)11-0109-06
信息失真是绩效评估中一个普遍存在的现象。导致失真的原因大致有两个方面:人类理性和评估技术的有限性;相关主体的博弈即有意作弊行为。与理性和技术局限相比,博弈行为可能会使绩效信息距离真实更远。信息失真对政府管理的负面影响显而易见:一是导致决策失误,涉及工作重点或优先项选择、未来规划与目标确立、改革创新设计等;二是问责和激励失灵,引发“奖励失败”和行为扭曲现象;三是导致资源非优化配置。因此,博弈行为及其对策一直是国际绩效评估领域的重要研究主题。
中国政府绩效评估一直为信息失真所困扰,而博弈行为一直是信息失真的主要原因。这不仅影响到绩效评估本身的效用,而且对政府公信力带来巨大伤害。因此,探讨博弈行为的致因及其反制之道显得尤为必要。博弈行为是世界范围绩效评估实践中的普遍现象,中国绩效评估中的博弈行为在广度和表现形式上会有什么不同?这些不同与中国政府体制、运行机制和行政文化等又有什么关系?哪些是博弈行为的共性因素而哪些又体现出中国的独有特点?立足国际现有成果并进行跨文化比较研究,有助于确认博弈行为的致因并设计有针对性的反制之道。基于这一考虑,本文致力于国际相关文献的梳理综述,旨在为这一研究作一些基础性工作。第一部分主要讨论相关概念的定义和博弈行为的类型划分;第二部分综述博弈致因的理论分析及其主要研究结论;第三部分是简单的总结和评价。
一、博弈的相关概念与类型划分
西方学者用多种词汇描述绩效评估中的弄虚作假行为,如博弈(gaming)、作弊(cheating)、操控(manipulation)、美容或包装(doctoring)、策略行为(strategic behavior)、创造性分类(creative classification)、创造性解释(creative interpretation)等。对上述行为的分类和概括各有不同,但总体上看,“博弈”和“作弊”是使用频率最高的两个概括词汇。参照多数人的做法,本文用博弈来概括导致信息失真的弄虚作假行为。所谓博弈,就是当决策主体之间的行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的行为。绩效评估中的主要博弈主体包括“委托人”即评估者,又包括“代理人”即被评估者。本文关注的是被评估者的博弈行为。
不同学者对被评估者的博弈行为做了不同的界定:“能从激励契约中获取最大收益同时没有实际改进绩效的行动”[1];“刻意包装甚至赤裸裸地捏造数据,旨在提高个人或组织的地位” [2];“创造(正式和非正式)活动表面上实现了目标或履行了法定义务,但对服务提供带来非预期的严重后果”[3];“改变行动以实现既定目标,而对评估范围外的绩效置之不理”[4]。上述简单定义中包含了多样化的博弈行为,因此对这些行为的合理分类就成为研究的重要方面。
1.博弈行为的两分法
少数学者对“博弈”和“作弊”做了区分,认为明目张胆的捏造或篡改数据属于作弊行为,而“创造性分类、解释或表面遵从”则属于博弈行为。不过,绝大多数学者把被评估者消极应对的努力统称为博弈,在此基础上做进一步分类:有的区分为“可接受”和“不可接受”的博弈[5];亦有学者分为 “低程度博弈”(low-level gaming)和“高程度博弈”(high-level gaming)两种。前者如评估阶段从其他单位抽调人员以尽快提高产出;后者如捏造隐瞒数据等,这属于不同性质的问题,因为被广泛视为不可接受。[6]
哈佛大学教授Robert Bhen用“作弊”一词概括绩效评估中的种种博弈行为。借鉴“避税”和“逃税”的概念区分,他把绩效评估中的博弈分为诚实的作弊(honest cheating)和不诚实的作弊(dishonest cheating)两种基本类型。“不诚实作弊”的例子如:教师考试过程中提示学生核实某道题的答案;考试结束后把错误答案擦去换上正确选择;学校或学区官员随意提高平均分。不诚实作弊属于违法行为,被发现后当事者会面临严厉的处罚。比较而言,“诚实的作弊”完全合法,但背离了组织的使命和目标,现实例子如“应试教育”(teaching to the test)。[7]Courty 等人对美国式应试教育的含义做了说明:基础教育的标准化考试主要覆盖阅读、写作、数学等,由于不考公民素质、冲突解决、人际关系和其他技能,学校和教师不在这方面花费精力,而这些恰恰是基础教育阶段培养的重要内容。[8]
2.组织作弊的三种形式
Bohte和 Meier 用“组织作弊”概念概括绩效评估中的博弈行为,并确认了组织作弊的三种主要形式:[9]
一是“粗制滥造”(cutting corners),追求产出最大化而忽视质量。具体例子如:学校允许不合格学生毕业以提高毕业率;20世纪60年代,多名美国联邦住房巡查员被判刑,原因是他们坐在车里而非进入房间履行其巡查职责。
二是赤裸裸的撒谎或捏造数据(lying),如越战时期谎报敌军阵亡人数数据夸大战果邀功。被发现后当事者会受到相应处罚,所以这是具有高风险的博弈策略。
三是“样本偏差”(biasing samples),它有多种表现形式:报喜不报忧;资源向易于完成的任务倾斜以提高产出,比如警察热衷于抓卖淫嫖娼,因为入室盗窃之类高难度案件的破获率相对较低;倾心于“高可见度”案件以博取赞赏和肯定,忽视可见度低但更重要的案件。由于不易被关注且曝光后社会看法不同,样本偏差是应用广泛的博弈策略。
3.Hood对博弈类型的划分
牛津大学教授Christopher Hood对绩效评估中博弈行为的总结和归纳最为系统全面。依据现有文献,他把博弈行为及其后果归结为以下三种类型[10]:
第一种博弈策略是“棘轮效应”(ratchet effect)。其具体形式有:与上级讨价还价或通过提供虚假基数信息压低目标值;意识到上级会以当年绩效水平为“基数”并不断提高未来指标值,被评估者接近目标时会有意懈怠并约束潜力的发挥,以免形成新的基数导致来年更高的目标,旨在提升绩效的工具产生了完全相反的效果;目标实现无望时干脆取消以避免持续性难堪(比如2002年英国怀孕妇女吸烟率不降反升,后来当局取消了这一目标),从而产生“奖励失败”的实际效果。
第二种策略是“门槛效应”(threshold effect):统一化的产出指标应用于所有单位,固然可以迫使绩效不佳者努力改进,但对绩效卓越者不会产生激励效果,甚至鼓励它们降低绩效水平。一个例子是英国为医院设置的“救护车8分钟以内到达现场的比率达到总出动数的75%以上”的目标,结果很快发现“绩效水平向目标聚集”的现象:在绩效较差单位有一定改进(向75%靠近)的同时,那些绩效卓越的单位也在向75%的目标靠近,意味着指标对绩效卓越者产生了负激励效应。门槛效应的另外一个表现形式是学生考试成绩指标,它鼓励教师聚焦于“边际考生”,对成绩优秀者忽视指导,对差生放任自流。
第三种博弈策略是“产出扭曲”(output distortion),即为实现既定目标而牺牲更重要但未列入考评范围的绩效。以英国卫生当局设置的诊治时间目标为例,产出扭曲的表现形式多种多样:有的医院让病人在救护车内长时间等候,以确保实现“接诊四小时内实施救治”的目标;面临排队超时风险时,有医院采用“拆西墙补东墙”策略,从其他科室临时抽调人员甚至临时取消手术来救急;为完成急诊室“接诊12小时以内安置病人入病房”的目标,有的医院卸去轮床的轮子使之变成“病床”,走廊相应变成“病房”;为了实现“病人能在48小以内面见医生”的目标,有的医生干脆拒绝提前48小时的任何预约。
在梳理现有文献的基础上,Hood 进一步做出了自己对博弈策略的类型划分。这一划分基于两个考察维度:第一个维度涉及绩效数据,具体包括“创造性解释、包装润色”和“杜撰、取消或隐匿”两种情况;第二个考察维度是实际绩效,包括“有所改进”和“没有改进”两种情况。四种具体情况构成一个矩阵的四个象限,对应博弈行为的四种类型。具体可见表1。
根据英国几个公共服务领域的客户调研,Hood 确定了人们对不同博弈策略的可接受程度,并提出了博弈策略向“西北方向”(即矩阵中的左上方)发展的大趋势:随着相关制度建设的完善和社会监督力度的加大,“改变工作重点或资源配置方式以实现绩效目标”成为博弈主要的策略。[11]
4. Radnor对博弈类型的划分
基于Hood的研究成果,英国华威大学教授Radnor把博弈行为同样划分为四类。他的分类基于两个考察维度:第一个维度和Hood的相同,“创造性解释、包装润色”被称为“低程度博弈”,而“杜撰、取消或隐匿”则是“高程度博弈”;第二个考察维度则是博弈所产生的影响,具体分为对“组织内部”和“组织外部”(社会、公民等)的影响。四种情况组合构成博弈行为的四种类型(见图1):[12]
第一种博弈策略是“混淆”(muddling)。比如博物馆为应付访问者数量考核指标,把所有进入大楼的人统统计为“访问者”,包括博物馆工作人员、餐饮供应商、物业管理承包商等。另一招是用大量无关或无用的内部数据(报告)“淹没”观察者,掩盖绩效差距。第二种策略被称为“运筹”(maneuvering),其特点是通过“创造性行动”(扭曲行为)等内部调整使绩效水平更赏目,但对外部客户没有产生实实在在的影响,如医院把轮床变成“病床”进而把走廊变成“病房”的案例。第三种博弈策略他们称为“推拿”(massaging),外部客户有一些收益,但绩效目标的实现主要还是靠数据包装或创造性解释。最后一种是“操控”(manipulating),其手段既包括赤裸裸的数据捏造,也包括行为扭曲。举例而言,两个病人在急诊室分别等待了三个半小时和四小时二十分钟,医院选择等待了三个半小时的病人先行诊治,因为先来者已经超过了四小时的上限。显然,为实现目标的行为扭曲对社会公平和客户权益带来负面影响。
5.Fisher和Downes的作弊连续谱
针对数据和信息操控,Fisher和Downes构建了一个“作弊连续谱”分类框架。他们认为,能发挥良好沟通效果的信息应具有四个特征:信息数量适度,既不过多也不过少;信息质量高即充分真实;信息具有高度相关性;信息提供方式明晰且简明扼要。信息操控就是在这四个方面做手脚,但不诚实的严重程度有所不同。数据注水属于“轻度不诚实”,而赤裸裸捏造数据则是“严重不诚实”,其他操控形式处于作弊连续谱的两极之间。[13]信息操控的类型和具体形式见图2。
二、博弈行为的致因研究
绩效评估中的博弈或策略行为是一种普遍现象,其致因探讨相应成为相关研究的重要方面,因为博弈行为的反制之道以其致因研究为基础。然而从总体上看,博弈致因的研究相对薄弱:虽然所有对博弈现象的研究都会提及导致博弈行为的原因,但专门化的系统研究成果还比较少;聚焦于特定领域的研究形成了有启示意义的分析框架,但尚未通过交叉验证和荟萃分析形成普遍共识。基于此,本部分主要梳理和讨论构成独特理论分析框架的成果。
1.Bohte和Meier的博弈致因框架
Bohte和Meier于2000年发表了《目标置换:组织作弊的动机评估》一文,宣称从学术角度看,“首次对组织何时和为何作弊提供了系统的理论解释”。 [14]在该文中,Bohte和Meier首先梳理已有研究成果,提出导致组织作弊的四个重要因素作为自变项,然后把德克萨斯州476个学区考试作弊的严重程度作为因变项,通过回归分析确认其相关性。
根据德州相关法规,义务教育3-8年级和10年级学生每年要进行标准化考试,主要考察英语阅读和数学水平和能力,结果分为优秀到不合格等档次。有的地方基于学生成绩对学校和教师进行排名并实施奖惩。多数学区和学校存在为提高考试成绩而作弊的行为,由于赤裸裸撒谎或捏造数据风险太大,“粗制滥造”和“样本偏差”成为作弊的主要方式,其中应用最普遍的博弈策略是“被缺考”,即随意批准甚至鼓励差生缺考。文中对“缺考率”和“合格率”的回归分析表明,在控制了平时出勤率、家庭经济状况、班级规模等因素后,缺考学生的比例每提高一个百分点,考试通过率会相应提高0.25个百分点。根据1998年德州一官方机构调查,一些成绩优异学校的学生缺考率超过了50%。虽然德州对免考条件有明确规定(特殊教育的学生和母语非英语考生),但1996年的一项研究表明,各校实际免考生中仅有30%符合条件。考虑各种因素,两人用“缺考率”间接衡量作弊程度,作为回归分析的因变项。
相关性分析的自变项包括四个因素。第一是“绩效差距”,即绩效水平低下者面临的压力可能转换成作弊动机。这一因素用两个指标来测量:上年度(1995)考试合格率(可称为绝对差距);1994-1995年间的合格率发展趋势,这实际上是对学校相对地位的动态考察(可称为“动态相对差距”,即进步幅度上的差距)。第二个因素是“资源约束”。充足的资源投入会带来更小的班级规模、更好的师资、更好的教学设施和条件等,从而有利于提高教学质量。资源不足的学校和校区要与之竞争,可能会采取作弊行为。这一因素用“生均教学投入”和“师生比”两个指标测量。第三个要素是“任务难度”,用黑人和拉美人、低收入家庭学生比重综合成的一个指数来测定,因为低收入家庭和少数族群学生比率较高会增加教学难度,进而影响通过率。第四个要素是“监督力度”,用每100个教师对应的行政和监督人员的比率来衡量。这一选择的考虑是:作弊特别是批准学生免考需要行政和监督人员之间的协调合作,而根据奥尔森“集体行动的逻辑”,行政和监督人员规模大会增加协调难度,相应增加作弊(违规批准免考)的难度。
初步分析结果表明:绩效差距与免考比例之间没有相关性,绩效差距的两个衡量指标上都得出这一结论;资源约束的两个指标上出现不一致的结果,生均教学投入与免考率之间呈显著负相关,而师生比对免考率没有影响。在此基础上,Bohte和Meier对导致作弊动机的主要因素做了排序:第一是生均教学投入,相关系数-0.995,意味着其他条件保持不变,生均教学投入每增加一个百分点,学区批准学生免考的可能性会降低接近一个百分点;第二是任务难度,相关系数0.361,意味着其他保持不变,任务多样性指数每增加一个百分点,批准学生免考的可能性会相应增加0.36个百分点。
基于上述结论和相关文献,Bohte和Meier确认了“最有可能作弊”的四类组织。第一种是“资源不足的组织”,面临严重资源约束但又要和其他组织按照同一标准竞争,他们可能用作弊来实现竞争的“平等性”。第二种是“任务难度高的组织”。政治家满足于确认问题而把解决的任务交给公务员,公民对解决这些问题往往抱有不切实际的期望,一些目标实际上属于不可能完成的任务,博弈就成了可能的选项。第三种是“监督力度弱的组织”,包括日常监督、信息公开、数据审计、问责制度等方面。所有监督力度不足的组织容易出现博弈行为,从事客户服务的部门更是如此。原因在于:街头官僚直接在面对客户提供服务,上级难以掌握充分信息并实施持续和有效的监督。当他们面临绩效压力并且被曝光的概率比较小的时候,就有可能弄虚作假。第四种是“项目设计包含激励结构的组织”。不论是正面奖励还是负面惩罚,激励力度超过一定的度会导致博弈行为。1973年美国政府颁布了全面就业与培训法,后来发现有的地方蓄意裁减市政雇员,然后用联邦专项资金重新雇用他们。杜拉斯学区向“大幅提高学生阅读水平”的教师和校长提供450-1000美元奖励,结果很快发现答案正确率和橡皮使用量出现了惊人的正相关。
2.Fisher和Downes的“情境-机制-效果”分析框架
借鉴公共政策和项目的“现实评价法”(Realistic evaluation),Fisher和Downes构建了一个博弈致因分析框架[15]。公共政策的现实评价方法由Pawson和Tilley于1997年提出,是一个基于现实主义本体论和认识论,由情境、机制、结果三要素构成的分析模型(context–mechanism–outcome configurations—CMOC) [16]。其中“效果”指特定机制所产生的期望和非期望后果;“机制”这里指导致某一事件的作用机理,实际上是人的内心想法或动机,它为采取某种行动提供了理由或借口;情境指外在环境因素,主要是组织形成的相关的制度规范,有的情境因素能够“触发”某种机制从而产生特定效果,有的则没有这种作用。模型的核心假设是:特定“情境”因素作用于某些“机制”因素,从而产生特定期望和非期望的“效果”。
研究的基本路径是首先对“现实评价法”三要素进行操作化,然后选择一些地方政府官员做德尔菲评价,辅之以关键事件法焦点群体访谈,剔除一些无关或影响甚微的因素后进行第二轮德尔菲评价,最后得出作弊行为主要致因及其相对重要性的结论。在模型中,“效果”包括管理者“作弊倾向”和作弊行为所反映出的“不诚实程度”两个变项。“机制”和“情境”的构成因素见表2。
通过两轮调研,他们总结出了对作弊影响最大的四个情境因素,并要求被访者对其相对重要性赋值(总分10分,分配在四个因素上)。四个因素及其得分结果是:(1)组织非正式文化对作弊的态度(4.5分);(2)数据操控的严重程度(轻微作弊就可以跨越绩效门槛,还是需要严重不诚实的作弊行为)(2.6分);(3)作弊被发现的概率(1.4分);(4)被发现后受处罚的严厉程度(1.5分)。
机制诸因素与作弊行为之间的因果关系可见图3。作为自变项的“机制”因素实际上是人们基于哪些理由或借口去作弊;作为因变项(效果)之一的“作弊倾向”就是把作弊动机付诸行动的可能性或概率;第二个因变项即作弊的类型及其严重程度(参见图2)。从图3可以看出,机制诸因素与作弊倾向、严重程度、作弊形式之间存在不同的相关关系:“对信息失准感到反感”会导致较高的作弊倾向,但作弊多采取“注水”或“隐瞒”等“轻度不诚实”的方式;“大力度奖励机制”不仅会导致较高的作弊概率,而且所采取的多是“系统操控”、“重新归类”、“捏造数据”等“严重不诚实”的作弊形式。
3.Martin对作弊影响因素的心理实验
在2013提交的一份学位论文中,北伊利诺斯大学博士生Amy Martin 对大学生考试作弊致因进行了研究。这一研究有两个特点:第一,与上述两个框架聚焦于“诱发”作弊行为的情景和个人特质因素不同,该研究关注作弊行为的“抑制因素”,其最初目的是研究“宗教虔诚度”(religiosity)对作弊行为的影响;第二,从方法上看,这一研究使用心理实验的方法,共有72个在校生参与了实验。[17]
研究选择了四个影响作弊可能性的因素,其含义、选择理由及其与作弊行为的相关性如下:(1)宗教虔诚度,即“理解、信仰并遵守宗教教义和信条的程度”。选择的原因是世界上大多数主流宗教教义包含诚实无欺,基本假设是宗教虔诚度比较高的人出于内在信念会耻于作弊;(2)社会规范,指特定群体成员共同理解并用以指导和约束各自行为的规则和标准,这种指导和约束不需要法律强制。选择的原因是,作弊行为不仅受到内在信念的约束,而且会受到外部环境的影响,社会规范是外部环境中重要构成因素。两个相关假设是:如果看到周围同事在作弊,行动者作弊的概率较高;即使在独处因而没有观察到同事作弊的情况下,如果行动者“以为”大家会作弊,他作弊的概率也会比较高。(3)自我监控力,这里被界定为“对‘社会线索’(或社交提示)的领悟和因应能力”。选择背后的考虑是,社会规范等外部环境因素对行动者产生作用要受到这一能力的影响。相关假设是:自我监控力高的人对社会规范具有敏感性,易于感知外部情况并随之调整自己的行动;自我监控力低的人对他人的作弊行为缺乏敏感性,从众作弊的可能性也相对较低。(4)自我管制或自我规制力(self-regulation),这里可定义为坚持内在信念而实施行为自我约束的能力,比如即使观察到他人在作弊也能坚持诚实。选择这一因素的原因是,管制研究中有一种理论,认为个人的“自我管制资源总量”是一个定数,随着消费会出现“疲劳”或耗减,自我管制力会随之衰减。比如,第一次观察到大家在作弊能坚持诚实无欺,第二次就不一定能做到,第三次几乎肯定会随波逐流。作者想通过实验验证这一理论。
宗教虔诚度、自我监控力、自我管制力等用相关量表进行了事先测量。对社会规范的考察主要是设计了几种情境:(1)自愿参与者独立(没有他人在场)进行的考试;(2)自愿参与者与研究助理(事先了解实验目的和方法设计)一起的考试,研究助理扮演主动作弊者角色;(3)自愿参与者与研究助理一起的考试,研究助理扮演坚持诚实者角色。此外,研究者还通过增加难度(设计无解的题目)、加大激励(合格者计学分)、创造作弊机会(监考者借故离开考场5分钟)等创造不同的条件,借以观察自愿参与者考生的行为反应。
实验结果表明:宗教虔诚度与作弊行为之间没有相关性;社会规范对作弊行为有着重大影响,研究助理作弊的情况下自愿参与考生作弊的概率较高,反之亦然;自我监控力与作弊行为存在正相关关系,研究助理作弊的情况下自我监控力强的人作弊的概率较高;至于自我管制,实验没有证实自我管制资源会随消费而衰减的观点。
三、简要总结与评价
绩效评估中博弈行为的相关研究存在大量文献,本文的梳理和介绍可能仅仅揭开了“冰山一角”:受语言能力限制,我们没有梳理非英语文献;文献的收集不一定全面,有可能遗漏一些权威研究成果。不过,从上面的讨论中仍然可以得出几点结论。
第一,绩效评估是组织控制的特殊形式,外部强加的绩效评估会触发一个复杂的社会过程,博弈行为不可避免并导致严重非预期后果。[18]政府绩效评估中的博弈行为在世界范围内普遍存在,相应引起社会的质疑。英国2005年的一项官方调查表明,有37%的受访者相信官方数据的准确性;认为政府“诚实”提供数据的仅有14%;六类相关统计中医院等待时间的数据最不可靠。[19]遗憾的是,正如Jacob等人所言,组织博弈的研究多基于趣闻轶事,对其普遍程度和严重程度做出系统准确的判断还需许多工作。[20]
第二,绩效评估中博弈行为可以从不同视角并依据不同标准进行分类,标准多样化会导致博弈类型划分的多样化。虽然从标准统一性、分类的排他性和穷尽性等角度看,现有分类还有值得改进的地方,但相关努力给了我们一些有益启示:(1)博弈行为类型划分具有重要意义,把博弈行为视为因变项,把其致因视为自变项,只有两类变项都进行详细的分类,才能进行因果关系的实证研究;(2)多视角和不同标准的分类很有必要,因为研究试图回答的问题和研究设计各有不同;(3)科学类型划分的前提是对多样化博弈行为的全面了解。
第三,博弈行为致因研究分别采用了客观数据基础上的定量分析、社会调查与官员主观评价、心理实验等多种研究方法。虽然专门研究成果的数量有限,研究限于特定政策领域或地域,缺乏交叉验证和荟萃分析,但这些多样化的方法为我们提供了启示。
第四,研究没有形成普遍共识,但从有限研究成果中还是可以得出一些结论:(1)社会规范对相关主体的博弈倾向具有举足轻重的影响,这不仅为Martin 的心理实验所证明,而且在Fisher和Downes 的四大因素相对重要性赋值中得到4.5分,远超其他因素;(2)组织激励契约会对博弈倾向产生重要影响,不论是正面奖励还是负面处罚,不同激励结构和激励程度不仅影响博弈发生的概率,而且影响博弈的具体形式和不诚实程度;(3)如果不同绩效档次间存在较大的激励差距,博弈会出现某种形式的“门槛效应”:绩效水平与目标之间差距很小,稍做手脚(轻度博弈)就可以跨越绩效门槛,进而带来巨大收益,那博弈行为发生的概率就非常高。这些结论对构建博弈行为的反制之道具有重要意义。
前已提及,中国政府绩效评估实践一直为信息失真所困扰,博弈行为一直是信息失真的主要原因。因此,博弈行为的致因研究对中国具有特殊重要性。本文聚焦于国际相关文献的梳理综述,期望引起对这一主题的关注,并对中国研究提供理论视角和方法上的启示和借鉴。
[参考文献]
[1]Baker, George . Incentive Contracts and Performance Measurement, Journal of Political Economy,1992,100(3). pp.598-614.
[2] Hood, C. Public Service Management by Numbers: Why does it Vary? Where Has it Come From? What Are the Gaps and the Puzzles? Public Money and Management, 2007: 95-102.
[3][12]Radnor, Zoe. Muddled, Massaging, Manoeuvring or Manipulated? International Journal of Productivity and Performance Management,2008,57(4): 316-328.
[4][13][15]Fisher, Colin and Bernadette Downes. Performance Measurement and Metric Manipulation in the Public Sector. Business Ethics: A European Review, 2008.17(3).
[5][10][11][19]Hood, Christopher. Gaming in Targetworld: The Targets Approach to Managing British Public Services. Public Administration Review, 2006.
[6] Mears, Alex and Paul Webley. Gaming of Performance Measurement in Health Care: Parallels with Tax Compliance. Journal of Health Services Research & Policy, 2010,15(4): 236–242.
[7]Behn, Robert. Cheating-Honest and Dishonest. The New Public Innovator, 1998:18-19.
[8]Courty, Pascal and Gerald Marschke. Dynamics of Performance Measurement Systems. Oxford Review of Economic Policy, 2003,19(2).
[9][14]Bohte, John and Kenneth J. Meier. Goal Displacement: Assessing the Motivation for Organizational Cheating. Public Administration Review, 2000,60(2):173-182.
[16]Pawson, R. and Tilley, N. Realistic Evaluation. London: Sage, 1997.
[17]Martin, Amy. Does Religion Buffer Cheating? A Dissertation Submitted to the Graduate School in Partial Fulfilment of the Requirements for the Degree of Doctor of Philosophy. Northern Illinois University, 2013.
[18]Darley, John. Setting Standards Seeks Control, Risks Distortion. IGS Public Affairs Report. University of California at Berkeley, 1991.
[20]Jacob, B. A., and Levitt, S. D. Rotten Apples.An Investigation of the Prevalence and Predictors of Teacher Cheating. University of Chicago, Mimeo. 2002.
The Game Behavior and Its Causes in Performance Evaluation: an International Literature Review
Zhou Zhiren Xu Yanqing
[Abstract]Government performance evaluation has been beset by information distortion and the game behavior is an important reason for that. As a result, the game and its countermeasures have been important research topics in the field of international performance evaluation. Committed to international combing of literature review, this paper includes the relevant concepts, the classification of game behavior, the theoretical analysis of game cause and the main research conclusion, the purpose of such research is to provide the enlightenment and reference to relevant research in China from theoretical perspectives and methodologies.
[Key words]performance evaluation, information distortion, game behavior
[Authors]Zhou Zhiren is Professor at School of Government, Peking University; Xu Yanqing is the Postdoctoral Researcher at School of Government, Peking University, Beijing 100871