基于改进累积前景理论监管奖酬博弈模型分析——政府监管方视角

  • 投稿雪上
  • 更新时间2015-09-21
  • 阅读量371次
  • 评分4
  • 93
  • 0

高欣1,吴晓伟1,2

(1.同济大学经济与管理学院,上海200092;2.青岛理工大学工程管理学院,山东青岛266033)

摘 要:以施工企业安全参与行为作为研究对象,将累积前景理论的价值函数进行合理改进,并建立监管方和施工企业安全参与行为的演化博弈模型,进而得到保证施工企业按章施工的约束不等式。在综合考虑双方利益的基础上引入与监管成本相关的奖酬鼓励变量,并构建了奖酬的变动对施工企业安全行为影响模型,最后通过实际工程算例运用系统动力学进行了相应的敏感性分析。文章解决了传统博弈模型完全理性假设和均衡分析方法的局限,更加真实、全面的考虑了施工企业在奖酬引入下安全参与行为的特征和规律,同时也为政府监管政策的合理制定提供一个可操作的分析平台。

教育期刊网 http://www.jyqkw.com
关键词 :改进累积前景理论;奖酬激励;系统动力学;风险规避

中图分类号:F407.9  文献标识码:A 文章编号:1002-3240(2015)03-0074-06

收稿日期:2015-01-06

基金项目:国家自然科学基金资助项目(51078079)

作者简介:高欣(1965-),上海人,同济大学经济与管理学院博士生导师,教授,同济大学基建处处长,研究方向为城市管理与建设工程管理、项目管理;吴晓伟(1985-),女,吉林白城人,同济大学经济与管理学院博士研究生,讲师,研究方向为建设工程管理与质量安全控制研究。

引言

传统的博弈模型,无论是静态的还是动态的,绝大多是基于期望效用理论建立支付函数或对其进行拓展的基础上建立的,基于期望效用理论建立的博弈模型存在以下局限:(1)假设条件中的参与人仅能描述一方的风险偏好,也无法对决策者的偏好程度进行合理判断;(2)期望效益认为决策者是完全理性的,从而根据收益的概率大小采取相应的决策,这与实际情况完全相悖。有必要从演化的角度进一步深刻探讨政府监管系统的均衡与演化之间的规律和联系。

建筑工程系统是典型的不确定性系统,由于施工点多面广,事故隐患多而复杂,受经验、感性认知能力、风险偏好以及不同的价值观等不确定性因素的影响,现实工程安全监管中很难做到完全理性和效用最大化。经济学家和心理学家共同研究表明,人们的决策行为在不确定条件下呈现有限理性[1],Tversky 和Kahneman 提出的前景理论[2]以及累积前景理论(CPT)[3]都是有限决策理论,累积前景理论的效用收益感知矩阵采用价值函数和决策权重函数双重度量,通过设置收益的参照点来呈现决策者的风险偏好。Fudenberg[4]提出的博弈学习理论认为博弈均衡是参与者通过适应性学习实现的,非完全理性长期的推移产生的结果。演化博弈从根本上彻底摒弃了经典博弈理论完全理性的假设,运用各种演化动态近似表达参与者的学习和决策过程,从有限理性分析预测人的行为,从而更接近于现实情况。因此可以尝试利用演化动态中的复制子动态[5]来刻画安全监管参与者行为选择的博弈学习过程,来揭示监管演化系统内在动力机制。

一、改进的累积前景理论

(一)累积前景理论介绍

不确定性决策占据统治地位的是由Von Newmann和 Morgenstern 提出的期望效益理论[5],然而与现实中预期结果会产生很大的差距。为了寻找人们的真实决策,Tversky和Kahneman通过心理行为实验提出了前景理论,并在 Quiggin[6]研究总结基础上提出了“累计前景理论”。与前景理论相比,累积前景理论的主要观点有:(1)参照点,人们在决策时候根据预先设置的参照点来衡量得失;(2)风险偏好,在收益的情况下人们会倾向于风险厌恶,在损失的情况下人们会倾向于风险追求的感知[7-8]。价值函数及决策权重函数见公式(1)和(2)。

其中ζ、λ分别表达了对收益和损失的敏感度,当λ=1,ζ>1时表示相对于损失,决策者对收益更敏感;当λ>1,ζ=1时表示相对于收益,决策者对损失更敏感。

二、基于改进CPT的监管博弈模型的构建

(一)基本假定

安全监管通常并不是一次性的行为活动,它贯穿于整个的施工全过程,过程中包括信息反馈机制的反复决策。在日常的安全监管行为活动中,监管方与施工企业之间不可避免的存在着互动和影响,施工企业是否会出现违章行为,可看成是一种相互影响的博弈双方风险决策行为的结果。基于此,可做如下基本假设:

假设1:博弈过程中包括监管方与施工企业两类有限理性人,其策略的选择是基于自身价值的感知和心理感受,这种心理感知价值称为前景价值V,包含价值函数v(x)和决策权重函数ω(P)即V=v(x)ω(P)。

假设2:将施工企业的行为策略选择抽象为{B1按章施工,B2违规操作},监管方的行为策略为{严格监管U1,消极监管U2}。设监管方的实际监管成本为m>0(主要包括自身付出的财、力等成本),相应的前景价值为M;施工企业选择按章施工的实际成本为n>0(主要包括按章施工所需要付出的劳动、精力、时间等),相应的前景价值为N;选择违规操作获得的额外收益h>0时,实际处罚为a1>0(包括被上级管理人员的训斥、罚款等处罚),相应的前景价值为A1;采取违规操作需要承担的名誉、人身伤害以及经济损失风险为a2 ,扣除h后的风险前景价值为A2。

假定3:博弈双方承担的安全风险成本线性相关。因为一旦发生了安全事故,监管方和施工企业都将受到不同程度的损失,监管方主要承担连带责任。设施工企业违规操作造成的损失风险传递给监管方的比例系数为Q。当施工企业采取按章施工时,双方所需要承担的安全风险成本的折扣系数为D1∈(0,1];监管方采取严格监管时,双方所需要承担的安全风险成本的折扣系数为D2∈(0,1]。

(二)改进累积前景理论的运用

根据改进累积前景理论的原理及公式,当有以下几种情况存在时,分别得到相应实际损益值与前景值的关系。

当双方采用策略(U1,B1)时,此时安全风险损失为0,此时按章施工发生的概率为p1=1由V=v(x)ω(P)得到:M=ω(p1)v(m)+ω(1-p1)v(0)=v(m), N=ω(p1)v(n)+(1-p1)v(0)=v(n)。

当双方采用策略(U2,B2)时,施工企业的安全风险损失为A2,此时需要承担连带责任风险QA2。违规操作发生的概率为p2,得到:A2=ω(p2)v(a2-h)+ω(1-p2)v(0)=(p2)v(a2-h)。

当双方采用策略(U1,B2)时,施工企业将受到监管方的惩罚A1,同时需要承担安全风险损失D2A1;而监管方除了承担成本N之外,还要承担连带责任风险QD2A1。违规操作发生的概率为p,得到:A1=ω(p3)v(a1)+ω(1-p3)v(0)= ω(p3)v(a1)。

当双方采用策略(U2,B1)时,施工企业除了要支付选择按章施工的实际成本N之外,还需承担安全风险损失A2D2,而监管方需要承担连带责任风险QA2D2。

(三)感知矩阵的构建

基于以上三个假设及改进的累积前景理论,构建监管方和施工企业的收益感知矩阵,如表1所示。

满足条件为:E1为不稳定的结点, E2与E3为鞍点,并有不等式N≤D2-D2A2,N≤A1+D1A2,M≤A1-A2D1Q+A2Q,M≤A2D2Q成立。

当满足上述不等式的约束条件时,施工事故发生概率最小,从监管方的视角达到稳定最优。此时对于施工企业来讲只需要满足N≤D2-D2A2与N≤A1+D1A2尚可,即施工企业按章施工的成本前景值小于处罚风险、名誉、人身伤害以及经济损失风险值之和,同时也要小于由于按章施工带来的外部收益。根据改进累积前景理论的风险决策对施工企业满足的约束条件进行理论分析:施工企业在采用按章施工的策略时将会付出确定性成本n(主要包括按章办事所需要付出的劳动、精力、时间等),而选择违章施工时将会获得额外收益h,同时一旦发生事故将会产生名誉、人身伤害以及经济损失风险a2和惩罚损失风险a1。根据累积前景理论的风险偏好在收益的情况下施工企业倾向于风险厌恶,在损失的情况下倾向于风险追求。所以本条件中施工企业将会选择风险追求,来规避选择确定的损失。同理对于监管方来讲严格监管将会付出监管成本,而消极监管虽然会出现由于事故的发生所带来的连带责任风险,但同时也减少了严格监管的成本。因此监管方也将会倾向选择风险偏好来规避选择确定的损失。

由以上分析可得出不等式很难成立。原因在于累积前景理论的风险偏好原理,促使监管方和施工企业倾向于追求不确定性的风险来规避确定性的付出。本文从政府监管方的视角引入奖酬ε(包括薪酬、福利),以期为了更好的探讨奖酬变化对施工企业安全参与行为的影响,及政府监管视角下的合理监管模式。

三、建立奖酬对施工企业安全参与行为的影响模型

在上述安全监管博弈模型的基础上引入奖酬,奖酬是政府对上一年度表现良好(没有发生过重大事故,一般事故发生小于3次)的施工企业进行鼓励。在本年度工程开工前颁发,设政府对施工企业投入的奖酬为ε,参照点的实际收入为ε0,违规操作施工企业获得的额外收益为h,一旦被发现(概率为P)将在正常惩罚的基础上再按照k倍所得额外收益进行处罚。依据公式(3)改进的累积前景理论,可建立政府奖酬鼓励下施工企业的行为影响模型 。V(h)=ω(1-p)v(h+ε-ε0)+ω(p)v(ε-ε0-kh),令t1=h+ε-ε0, t2=ε-ε0-kh,模型建立的目的是让施工企业在政府奖酬鼓励的情况下,施工事故发生概率最小,整个建筑市场达到最优安全水平。所以通过求其全微分方程并对其求导最终得到以下三种讨论结果:

当t1>t2>0时,S(t2)-S(t1)>0,S(t)为减函数。由于t1=h+ε-ε0, t2=ε-ε0-kh可知奖酬ε是关于t的一次单调增函数。随着奖酬ε的增大t就增大,而S(t)逐渐减小,所以施工企业逐渐倾向于风险追求;

当t1>0,t2<0时,S (t2)-S(t1)<0,S(t)为增函数。随着奖酬ε的增大,S(t)也增大,施工企业逐渐倾向于风险规避;

当0>t1>t2 时,S(t2)-S(t1)>0,S(t)为减函数。随着奖酬ε的增大,而S(t)逐渐减小,施工企业逐渐倾向于风险追求;

综上所述,当满足t1>0,t2<0时,政府监管方应该采用奖酬激励政策,可以促进越来越多的施工企业倾向于风险规避,更好的减少安全事故发生。因为此时违规操作被发现会产生巨大的心理感知损失,所以施工企业就会整体倾向于按章施工。

四、基于SD实际工程算例参数敏感性分析

为了准确评估奖酬的引入对演化博弈模型的参数敏感性,以临沂市政府投资建设的开罗大桥为例,大桥全长1437.66m,主桥长为430m,桥面宽度30m;政府为了确保大桥的施工安全,对施工企业主要采取奖酬调整和提高施工企业的名誉损失风险感知等监管措施,并运用SD进行了敏感性分析,通过对相应参数的调整来观察施工企业按章施工行为的概率变化趋势。

(一)SD流图模型建立

用Vensim PLE 5.6a建立监管方与施工企业之间的奖酬演化博弈模型,模型的结构图见图1。

SD模型主要由4个流位、2个流率、4个中间变量、10个外生变量构成,作用于博弈模型中M,N,A1,A2,D1,D2,Q,h,k,ε等10个外生变量参数。安全事故一旦发生,政府必须承担相应的连带责任,故设风险传递系数为1;施工企业主动采取按章施工比被动惩罚纠正违章操作的安全监管效果更主动,更明显,所以主动安全风险折扣系数比被动风险折扣系数低,即D1>D2,因此设政府方严格监管时,双方所需要承担的安全风险成本的折扣系数D1为0.6,施工企业按章施工时,双方所需要承担的安全风险成本的折扣系D2为0.4;此外由于安全风险感知往往比处罚风险要高,因此假设施工企业违规操作受到监管人员处罚的损失A1为0.5,施工企业受到的名誉、人身伤害以及经济损失A2为1;同时假设政府方严格监管付出成本M的初始值、施工企业按章施工付出成本N的初始值、额外收益h的初始值均为1;惩罚系数k及政府奖酬ε的初始值均为2。

(二) SD仿真分析

基于上述设定值以及变量之间的公式,运用系统动力学的模型仿真方法,借助Vensim PLE 软件建立监管方、施工企业引入奖酬的博弈演化动态模型。在仿真过程中,根据大桥的风险特征设置了相应的参数,模拟周期为100,INITIAL TIME=0,FINAL TIME=100,TIME STEP=0.007812[15]。

(1)政府监管奖酬的变化对演化结果影响。

当t1> 0 ,t2<0时,随着奖酬变化施工企业按章施工概率的变化曲线,见图2。

图中曲线1,2,3所表示含义分别是奖酬ε=2,ε=3,ε=4时施工企业按章施工的概率。从图中可以看出,随着奖酬的增加,施工企业整体倾向于风险规避。此时政府应该加大奖酬鼓励,会更进一步的促进施工企业按章施工。

SD仿真结果与建立的奖酬的变动对施工企业安全行为影响模型结果一致。可见政府在适宜的时候(t1> 0,t2<0),可以通过提高奖酬来进一步促使施工企业安全施工。

(2)施工企业的名誉损失风险感知变化对演化结果的影响,见图3。

图中曲线1,2,3,4,5,6所表示的含义是分别当A2=1、1.2、1.4、1.6、1.8、2时的施工企业按章施工的行为表现。从图中可以看出在1~2之间存在临界值,当A2小于该临界值时,y收敛于0;当A2大于该临界值时,y收敛于1,并且随着A2的增大可以加快y趋于1的速度。可见政府可以通过提高名誉损失风险感知促使施工企业安全施工。工程实践中有很多方法可以提供名誉损失,如政府投资项目红黑榜等。政府监管人员要从思想上、心理上进行明示或暗示,阻断施工企业从前的侥幸心理,使其产生“违章难免出事,出事极易名誉受损”的心理认识。

五、政府监管策略建议

依据上述模型的仿真分析结果,对我国建筑安全监管提出了协同差异并用模式、奖酬和惩罚双向控制模式、以及信誉体系与社会监督相结合的三种监管模式。

(一)协同差异并用模式

从政府监管立场看,监管力度不足会导致施工企业频繁出现违章施工[14-15]。而过度监管,将会导致监管成本大幅度上升,总效益下降。因此应该寻找最优的监管平衡点,按照不同的对象选择不同的监管力度和强度,进行有序的差异化监管:根据公式(2)可知:对于ω(p)小的施工企业,要加大监管力度避免其产生侥幸心理;对于ω(p)大的施工企业,选择较低的p进行有效监管,不仅有效的降低了监管成本,同时也提高了政府的整体效益。这种差异化监管的前提条件是保证监管信息的严密性。

(二)奖酬和惩罚双向控制模式

传统观点认为,提高惩罚就能抑制施工企业违规操作的行为,但是从以上分析看,还需要结合有效的奖酬机制,在适当的条件下(t1>0,t2<0)加大奖酬力度可以有效激励施工企业按照施工的积极性,也能促进施工企业内在的改变,由“要我安全”变为“我要安全”,从心理上得到真正本质的改变,更好的解决违规操作的问题。当在(t1>0,t2<0与0>t1>t2)条件下时,政府应采用惩罚机制,会给施工企业心理上一个强有力的威慑效应,在合理的水平上能抑制不安全行为的发生。政府也可以在特定的临界点通过提高名誉损失风险感知惩罚促使施工企业安全施工。

(三)信誉体系与社会监督相结合模式

信誉体系的健全发展与施工企业的名誉效应成正相关性,良好的信誉体系能够更好的引导施工企业重视名誉上的损益。所以地方政府应该发挥其本职建立健全的信用评价体系管理机构,中央政府应该作为最强有力的后方保障,对施工企业的任何施工行为独立的做出客观评价,不受任何影响与干扰。媒体和公众监督是发现施工企业违规操作的重要手段,所以地方政府应该建立公众举报网站、投诉电话,使施工企业时刻都在群众、媒体的有效监督下施工,并设立专门的审查机构定期核查群众意见的处理情况,并及时向当地政府主管部门汇报。

教育期刊网 http://www.jyqkw.com
参考文献

[1]SIMON HA. A Behavioral Model of Rational Choice [J].Quarterly Journal of Economics,1955,(69):99-120.

[2]KAHNEMAN D.TVERSKY A.Prospect theory :An analysis of diction under risk[J]. Econometrica 1979,(47): 263-291.

[3]TVERDKY A,KAHNEMAN D.Advance in prospect theory :Cumulative representation of uncertainty[J] .Risk Uncertainty,1992,(5):297-323.

[4]FUDENBERG D,LEVINE DK.Theory of Learning in Games [M].Cambridge :MIT Press ,1998.

[5]VON NEWMANN J,MORGENSTERN O.Theory of games and economic behavior [M].Princeton University Press,1944.

[6]QUIGGIN J.A theory of anticipated utility [J].Journal of Economic Behavior Oaganization,1982,3(4):323-343.

[7]FISHHOFF, SLOVIC, LICHTENSTEIN.Accident probabilities and seat belt usage: A psychological perspective[J].Accident Analysis and Prevention,1978,(10):280-285.

[8]SLOVIE P,FISCHHOFF B,LICHTENSTEIN S. Facts and fears:Understand perceived risk. In Schwing R C,Albers WA(ed)[Z].Social risk assessment:How safe enough ?New York :Plenum,2012.

[9]PRELEC D. The prpbability weighting function [J]. Econometrica,1998,66(3):497-527.

[10]SENBIL M.KITAMURA R. Rdference points in commuter departure time choice :a test of alternative dection frames [J].Journal of Intelligent Transport Systems ,2004,8(1):19-31.

[11]WU G,GONZALEZ R. Curvalture of the probability weighting function [J].Management science,1996,42(12):1676-1690.

[12]孙文庆.不完全信息条件下演化博弈均衡的稳定性分析[J].系统工程理论与实践,2003,(7):11-16.

[13]蔡玲如,曾伟,王红卫.环境污染博弈问题的系统动力学模型[J].计算机应用研究,2009,26(7):2465-2468.

[14]卢小祁.企业减碳行为与政府监管的博弈[J].社会科学家,2011,(6):115-117.

[15]刘明华.银行监管与风险管理[J].武汉金融,2003,(2):4-7.