文档详情

决策论实用培训教程(ppt 89页)

沈***
实名认证
店铺
PPTX
557.30KB
约88页
文档ID:137819709
决策论实用培训教程(ppt 89页)_第1页
1/88

(1)按性质的重要性分类:战略决策(战略计划)按性质的重要性分类:战略决策(战略计划)、策、策略决策(管理控制)略决策(管理控制)、执行决策(运行控制)、执行决策(运行控制),三级三级战略决战略决策策是涉及某组织发展和生存有关的全局性、长远性问题的决是涉及某组织发展和生存有关的全局性、长远性问题的决策,如厂址的选择,新产品开发,新市场开发,原料供应地策,如厂址的选择,新产品开发,新市场开发,原料供应地的选择等的选择等策略决策策略决策是为完成战略决策所规定的目的而进行的决是为完成战略决策所规定的目的而进行的决策,如对一个企业来讲,产品规格的选择、工艺方案和设策,如对一个企业来讲,产品规格的选择、工艺方案和设备的选择,厂区和车间内工艺路线的布置等备的选择,厂区和车间内工艺路线的布置等执行决策执行决策是根据策略决策的要求对执行方案的选择,是根据策略决策的要求对执行方案的选择,如公司中产品合格标准的选择,日常生产调度的决策如公司中产品合格标准的选择,日常生产调度的决策1决策结构不同,解决问题方式也不同决策结构不同,解决问题方式也不同(3)(3)按定量和定性分类:定量决策,定性决策按定量和定性分类:定量决策,定性决策(4)(4)按决策环境分类:确定型、风险型、不确定型按决策环境分类:确定型、风险型、不确定型(5)(5)按决策过程的连续性分类:单项决策、序贯决策按决策过程的连续性分类:单项决策、序贯决策(2)按决策的结构分类:程序决策按决策的结构分类:程序决策(有章可循有章可循)和非程和非程序决策序决策(凭经验直觉凭经验直觉)。

解决问题方式程序决策非程序决策传统方式习惯,标准规程直观判断,创造概测,选拔人材现代方式运筹学,管理信息系统培训决策者,人工智能,专家系统2第二节第二节 决策过程决策过程 构造人们决策行为的模型有两种方法:一是面向决策结构造人们决策行为的模型有两种方法:一是面向决策结果的方法,二是面向决策过程的方法果的方法,二是面向决策过程的方法可见,任何一个决策都有一个过程和程序,决非决策可见,任何一个决策都有一个过程和程序,决非决策者灵机一动拍板就行决策过程包括预决策者灵机一动拍板就行决策过程包括预决策 决策决策 决策后三个互相依懒的阶段决策后三个互相依懒的阶段确定提出方案收集目标方案选优信息决策3任何决策问题都有以下要素构成决策模型:任何决策问题都有以下要素构成决策模型:(1)(1)决策者,可以是个人,委员会或某组织,一般指领导者决策者,可以是个人,委员会或某组织,一般指领导者2)(2)可供选择的方案,行动或策略可供选择的方案,行动或策略3)(3)准则是衡量选择方案,包括目的、目标、属性、正确性的标准则是衡量选择方案,包括目的、目标、属性、正确性的标准,有单一准则和多准则准,有单一准则和多准则4)(4)事件是指不为决策者所控制的客观存在的将发生的状态。

事件是指不为决策者所控制的客观存在的将发生的状态5)(5)每一事件的发生将发产生某种结果,如获得收益或损失每一事件的发生将发产生某种结果,如获得收益或损失6)(6)决策者的价值观,如决策者对货币额或不同风险程度的主观决策者的价值观,如决策者对货币额或不同风险程度的主观价值观念价值观念4 确定型的决策,是指不包含有随机因素的决策问题,确定型的决策,是指不包含有随机因素的决策问题,每个决策都会得到一个唯一的事先可知的结果每个决策都会得到一个唯一的事先可知的结果从决策的观点来看,前面讲的数学规划方法等都是从决策的观点来看,前面讲的数学规划方法等都是确定型的决策问题,这里讨论的决策问题,都是具有不确定型的决策问题,这里讨论的决策问题,都是具有不确定因素和有风险的决策确定因素和有风险的决策5 所谓不确定型的决策是指决策者对环境情况不甚了所谓不确定型的决策是指决策者对环境情况不甚了解,这时决策者主要根据自己的主观倾向进行决策,由解,这时决策者主要根据自己的主观倾向进行决策,由决策者的主观态度不同基本可分为五种准则,它们是决策者的主观态度不同基本可分为五种准则,它们是:悲悲观主义准则、乐观主义准则、折衷主义准则、等可能性观主义准则、乐观主义准则、折衷主义准则、等可能性准则、最小机会损失准则,下面举例说明。

准则、最小机会损失准则,下面举例说明例例1:某厂是按批生产某产品,并按批销售,每件产某厂是按批生产某产品,并按批销售,每件产品的生产成本是品的生产成本是30元,批发价格是每件元,批发价格是每件35元,若每月生产元,若每月生产的产品当月销售不完,则每件损失的产品当月销售不完,则每件损失1元,工厂每投产一批元,工厂每投产一批是是10件,最大生产能力是件,最大生产能力是40件,决策者可选择的生产方案件,决策者可选择的生产方案为为0、10、20、30、40五种,假设决策者只知道未来产品五种,假设决策者只知道未来产品的需求情况是的需求情况是0、10、20、30、40五种,试问这时决策者五种,试问这时决策者应如何决策?应如何决策?6 解:解:这个问题可用决策矩阵来描述,决策者可选择的这个问题可用决策矩阵来描述,决策者可选择的行动方案有五种这是他的策略集合,记作行动方案有五种这是他的策略集合,记作 S Si i,i=1i=1,2 2,3 3,4 4,5 5产品的产品的销售情况有五种:销售情况有五种:0 0、1010、2020、3030、4040,但不知他们发生的概率,这就是事件集合,记作但不知他们发生的概率,这就是事件集合,记作 E Ej j ,j=1j=1,2 2,3 3,4 4,5 5 。

每个每个“策策略略事件事件”对都可以计算出对都可以计算出相应的收益值或损失值,如当选择月产量为相应的收益值或损失值,如当选择月产量为2020件时,而销件时,而销出量为出量为1010件,这时收益额为:件,这时收益额为:1010(35-30)-1(35-30)-1(20-10)=40(20-10)=40(元元)可以一一计算出可以一一计算出“策略策略事件事件”对应的收益值或损对应的收益值或损失值,记作失值,记作aij,将这些数据汇总在下矩阵中:,将这些数据汇总在下矩阵中:7 这就是这就是决策矩阵决策矩阵,根据决策矩阵中元素所示的含义不同,根据决策矩阵中元素所示的含义不同,又可称为又可称为收益矩阵收益矩阵、损失矩阵损失矩阵、风险矩阵风险矩阵、后悔值矩阵后悔值矩阵等等下面讨论决策者是如何应用决策准则进行决策的下面讨论决策者是如何应用决策准则进行决策的8 悲观主义悲观主义决策准则亦称决策准则亦称保守主义保守主义决策准则当决策者面临着各决策准则当决策者面临着各事件的发生概率不确定时,决策者处理问题时就比较谨慎他分析事件的发生概率不确定时,决策者处理问题时就比较谨慎他分析各种最坏的可能结果,从中选择最好者,以它对应的策略为决策策各种最坏的可能结果,从中选择最好者,以它对应的策略为决策策略。

略用符号表示为用符号表示为max minmax min决策准则决策准则在收益矩阵中先从各策略所在收益矩阵中先从各策略所对应的可能发生的对应的可能发生的“策略策略事件事件”对的结果中选出最小值:对的结果中选出最小值:一、一、悲观主义(悲观主义(max minmax min)决策准则)决策准则jmin:0,10,20,30,40.ija 再从中选出最大者,以它对应的策略为决策者应选的再从中选出最大者,以它对应的策略为决策者应选的决策策略:决策策略:1jjmaxminmax 0,10,20,30,400ijiiaa 它对应的策略为它对应的策略为S S1 1即为决策者应选的策略,在这里是即为决策者应选的策略,在这里是“不生产不生产”9上述计算公式表示为:上述计算公式表示为:max minijjia*kS1S EjSi-40-4020020014014080802020-40-404040策策略略-30-3015015015015090903030-30-303030-20-201001001001001001004040-20-202020-10-105050505050505050-10-1010100 00 00 00 00 00 00 0 决策方案的选择决策方案的选择40403030202010100 0状状 态态maxminijjiaminijja在表格上表示为:在表格上表示为:10 持持乐观主义乐观主义(max maxmax max)决策准则的决策者对待风险的态度与决策准则的决策者对待风险的态度与悲观主义者万全不同,当它面临情况不明的策略问题时,他决不悲观主义者万全不同,当它面临情况不明的策略问题时,他决不放弃任何一个可获得最好结果的机会,以争取好中之好的乐观态放弃任何一个可获得最好结果的机会,以争取好中之好的乐观态度来选择他的决策策略。

决策者在分析收益矩阵各策略的度来选择他的决策策略决策者在分析收益矩阵各策略的“策策略略事件事件”对的结果中选最大者:对的结果中选最大者:二、乐观主义(二、乐观主义(max maxmax max)决策准则)决策准则jmax:0,50,100,150,200.ija 再从中选出最大者,以它对应的策略为决策者应选的再从中选出最大者,以它对应的策略为决策者应选的决策策略:决策策略:它对应的策略为它对应的策略为S S5 5即为决策者应选的策略,在这里是即为决策者应选的策略,在这里是“生产生产4040件件”55jmaxmaxmax 0,50,100,150,200ijiiaa=200=11上述计算公式表示为:上述计算公式表示为:max maxijija*kS5S EjSi20020020020014014080802020-40-404040策策略略15015015015015015090903030-30-3030301001001001001001001001004040-20-20202050505050505050505050-10-1010100 00 00 00 00 00 00 0 决策方案的选择决策方案的选择40403030202010100 0状状 态态maxmijijaxamaxijja在表格上表示为:在表格上表示为:12 当用当用max minmax min决策准则决策准则或或max maxmax max决策准则决策准则来处理问题时,有的来处理问题时,有的决策者认为这样太极端了,于是提出把这两种决策准则予以综合,决策者认为这样太极端了,于是提出把这两种决策准则予以综合,令令为乐观系数为乐观系数,且且0101,并用以下关系式表示,并用以下关系式表示三、折衷主义(乐观系数)决策准则三、折衷主义(乐观系数)决策准则 决策者计算各策略的决策者计算各策略的折衷值折衷值,然后在所有这些,然后在所有这些折衷值折衷值中中选择最大者选择最大者:*maxikiHS 用用 分别表示第分别表示第 i 个策略可能得到的最大收益个策略可能得到的最大收益值与最小收益值。

值与最小收益值折衷值定义为:折衷值定义为:maxmin,iiaamaxmin(1)iiiHaa13例如在本例中设例如在本例中设=1/3=1/3,则,则 H Hi i:0,10,20,30,40.:0,10,20,30,40.于是选策略为于是选策略为S S5 5 ,即产生,即产生4040件5maxmax0,10,20,30,40=40=iiHH14Ei 4040maxmax20020014014080802020-40-404040策策略略303015015015015090903030-30-30303020201001001001001001004040-20-20202010105050505050505050-10-1010100 00 00 00 00 00 00 0 决策方案的选择决策方案的选择40403030202010100 0状状 态态SiiHmaxiiH5S用表格表示为(用表格表示为(=1/3=1/3):):15 等可能性准则认为:当一人面临着某事件集合,在没有什么等可能性准则认为:当一人面临着某事件集合,在没有什么确切理由来说明这一事件比那一事件有更多发生机会时,只能认确切理由来说明这一事件比那一事件有更多发生机会时,只能认为各事件发生的机会是均等的。

即每一事件发生的概率都是为各事件发生的机会是均等的即每一事件发生的概率都是1/1/事事件数件数决策者计算各策略的收益期望值,然后在所有这些期望值决策者计算各策略的收益期望值,然后在所有这些期望值中选择最大者,以它对应的策略为决策策略中选择最大者,以它对应的策略为决策策略四、四、等可能性等可能性(Laplace)(Laplace)决策决策准则准则11():0,38,64,78,80niijjE San然后在所有这些期望值中选最大者:然后在所有这些期望值中选最大者:5max()max0,38,64,78,80 80()iiE SE S于是选策略为于是选策略为S S5 5 ,即产生,即产生4040件16上述计算公式表示为:上述计算公式表示为:*max()ikiE SS5S8080maxmax20020014014080802020-40-404040策策略略1/51/51/51/51/51/51/51/51/51/5787815015015015090903030-30-30303064641001001001001001004040-20-20202038385050505050505050-10-1010100 00 00 00 00 00 00 0 决决 策策 方方 案案 的的 选选 择择40403030202010100 0状状 态态 Ei Si()iijjjE Sa p用表格表示为:用表格表示为:17 最小机会损失决策准则亦称最小后悔值决策准则。

首先将收益最小机会损失决策准则亦称最小后悔值决策准则首先将收益矩阵中各元素变换为对应的矩阵中各元素变换为对应的机会损失值(后悔值,遗憾值)机会损失值(后悔值,遗憾值)其含义是:当某一事件发生后,由于决策者没有选用收益最大的策略,义是:当某一事件发生后,由于决策者没有选用收益最大的策略,而形成的损失值而形成的损失值.因此决策者希望后悔值达到最小具体方法如下:因此决策者希望后悔值达到最小具体方法如下:五、最小机会损失五、最小机会损失(后悔值后悔值)决策准则决策准则*max()jijiaa 确定某一状态下的收益最大值:确定某一状态下的收益最大值:*1,2,max()ijijijjijijnbaaaa 计算计算某一状态下各决策的后悔值:某一状态下各决策的后悔值:*maxiijjbb 确定确定各决策的各决策的最大后悔值:最大后悔值:*minmin maxiijiijbb求出最大后悔值中的最小者:求出最大后悔值中的最小者:184040 minmin0 010102020303040404040策策略略505050500 0101020203030303010010010010050500 010102020202015015015015010010050500 01010101020020020020015015010010050500 00 0决决 策策 方方 案案 的的 选选 择择40403030202010100 0 事事 件件 EiSi*ib5S用公式表示为:用公式表示为:*minmax ijkiibS用表格计算表示为:用表格计算表示为:于是选策略为于是选策略为S S5 5 ,即产生,即产生4040件。

件191,()iijjjinE Sa p计算各决策的期望收益:计算各决策的期望收益:风险决策是指决策者对客观情况不完全了解,但对将发生各风险决策是指决策者对客观情况不完全了解,但对将发生各状态的概率是已知的决策者往往通过调查,根据过去的经验或状态的概率是已知的决策者往往通过调查,根据过去的经验或主观估计等途径获得这些概率在风险决策中一般采用期望值作主观估计等途径获得这些概率在风险决策中一般采用期望值作为决策准则,为决策准则,常用的有最大期望收益决策准则和最小常用的有最大期望收益决策准则和最小期望期望机会损机会损失决策准则失决策准则决策矩阵的各元素代表决策矩阵的各元素代表“策略策略-事件事件”的收益值各状态发生的收益值各状态发生的概率为的概率为pj j ,先计算各策略的期望收益值,然后从这些期望收益,先计算各策略的期望收益值,然后从这些期望收益中选取最大者,它对应的策略为决策应选策略即:中选取最大者,它对应的策略为决策应选策略即:一、最大期望收益决策准则一、最大期望收益决策准则(EMV)(EMV)20以例以例1的数据计算的数据计算 Ei Si状状 态态0 010102020303040400.10.10.20.20.40.40.20.20.10.1策策略略0 00 00 00 00 00 00 01010-10-10505050505050505044442020-20-20404010010010010010010076763030-30-303030909015015015015084 84 maxmax4040-40-40202080801401402002008080 决决 策策 方方 案案 的的 选选 择择()iijjjE xa p4S即选择策略即选择策略 S4,生产,生产 30件。

件然后然后选择:选择:*()maxikiE SS21 矩阵的各元素代表矩阵的各元素代表“策略策略事件事件”对的对的机会损失值机会损失值,各事件各事件E Ej j发生的概率为发生的概率为P Pj j先计算各策略的期望损失值:先计算各策略的期望损失值:二、最小期望机会损失决策准则(二、最小期望机会损失决策准则(EOLEOL)*()minminiijkjiijE SpbS(),1,2,iijjjE Sinpb 然后从这些期望机会损失值中选取最小者,它对应然后从这些期望机会损失值中选取最小者,它对应的策略应是决策者所选策略的策略应是决策者所选策略表上运算与表上运算与前面前面EMVEMV相似相似.22 从本质上讲从本质上讲EMVEMV与与EOLEOL决策准则是一样的,它们之间的关系是:决策准则是一样的,它们之间的关系是:设决策矩阵的收益值为设决策矩阵的收益值为aijij因为当发生的事件的所需因为当发生的事件的所需量等于所选策略的生产量时,收益值最大,即在收益矩阵的量等于所选策略的生产量时,收益值最大,即在收益矩阵的对角线上的值都是其所在列中的最大者于是机会损失矩阵对角线上的值都是其所在列中的最大者。

于是机会损失矩阵可通过以下求得,见下表可通过以下求得,见下表23E E1 1 E E2 2 E En n P P1 1 P P2 2 P Pn n S S1 1 a11-a11 a22-a12 ann-a1n S S2 2 a11-a21 a22-a22 ann-a2n S Sn n a11-an1 a22-an2 ann-ann 24第第 i 策略的机会损失为:策略的机会损失为:EOLi=E(S/i)=p1(a11-ai1)+p2(a22-ai2)+pn(ann-ain)=p1a11+p2a22+pnann(p1ai1+p2ai2+pnain)=K E(Si)=K EMVi 故当故当EMVEMV为最大时,为最大时,EOLEOL便为最小所以在决策时用这便为最小所以在决策时用这两个决策准则所得结果是相同的两个决策准则所得结果是相同的),1,2,iijjjE Sinpb 25 当决策者耗费了一定经费进行调研,获得了各事件发当决策者耗费了一定经费进行调研,获得了各事件发生概率的信号,应采取生概率的信号,应采取“随机应变随机应变”的战术,的战术,这时所得的这时所得的期望收益称为全情报的期望收益,记作期望收益称为全情报的期望收益,记作EPPLEPPL,这收益应当,这收益应当大于至少等于最大期望收益。

即:大于至少等于最大期望收益即:称为对称为对全情报的价值全情报的价值,记作记作 EVPIEVPI ,EPPLEMVEPPLEMV*,则,则 EPPL-EMV EPPL-EMV*=EVPI=EVPI 实际应用时考虑费用构成很复杂,这里仅说明全情报实际应用时考虑费用构成很复杂,这里仅说明全情报价值的概念和其意义价值的概念和其意义26 风险决策时决策者要估计各事件出现的概率,而许多风险决策时决策者要估计各事件出现的概率,而许多决策问题的概率不能通过随机试验去确定,根本无法进行决策问题的概率不能通过随机试验去确定,根本无法进行重复试验如估计某企业倒闭的可能性,只能由决策者根重复试验如估计某企业倒闭的可能性,只能由决策者根据他对这事件的了解去确定这样确定的概率反映了决策据他对这事件的了解去确定这样确定的概率反映了决策者对事件出现的信念程度,称为主观概率者对事件出现的信念程度,称为主观概率 客观概率论者认为概率如同重量、容积、硬度等一样,客观概率论者认为概率如同重量、容积、硬度等一样,是研究对象的物理属性而主观概率者则认为概率是人们是研究对象的物理属性而主观概率者则认为概率是人们对现象的知识的现状的测度,而不是现象本身的测度,因对现象的知识的现状的测度,而不是现象本身的测度,因此不是研究对象的物理属性。

主观概率论者不是主观臆造此不是研究对象的物理属性主观概率论者不是主观臆造事件发生的概率,而是依赖于对事件作周密的观察,去获事件发生的概率,而是依赖于对事件作周密的观察,去获得事前信息事前信息愈丰富,则确定的主观概率就愈准得事前信息事前信息愈丰富,则确定的主观概率就愈准确主观概率论者并不否认实践是第一性的观点所以主确主观概率论者并不否认实践是第一性的观点所以主观概率是进行决策的依据观概率是进行决策的依据确定主观概率时,一般采用专确定主观概率时,一般采用专家估计法家估计法27直接估计法直接估计法是要求参加估计者直接提出概率的估计方法是要求参加估计者直接提出概率的估计方法例如推荐三名本科生考研时,请五位任课教师估计他们例如推荐三名本科生考研时,请五位任课教师估计他们考得第一的概率,若各任课教师作出如下的估计,以下表:考得第一的概率,若各任课教师作出如下的估计,以下表:直接估计法直接估计法 由表的最未一行得到学生由表的最未一行得到学生1 1的概率是的概率是0.430.43,他是最高者他是最高者28 教师代号 权数 学生 1 学生 2 学生 3 1 0.6 0.6 0.3 0.1 2 0.7 0.4 0.5 0.1 3 0.9 0.5 0.3 0.2 4 0.7 0.6 0.3 0.1 5 0.8 0.2 0.5 0.3 归一化后 1.67 0.43 1.31 0.41 0.55 0.16 3.7 1 29 前面曾提到决策者常常碰到的问题是没有掌握充分的信前面曾提到决策者常常碰到的问题是没有掌握充分的信息,于是决策者通过调查及做试验等途径去获得更多的更确息,于是决策者通过调查及做试验等途径去获得更多的更确切的信息,以便掌握各事件发生的概率。

这可以利用贝叶斯切的信息,以便掌握各事件发生的概率这可以利用贝叶斯公式来实现,它体现了最大限度地利用现有信息,并加以连公式来实现,它体现了最大限度地利用现有信息,并加以连续观察和重新估计其步骤为:续观察和重新估计其步骤为:(1)(1)先由过去的经验或专家估计获得将发生事件的事前先由过去的经验或专家估计获得将发生事件的事前(先验)概率先验)概率2)(2)根据调查或试验计算得到条件概率,利用贝叶斯公式:根据调查或试验计算得到条件概率,利用贝叶斯公式:()(|)(|),1,2,()(|)kkkiiP B P A BP BAinP B P A B计算出各事件的事后(后验)概率计算出各事件的事后(后验)概率30 例例2 2:某钻井大队在某地区进行石油勘察,主观估计有某钻井大队在某地区进行石油勘察,主观估计有石油的概率为石油的概率为P(O)=0.5P(O)=0.5;无油的概率为;无油的概率为P(D)=1-0.5=0.5P(D)=1-0.5=0.5,为了提高钻探的效果,先作地震试验,根据积累的资料得为了提高钻探的效果,先作地震试验,根据积累的资料得知:凡有油地区作试验,结果亦好的概率为知:凡有油地区作试验,结果亦好的概率为P(F0)=0.9P(F0)=0.9;作试验结果不好的概率为作试验结果不好的概率为P(U0)=0.1P(U0)=0.1;凡无油地区作试验;凡无油地区作试验结果好的概率为结果好的概率为P(FD)=0.2P(FD)=0.2;作试验结果不好的概率为;作试验结果不好的概率为P(UD)=0.8P(UD)=0.8;问在该地区作试验后,有油与无油的概率各;问在该地区作试验后,有油与无油的概率各是多少?是多少?解:解:先计算做地震试验好与不好的概率;先计算做地震试验好与不好的概率;做地震试验好的概率(全概公式)做地震试验好的概率(全概公式)P(F)=P(O)P(FO)P(F)=P(O)P(FO)P(D)P(FD)P(D)P(FD)=0.5 =0.50.90.90.50.50.2=0.550.2=0.5531做地震试验不好的概率做地震试验不好的概率 P(U)=P(O)P(UO)P(U)=P(O)P(UO)P(D)P(UD)P(D)P(UD)=0.5 =0.50.10.10.50.50.8=0.450.8=0.45做地震试验好的条件下,无油的概率做地震试验好的条件下,无油的概率:()(|)0.459(|)()0.5511P O P F OP O FP F 利用贝叶斯公式计算各事件的事后(后验)概率,做利用贝叶斯公式计算各事件的事后(后验)概率,做地震试验好的条件下,有油的概率地震试验好的条件下,有油的概率:()(|)0.12(|)()0.5511P D P F DP D FP F32做地震试验做地震试验不不好的条件下,无油的概率好的条件下,无油的概率:()(|)0.051(|)()0.459P O P U OP O UP U做地震试验做地震试验不不好的条件下,有油的概率好的条件下,有油的概率:()(|)0.48(|)()0.459P D P U DP D UP U33 例例3 3:某厂生产电子元件。

每批产品次品率的概率分布某厂生产电子元件每批产品次品率的概率分布如下表:该厂进行抽样检验,现抽样如下表:该厂进行抽样检验,现抽样2020件,发现一件次品,件,发现一件次品,试修订事前概率试修订事前概率解:解:根据以上数据计算相应概率列表如下:根据以上数据计算相应概率列表如下:次品率次品率p p 0.020.02 0.050.05 0.100.10 0.150.15 0.200.20 事前概率事前概率P(p)P(p)0.40.4 0.30.3 0.150.15 0.10.1 0.050.05 34次品率次品率p 事前概率事前概率 PO(p)条件概率条件概率P(x=1|20,P)联合概率联合概率P(x=1p)事后概率事后概率P(p|x=1)(1)(2)(3)(4)(5)0.020.050.100.150.200.40.30.150.100.050.27250.37740.27010.13680.05770.109000.113190.040520.013680.002880.390300.405310.145090.048990.01031合计合计 1.00P(x=1)=0.279271.000035 表中第(表中第(3 3)列的数字表示在次品率为)列的数字表示在次品率为p p总总体中抽体中抽2020个检个检验,有验,有1 1个次品个次品的概率,这概率可由以下计算得到。

因为产的概率,这概率可由以下计算得到因为产品抽样检验的次品率是服从品抽样检验的次品率是服从二项分布二项分布这可这可通过通过计算或查表得到:计算或查表得到:P(P(x=1|20,0.02)=0.2725=1|20,0.02)=0.2725 P(P(x=1|20,0.05)=0.3774=1|20,0.05)=0.3774!(|,)(1)!()!xxn xxn xnnP x n pC p qppx nx表中第表中第(4)(4)列数列数字字是按是按(4)=(2)(4)=(2)(3)(3)求得的然后求得:然后求得:P(P(x=1)=P(=1)=P(x=1p=1pi i)=0.27927)=0.27927事后概率按:事后概率按:(5)=(4)/P(5)=(4)/P(x=1)=(4)/0.27927=1)=(4)/0.27927 求得求得36 一一 、效用及效用曲线、效用及效用曲线 效用概念首先是由贝努利提出的,他认为人们对钱财效用概念首先是由贝努利提出的,他认为人们对钱财的真实价值的考虑,与他的钱财拥有量有对数关系,如右的真实价值的考虑,与他的钱财拥有量有对数关系,如右图效用效用U U货币货币M M这就是贝努力的货币效用函这就是贝努力的货币效用函数,经济管理学家将效用作数,经济管理学家将效用作为指标,用来衡量人们对某为指标,用来衡量人们对某些事物的主观价值,态度、些事物的主观价值,态度、偏爱倾向等等。

偏爱倾向等等37 保险业中,尽管按期望值得到的受灾损失比所付的保险金保险业中,尽管按期望值得到的受灾损失比所付的保险金额要小的多或购买奖券时,按期望值计算的得奖金额,要小额要小的多或购买奖券时,按期望值计算的得奖金额,要小于购买奖券的支付,但仍然有很多人愿意付出相对小的支出,于购买奖券的支付,但仍然有很多人愿意付出相对小的支出,为了避免可能出现的很大损失,或有机会得到相当大一笔奖金为了避免可能出现的很大损失,或有机会得到相当大一笔奖金可见实际取货币价值大小不能完全用来衡量一个人的意愿倾向,可见实际取货币价值大小不能完全用来衡量一个人的意愿倾向,由于具体的情况和每个人所处地位的差异对一定钱数的吸引力由于具体的情况和每个人所处地位的差异对一定钱数的吸引力及愿冒风险的态度是不同的,为了具体进行衡量,在决策分析及愿冒风险的态度是不同的,为了具体进行衡量,在决策分析中引进了效用值这个概念中引进了效用值这个概念例如在风险情况下进行决策,决策者对风险的态度是不同例如在风险情况下进行决策,决策者对风险的态度是不同的,用效用来量化的,用效用来量化决策者对待风险的态度决策者对待风险的态度,可以给每个,可以给每个决策决策测定测定他的他的效用曲线(函数)效用曲线(函数)。

最大期望收益值的决策在风险决策中得最大期望收益值的决策在风险决策中得到广泛应用,但在有些情况下,决策者并不按这个原则去做比到广泛应用,但在有些情况下,决策者并不按这个原则去做比较典型的例子:一是保险业,二是购买各种奖券、彩票较典型的例子:一是保险业,二是购买各种奖券、彩票38 例例1 1:有一个投资为有一个投资为200万元的工厂该厂发生火灾的万元的工厂该厂发生火灾的可能性是可能性是0.1工厂的决策者面临的问题是:要不要保工厂的决策者面临的问题是:要不要保险若保险,每年应支付险若保险,每年应支付2500元保险费,在一旦发生火灾元保险费,在一旦发生火灾后,保险公司可以偿还全部资产若不保险,就不需要支后,保险公司可以偿还全部资产若不保险,就不需要支付保险费,但发生火灾后,工厂的决策者承担资产损失的付保险费,但发生火灾后,工厂的决策者承担资产损失的责任决策者面对这个决策问题时,若仍按货币益损期望值为决策者面对这个决策问题时,若仍按货币益损期望值为准则进行决策,他的结论悬不保险因为工厂发生火灾的损准则进行决策,他的结论悬不保险因为工厂发生火灾的损失的期望值是失的期望值是:200万元万元0.0012000元小于保险费。

这种结元小于保险费这种结论往往与实际情况不一致工厂决策者一般都是愿意保险她论往往与实际情况不一致工厂决策者一般都是愿意保险她并愿意每年支付保险玖而不希望发生火灾并愿意每年支付保险玖而不希望发生火灾39 例例2:设工人甲在工作中作出了贡献厂领导决定给他发设工人甲在工作中作出了贡献厂领导决定给他发一笔奖金,并规定两种领奖办法一笔奖金,并规定两种领奖办法:第一种,直接发给某甲第一种,直接发给某甲100元奖金元奖金;第二种,采用抽签发奖办法,抽中了,可得到奖金第二种,采用抽签发奖办法,抽中了,可得到奖金300元,元,抽不中,则得不到奖金抽不中,则得不到奖金抽中或抽不中的概率各为抽中或抽不中的概率各为0.5)问甲愿意按那种办法领奖问甲愿意按那种办法领奖?40 在风险情况下,只作一次决策时,再用最大期望值决策在风险情况下,只作一次决策时,再用最大期望值决策准则,就不那么合理了如下表是各方案及按最大收益期望值准则,就不那么合理了如下表是各方案及按最大收益期望值的计算结果表中的三个方案的的计算结果表中的三个方案的EMVEMV 都相同,显然这三个方案都相同,显然这三个方案并不是等价的另一方面,因并不是等价的。

另一方面,因EMVEMV *给出的是平均意义下的最给出的是平均意义下的最大,当决策只实现一次时,用大,当决策只实现一次时,用EMVEMV *决策准则就不恰当了这决策准则就不恰当了这时可用最大效用值决策准则来解决这一矛盾时可用最大效用值决策准则来解决这一矛盾效用值是一个相对的指标值,一般可规定:凡对决策者最效用值是一个相对的指标值,一般可规定:凡对决策者最爱好、最倾向、最愿意的事物(事件)的效用值赋予爱好、最倾向、最愿意的事物(事件)的效用值赋予1 1,而最不,而最不爱好的赋予爱好的赋予0 0也可以用其他的数值范围,如(也可以用其他的数值范围,如(100 0100 0)效用无量纲指标通过效用这一指标可将某些难于量化有质的差用无量纲指标通过效用这一指标可将某些难于量化有质的差别的事物(事件)给予量化如某人面临多种方案的选择工作别的事物(事件)给予量化如某人面临多种方案的选择工作时,要考虑地点、工作性质、单位福利等等可将要考虑的因时,要考虑地点、工作性质、单位福利等等可将要考虑的因素都折合为效用值得到各方案的综合效用值,然后选择效用素都折合为效用值得到各方案的综合效用值,然后选择效用值最大的方案,这就是值最大的方案,这就是最大效用值决策准则最大效用值决策准则。

41200 200200-100-200 -500-100600500400-200 200400600500ABC0.20.20.30.3EMVE4E3E2E1 Ej pi Si42 确定效用曲线的基本方法有两种,一种是直接提确定效用曲线的基本方法有两种,一种是直接提问法,另一种是对比提问法问法,另一种是对比提问法二、二、效用曲线的确定效用曲线的确定 1 1直接提问法直接提问法是向决策者提出一系列问题,要求决是向决策者提出一系列问题,要求决策者进行主观衡量并作出回答例如向某决策者提问:策者进行主观衡量并作出回答例如向某决策者提问:“今年你企业获利今年你企业获利100100万,你是满意的,那么获利多少,万,你是满意的,那么获利多少,你会加倍满意?你会加倍满意?”若决策者回答若决策者回答200200万这样不断地提万这样不断地提问与回答,可绘制出这决策者的获利效用曲线显然问与回答,可绘制出这决策者的获利效用曲线显然这种提问与回答是十分含糊的,很难确切,所以应用这种提问与回答是十分含糊的,很难确切,所以应用较少43 2 2对比提问法对比提问法:设决策者面临两种可选方案设决策者面临两种可选方案A A1 1,A A2 2 。

A A1 1表示他可无任何风险地得到一笔金额表示他可无任何风险地得到一笔金额x2 2 ;A A2 2表示他可表示他可以概率以概率p p得到一笔金额得到一笔金额x1 1,或以概率,或以概率(1-p)(1-p)得到金额得到金额x3 3 ;且且x1 1 x2 2 x3 3 ,设,设U(U(x)表示金额表示金额x的效用值若在某条件的效用值若在某条件下,这决策者认为下,这决策者认为A A1 1、A A2 2两方案等价时,可表示为:两方案等价时,可表示为:pU(pU(x1 1)+(1-p)U()+(1-p)U(x3 3)=U()=U(x2 2)确切地讲,这决策者认为确切地讲,这决策者认为x2 2的效用值等于的效用值等于x1 1 、x3 3的的效用期望值于是可用对比提问法来测定决策者的风险效用期望值于是可用对比提问法来测定决策者的风险效用曲线从上式可见,其中有效用曲线从上式可见,其中有x1 1 、x2 2 、x3 3 、p p 四个四个变量,若其中任意三个为已知时,向决策者提问第四个变量,若其中任意三个为已知时,向决策者提问第四个变量应取何值?并请决策者作出主观判断第四个变量应变量应取何值?并请决策者作出主观判断第四个变量应取的值是多少。

提问的方式大致有三种:取的值是多少提问的方式大致有三种:44 (1)(1)每每次固定次固定x1 1 、x2 2 、x3 3的值,改变的值,改变 p p,问决策者:,问决策者:“p p取何值时,认为取何值时,认为A A1 1与与A A2 2等价2)(2)每每次固定次固定p p、x1 1、x3 3的值,改变的值,改变x2 2,问决策者:,问决策者:“x2 2取取何值时,认为何值时,认为A A1 1与与A A2 2等价3)(3)每次固定每次固定p p、x2 2 、x3 3 (或或x1 1)的值的值,改变改变x3 3(或或x1 1),),问决问决策者:策者:“x3 3(或或x1 1)取何值时,取何值时,认为认为A A1 1与与A A2 2等价一般采用改进的一般采用改进的V VM M 法即每次取法即每次取p=0.5p=0.5 ,固定,固定x1、x3利用:利用:0.5U(0.5U(x1 1)+0.5U()+0.5U(x3 3)=U()=U(x2 2),确定确定x2 2的值的值,由此由此可可绘出这决策者的效用曲线绘出这决策者的效用曲线45 当用计算机时需用解析式来表示效用曲线,并对决策当用计算机时需用解析式来表示效用曲线,并对决策者测得的数据进行拟合,常用的关系式有以下六种。

者测得的数据进行拟合,常用的关系式有以下六种三、三、效用曲线的拟合效用曲线的拟合 (1 1)线性函数:)线性函数:U(x)=c1+a1(x c2)(2 2)指数函数:)指数函数:22()11()1ax cU xcae (3 3)双指数函数:)双指数函数:2233()()11()2ax cax cU xcaee (4 4)指数加线性函数:)指数加线性函数:22()1133()1()ax cU xcaa xce (5 5)幂函数:)幂函数:411223()()aU xacac xa(6 6)对数函数:)对数函数:1132()log()U xcac xc46 有些决策问题,当进行决策后又产生一些新情况,有些决策问题,当进行决策后又产生一些新情况,并需要进行新的决策,接着又有一些新情况,又需要进并需要进行新的决策,接着又有一些新情况,又需要进行新的决策这样决策、情况、决策行新的决策这样决策、情况、决策构成一个序列,构成一个序列,这就是序列决策描述序列决策的有力工具是决策树,这就是序列决策描述序列决策的有力工具是决策树,决策树是由决策点,事件及结果构成的树形结构图一决策树是由决策点,事件及结果构成的树形结构图。

一般选用最大收益期望值和最大效用期望值或最大效用值般选用最大收益期望值和最大效用期望值或最大效用值为决策准则,下面用例子加以说明为决策准则,下面用例子加以说明47 例例1 1:某洗衣机厂,根据市场信息认为单缸洗衣某洗衣机厂,根据市场信息认为单缸洗衣机将不受消费者欢迎,双缸洗衣机可以上马,现在有机将不受消费者欢迎,双缸洗衣机可以上马,现在有两种方案可供选择:两种方案可供选择:A A1 1:把原生产单缸洗衣机生产线改造扩建为生产双缸把原生产单缸洗衣机生产线改造扩建为生产双缸机的生产线;机的生产线;A A2 2:保留原生产单缸机的生产线,新建一条生产双缸保留原生产单缸机的生产线,新建一条生产双缸机的专门生产线据预测,双缸机销路好的概率估计机的专门生产线据预测,双缸机销路好的概率估计为为0.70.7,销路不好的概率为销路不好的概率为0.30.3在两种情况下各方案在两种情况下各方案的益损值如下表,试求最优方案的益损值如下表,试求最优方案48损益值单位:百万元损益值单位:百万元 Si AiS1:销路好:销路好S1:销路差:销路差p1=0.7 p2=0.3A18030A2100-30解:解:根据以上资料,可绘出如下图所示的决策树:根据以上资料,可绘出如下图所示的决策树:49 图中,图中,方格方格表示决策点,从决策点引出的分支称为方表示决策点,从决策点引出的分支称为方案分支(或策略分支),分支数就是可能的方案数,如本例案分支(或策略分支),分支数就是可能的方案数,如本例中有两个方案即从方格引出两条方案分支中有两个方案即从方格引出两条方案分支A A1 1、A A2 2 。

A A1 1A A2 2S S1 1:p:p1 1=0.7=0.7S S2 2:p:p2 2=0.3=0.3S S1 1:p:p1 1=0.7=0.7S S2 2:p:p2 2=0.3=0.380803030100100-30-3065656161 65652 23 31 150 圆圈圆圈表示状态点,从状态点引出全部状态分支表示状态点,从状态点引出全部状态分支(或概率或概率分支分支)在状态分支上标明该状态出现的概率在状态分支上标明该状态出现的概率三角形三角形表示结果点,旁边的数字表示这一方案在相应状表示结果点,旁边的数字表示这一方案在相应状态下的益损值态下的益损值在绘制决策树时,对决策点和状态点进行编号,号码就在绘制决策树时,对决策点和状态点进行编号,号码就写在方格或圆圈中对各状态点计算益损值的期望值,写在写在方格或圆圈中对各状态点计算益损值的期望值,写在圆圈的上方圆圈的上方在本例中:在本例中:状态点状态点2 2:E E1 1=0.7=0.7 80+0.380+0.3 30=6530=65 状态点状态点3 3:E E2 2=0.7=0.7 100+0.3100+0.3(-30)=61(-30)=61因此在状态点因此在状态点2 2和和3 3的上方分别标上的上方分别标上 65 65 和和 61 61。

51 计算完从一个决策点引出的所有方案分枝所连接的状计算完从一个决策点引出的所有方案分枝所连接的状态点的期望值后,按目标要求删去不合要求的方案分枝,态点的期望值后,按目标要求删去不合要求的方案分枝,把保留下来的方案分枝所连接的状态点上的数字移到决策把保留下来的方案分枝所连接的状态点上的数字移到决策点上方本例中,要求期望值较大,因此删去本例中,要求期望值较大,因此删去A A2 2分枝保留分枝保留A A1 1分分枝,把状态点枝,把状态点2 2上的数字移到决策点的上方现在决策树已上的数字移到决策点的上方现在决策树已绘完,最优决策方案是绘完,最优决策方案是A A1 1 由这个例子可以看出,决策树的绘制可分为建树和计由这个例子可以看出,决策树的绘制可分为建树和计算期望值两个步骤建树时,从左到右依次绘出所有的决算期望值两个步骤建树时,从左到右依次绘出所有的决策点、方案分枝、状态点、状态分枝、结果点然后标上策点、方案分枝、状态点、状态分枝、结果点然后标上相应的概率,按上法从右到左(即从结果点开始)计算期相应的概率,按上法从右到左(即从结果点开始)计算期望值,删除一些分枝就可得到完整的决策树望值,删除一些分枝就可得到完整的决策树。

52 例例2 2:设有某石油钻探队,在某地区进行石油勘察,可设有某石油钻探队,在某地区进行石油勘察,可以先作地震试验,然后决定是否钻井,或者不做地震试验,以先作地震试验,然后决定是否钻井,或者不做地震试验,只凭经验决定是否钻井做地震试验的费用为每次只凭经验决定是否钻井做地震试验的费用为每次30003000元,元,钻井费用为钻井费用为1000010000元若钻井出油可获收入元若钻井出油可获收入4000040000元,若钻井元,若钻井不出油则没有任何收入,各种情况下的概率已估计出来,问不出油则没有任何收入,各种情况下的概率已估计出来,问钻探队的决策者如何决策使得期望收入值达到最大钻探队的决策者如何决策使得期望收入值达到最大解:解:根据以上资料,可绘出如下图所示的决策树:根据以上资料,可绘出如下图所示的决策树:5340000400000 0-10000-100001 11 12 22 20 00.850.85出油出油不出油不出油不钻井不钻井不出油不出油3 3好好钻井钻井不好不好不试验不试验 钻井钻井0.150.1540000400000 03 30.10.1出油出油不出油不出油0.90.9试验试验40000400000 0-10000-100004 44 40 00.550.55出油出油不出油不出油不钻井不钻井钻井钻井0.450.45-3000-3000-10000-1000034000340004000400022000220000 0不钻井不钻井0.60.60.40.424000240000 01200012000144000144000120001200054 1 1)计算各事件点的收入期望值:计算各事件点的收入期望值:事件点事件点2 2:E E2 2=40000=40000 0.85+00.85+0 0.15=340000.15=34000事件点事件点3 3:E E3 3=40000=40000 0.10+00.10+0 0.90=40000.90=4000事件点事件点4 4:E E4 4=40000=40000 0.55+00.55+0 0.45=220000.45=22000将收入期望标在相应各点处(图中红色数字)将收入期望标在相应各点处(图中红色数字)。

2 2)按最大收入期望值决策准则在各决策点进行决策:按最大收入期望值决策准则在各决策点进行决策:决策点决策点2 2:max(34000-10000),0=24000max(34000-10000),0=24000决策点决策点3 3:max(4000-10000),0=0max(4000-10000),0=0决策点决策点4 4:max(22000-10000),0=12000max(22000-10000),0=12000并选择相应决策并选择相应决策5534000340000 01 11 12 2不钻井不钻井好好钻井钻井不好不好不试验不试验试验试验-3000-3000400040000 0-10000-100003 3不钻井不钻井钻井钻井-10000-100004 4不钻井不钻井钻井钻井-10000-1000022000220000 056 3 3)计算事件点计算事件点1 1的收入期望值:的收入期望值:事件点事件点1 1:E E1 1=24000=24000 0.6+00.6+0 0.4=144000.4=14400 4 4)在决策点进行决策:在决策点进行决策:决策点决策点1 1:max(14400-3000),12000=12000max(14400-3000),12000=12000相应决策是不做地震试验。

相应决策是不做地震试验这个决策问题的决策序列是:不做地震试验,直接钻井,这个决策问题的决策序列是:不做地震试验,直接钻井,期望收入为期望收入为1200012000元24000240001 11 1好好不好不好不试验不试验试验试验-3000-30000.60.60.40.412000120000 057例例3 3:决策者的效用函数如下,试以最大效用期望值决策决策者的效用函数如下,试以最大效用期望值决策解:解:根据以上资料,可绘出如下图所示的决策树:根据以上资料,可绘出如下图所示的决策树:58。

下载提示
相关文档
正为您匹配相似的精品文档