1第八章虚拟变量回归计量经济学2在对在校学生的消费行为进行的调查中在对在校学生的消费行为进行的调查中,发现在校发现在校生的消费行为呈现多元化的结构人际交往消费、生的消费行为呈现多元化的结构人际交往消费、类消费、衣着类消费、化妆品类消费、电脑类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显消费、学习用品类消费不突显显然显然,男女生在消费上存在差异为了了解男、女男女生在消费上存在差异为了了解男、女生的消费支出结构差异,应当如何建立模型?生的消费支出结构差异,应当如何建立模型?面临的问题:面临的问题:如何把男女生这样的非数量变量引如何把男女生这样的非数量变量引入方程?入方程?引子引子:男女大学生消费真有差异吗男女大学生消费真有差异吗?3 问题的一般性描述问题的一般性描述在实际建模中,一些在实际建模中,一些定性变量定性变量具有不可忽视的重要具有不可忽视的重要影响例如,研究某个企业的销售水平,产业属性影响例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是因素共同的特征是定性描述定性描述的。
的如何对非定量因素进行回归分析?如何对非定量因素进行回归分析?采用采用“虚拟变量虚拟变量”对定性变量进行量化一种思路对定性变量进行量化一种思路4第八章第八章 虚拟变量回归虚拟变量回归 本章主要讨论本章主要讨论:虚拟变量虚拟变量 虚拟解释变量的回归虚拟解释变量的回归 虚拟虚拟被解释变量被解释变量的回归的回归(选讲选讲,不包括不包括)5第一节第一节 虚拟变量虚拟变量 本节基本内容本节基本内容:基本概念基本概念 虚拟变量设置规则虚拟变量设置规则 6一、基本概念一、基本概念定量因素:可直接测度、数值性的因素定量因素:可直接测度、数值性的因素定性因素:属性因素,表征某种属性定性因素:属性因素,表征某种属性存在与否存在与否的的 非数值非数值性的因素性的因素基本思想:基本思想:直接在回归模型中加入定性因素存在诸多的困难直接在回归模型中加入定性因素存在诸多的困难(那些困难?),是否可将这些定性因素进行量(那些困难?),是否可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用化,以达到定性因素能与定量因素有着相同作用之目的7计量经济学中,将计量经济学中,将取值为取值为0 0和和1 1的人工变量称为虚的人工变量称为虚拟变量。
虚拟变量也称:哑元变量、定性变量等拟变量虚拟变量也称:哑元变量、定性变量等等通常用字母等通常用字母D或或DUM加以表示(英文中虚拟加以表示(英文中虚拟或者哑元或者哑元Dummy的缩写)的缩写)对定性变量的量化可采用虚拟变量的方式实现对定性变量的量化可采用虚拟变量的方式实现一般设置某一属性存在则一般设置某一属性存在则d=1d=1,属性不存在则,属性不存在则d=0d=0这样就这样就 把不能精确计量的定性因素用把不能精确计量的定性因素用0-10-1数字来数字来定量描述了定量描述了虚拟变量的定义虚拟变量的定义8虚拟变量的设置规则涉及三个方面虚拟变量的设置规则涉及三个方面:1.“0”1.“0”和和“1”1”选取原则选取原则 2.2.属性(状态、水平)因素与设置虚拟变量属性(状态、水平)因素与设置虚拟变量数量的关系数量的关系 3.3.虚拟变量在回归分析中的角色以及作用等虚拟变量在回归分析中的角色以及作用等方面的问题方面的问题二、二、虚拟变量虚拟变量设置规则设置规则9 “0”“0”和和“1”1”选取原则选取原则l 虚拟变量取虚拟变量取“1”1”或或“0”0”的原则,应从分析问的原则,应从分析问题的目的出发予以界定。
题的目的出发予以界定l 从理论上讲,虚拟变量取从理论上讲,虚拟变量取“0”0”值通常代表比较值通常代表比较的基础类型的基础类型;而虚拟变量取;而虚拟变量取“1”1”值通常代表被值通常代表被比较的类型比较的类型0”0”代表基期(比较的基础,参照物);代表基期(比较的基础,参照物);“1”1”代表报告期(被比较的效应)代表报告期(被比较的效应)10例如,比较收入时考察性别的作用当研究男性收入是否例如,比较收入时考察性别的作用当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有高于女性时,是将女性作为比较的基础(参照物),故有男性为男性为“1”1”,女性为,女性为“0”0”例例1 1问题问题:为何只选为何只选0 0、1 1,选,选2 2、3 3、4 4行吗?为什么?行吗?为什么?D1男(1)=0女D()1 改革开放以后2 =0 改革开放以前1D天 气 阴()其 他13=02D()1天 气 雨4=0其 他11定性因素的属性既可能为两种状态,也可能为多种定性因素的属性既可能为两种状态,也可能为多种状态例如,性别(男、女两种)、季节(状态例如,性别(男、女两种)、季节(4 4种状种状态),地理位置(东、中、西部),行业归属,所态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。
有制,收入的分组等属性的状态(水平)数与虚拟变量属性的状态(水平)数与虚拟变量数量的关系数量的关系 (0,1)(0,0)D D12(1,0)天气阴如:(,)=天气雨其 他121 1.若定性因素具有若定性因素具有 个个 相互排斥属性相互排斥属性(或或几个水平几个水平),当回归模型有截距项时,只能引入,当回归模型有截距项时,只能引入 个虚拟变量;个虚拟变量;2.2.当回归模型无截距项时,则可引入当回归模型无截距项时,则可引入 个虚拟变个虚拟变量;否则,就会陷入量;否则,就会陷入“虚拟变量陷阱虚拟变量陷阱”为什(为什么?)么?)虚拟变量数量的设置规则虚拟变量数量的设置规则()m 2-1mmm13研究居民住房消费支出研究居民住房消费支出 和居民可支配收入和居民可支配收入 之间的之间的数量关系回归模型的设定为:数量关系回归模型的设定为:现在要考虑城镇居民和农村居民之间的差异,如何办?现在要考虑城镇居民和农村居民之间的差异,如何办?为了对为了对“城镇居民城镇居民”、“农村居民农村居民”进行区分,分析进行区分,分析各自在住房消费支出各自在住房消费支出 上的差异,设上的差异,设 为城镇为城镇;为农村为农村,则模型为则模型为(模型有截距,模型有截距,“居民属性居民属性”定性变量只有两个相互排斥定性变量只有两个相互排斥的属性状态(的属性状态(),故只设定一个虚拟变量。
故只设定一个虚拟变量)一个例子一个例子(虚拟变量陷阱虚拟变量陷阱)iXiY011iiiY=+X+u()01112iiiY=+X+D+u()1=1iDiY1=0iD2m14若对两个相互排斥的属性若对两个相互排斥的属性“居民属性居民属性”,仍然,仍然引入引入 个虚拟变量,则有个虚拟变量,则有则模型(则模型(1 1)为)为则对任一家庭都有:则对任一家庭都有:,即产生完全共线,陷入了即产生完全共线,陷入了“虚拟变量陷阱虚拟变量陷阱”虚拟变量陷阱虚拟变量陷阱”的实质是:的实质是:完全多重共线性完全多重共线性21=0iD农村居民城镇居民0111223iiiYXDDu()121D+D=11=0iD城镇居民农村居民1210D+D-=2m15三、虚拟变量的作用n属性因素代表:性别,所有制n非精确计量的数量因素的代表:教育程度,管理者素质,企业规模n偶然因素或政策因素代表:战争、灾害、改革等n时间序列里的季节或月份的代表n分段回归,研究截距斜率变化16虚拟变量既可作为被解释变量,也可作为解释虚拟变量既可作为被解释变量,也可作为解释变量,分别称其为虚拟被解释变量和虚拟解释变量变量,分别称其为虚拟被解释变量和虚拟解释变量。
虚拟被解释变量的研究是当前计量经济学研究的虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如前沿领域,如MacFadden、Heckmen等人的微观计等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析量经济学研究,大量涉及到虚拟被解释变量的分析本课程本课程只是讨论虚拟解释变量只是讨论虚拟解释变量的问题的问题 虚拟变量在回归模型中的角色虚拟变量在回归模型中的角色17第二节第二节 虚拟解释变量的回归虚拟解释变量的回归 本节基本内容本节基本内容:加法类型加法类型 乘法类型乘法类型 虚拟解释变量综合应用虚拟解释变量综合应用18在计量经济学中,通常引入虚拟变量的方式分为在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种:即加法方式和乘法方式两种:即实质实质:加法方式引入虚拟变量改变的是加法方式引入虚拟变量改变的是截距截距;乘法方式引入虚拟变量改变的是乘法方式引入虚拟变量改变的是斜率斜率0tttYXu1D1tttYXu2tX D0112iii Y=+X+u=+D=+D原原模模型型加加法法方方式式引引入入乘乘法法方方式式引引入入:19 以加法方式引入虚拟变量时,主要考虑的问以加法方式引入虚拟变量时,主要考虑的问 题是定性因素的属性和引入虚拟变量的个数。
题是定性因素的属性和引入虚拟变量的个数分为四种情形讨论:分为四种情形讨论:(1 1)解释变量只有一个定性变量而无定量变量,)解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;而且定性变量为两种相互排斥的属性;(2 2)解释变量分别为一个定性变量(两种属性)解释变量分别为一个定性变量(两种属性)和一个定量解释变量;和一个定量解释变量;一、加法类型一、加法类型20(3 3)解释变量分别为一个定性变量(两种)解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量;以上属性)和一个定量解释变量;(4 4)解释变量分别为两个定性变量(各自)解释变量分别为两个定性变量(各自分别是两种属性)和一个定量解释变量;分别是两种属性)和一个定量解释变量;21(1 1)一个两种属性定性解释变量而)一个两种属性定性解释变量而无定量变量的情形无定量变量的情形010iiiiYY城市()0101()iiiiiiiYf DDYD模型形式:例如:010E=1=+E=0=iiiiY|DY|D那么:()1 0iD城市其中:(比较的基础:农村)农村农村22n这种类型实质是研究两类样本是否存在差别通过判断系数是否显著。
23(2)一个定性解释变量(两种属性)一个定性解释变量(两种属性)和一个定量解释变量的情形和一个定量解释变量的情形01011 0iiiiiiiiiiY=f(DX)+DY=D+X+YXD模型形式,例如:城市其中:支出;收入;农村010|,1|,0iiiiiiiiE YXDXE YXDX()()010iiiiiiY=+X+Y=+X+()城市农村24共同的特征:由收入引起的平均消费变化共同的特征:由收入引起的平均消费变化是相同的,但截距发生改变是相同的,但截距发生改变YX125(3 3)一个定性解释变量(两种以上)一个定性解释变量(两种以上属性)和一个定量解释变量的情形属性)和一个定量解释变量的情形1201 12233123()564110010iiiiiiY=f X D D.+YXDYDDDXDDD模型形式(如:民族有种特性;季度有 种特性)例如:啤酒售量、人均收入、季度;一季度二季度其中:其它其它三季度其它,26单个是否显著用t检验判断,各个参数都为零的联合假设检验由F检验完成11230112130213120311230E,1,0E,1,0()E,1,0()E,0iiiiiiiiY|X DDDXY|X DDDXY|X DDDXY|X DDDX一季度:二季度:三季度:四季度:基准:四季度()27n啤酒消费需求模型,为了分析城乡差别和季节差异,引入两个虚拟变量(这时不会有虚拟变量陷阱,因为这两个没有非此即彼关系)。
4 4)两个定性解释变量(均为两种属)两个定性解释变量(均为两种属性)和一个定量解释变量的情形性)和一个定量解释变量的情形,农村居民,城镇居民,冬季,夏季为虚拟变量、为收入,表示啤酒需求量,01D01DDDYQuYDDQ3i2i3i2iiiii3i2i21i28夏季、城市居民夏季、农村居民1201E=1,=0=+iiiY|X,DDX()+120E|,0,0iiiYXDDX12012E|,1,1iiiYXDDX()1202E|,0,1()iiiYXDDX冬季、城市居民冬季、农村居民29上述图形的前提条件是什么?上述图形的前提条件是什么?DD121,1DD120,10DD121,00DD12,YX30 运用运用OLS得到回归结果,再用得到回归结果,再用t检验讨论因素检验讨论因素 是否对模型有影响是否对模型有影响01 122.tttkktttYDDDXu 加法方式引入虚拟变量的一般表达式加法方式引入虚拟变量的一般表达式:基本分析方法基本分析方法:条件期望条件期望1201122E(/,.,).tttktttkkttY D DDDDDX 31加法方式引入虚拟变量的主要作用为:加法方式引入虚拟变量的主要作用为:1.1.在有定量解释变量的情形下,主要改变方程在有定量解释变量的情形下,主要改变方程 截距;截距;2.2.在没有定量解释变量的情形下,主要用于方在没有定量解释变量的情形下,主要用于方 差分析。
差分析32基本思想基本思想以乘法方式引入虚拟变量时,是在所设立的模型中,将以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟虚拟解释变量与其它解释变量的乘积,作为新的解释变量出现在解释变量与其它解释变量的乘积,作为新的解释变量出现在模型中,模型中,以达到其调整设定模型斜率系数的目的或者将模以达到其调整设定模型斜率系数的目的或者将模型斜率系数表示为虚拟变量的函数,以达到相同的目的型斜率系数表示为虚拟变量的函数,以达到相同的目的乘法引入方式乘法引入方式:(1 1)截距不变;)截距不变;(2 2)截距和斜率均发生变化;)截距和斜率均发生变化;分析手段:分析手段:仍然是条件期望仍然是条件期望二、乘法类型二、乘法类型33模型形式:模型形式:例:研究消费支出例:研究消费支出 受收入受收入 、年份状况、年份状况 的影响的影响(1 1)截距不变的情形)截距不变的情形YX12121()10E|,1()E|,0ttttttttttttttYXDXYXDY X DXY X DX 反常年份其中:消费支出;收入;正常年份反常年份正常年份在正常年份的基础上进行比较,(只有斜率系数发生改变)12,tttttY=f X D XuD D34(2 2)截距和斜率均发生变化)截距和斜率均发生变化 例,同样研究消费支出例,同样研究消费支出 、收入收入 、年份状况、年份状况 间的影间的影 响关系。
响关系011201121()10E|,1()E|,0tttttttttttttttYXDD XYXDYXDXYXDX反常年份其中:消费支出;收入;正常年份反常年份正常年份在正常年份基础上比较,截距和斜率系数都改变,为什么?模型形式:模型形式:YX0112,ittttYfXDD XDDD35不同截距、斜率的组合图形不同截距、斜率的组合图形重合回归:截距斜率均相同重合回归:截距斜率均相同平行回归:截距不同斜率相同平行回归:截距不同斜率相同共点回归:截距相同斜率不同共点回归:截距相同斜率不同交叉(不同)回归:截距斜率均不同交叉(不同)回归:截距斜率均不同36三、虚拟解释变量综合应用三、虚拟解释变量综合应用所谓综合应用是指将引入虚拟解释变量的加法方所谓综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用式、乘法方式进行综合使用基本分析方式仍然是条件期望分析基本分析方式仍然是条件期望分析本课主要讨论本课主要讨论(1 1)结构变化分析;)结构变化分析;(2 2)交互效应分析;)交互效应分析;(3 3)分段回归分析)分段回归分析37(1 1)结构变化分析)结构变化分析 结构变化的实质是结构变化的实质是检验所设定的模型在样本期内检验所设定的模型在样本期内是否为同一模型是否为同一模型。
显然,平行回归、共点回归、显然,平行回归、共点回归、不同的回归三个模型均不是同一模型不同的回归三个模型均不是同一模型平行回归模型的假定是斜率保持不变(加法类型,平行回归模型的假定是斜率保持不变(加法类型,包括方差分析);包括方差分析);共点回归模型的假定是截距保持不变(乘法类型,共点回归模型的假定是截距保持不变(乘法类型,又被称为协方差分析);又被称为协方差分析);不同的回归的模型的假定是截距、斜率均为变动不同的回归的模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)的(加法、乘法类型的组合)38 例:比较改革开放前、后我国居民(平均)例:比较改革开放前、后我国居民(平均)“储储 蓄蓄收入收入”总量关系是否发生了变化?总量关系是否发生了变化?模型的设定形式为模型的设定形式为 :1212()1:10ttttttttYDXD XuYXD其中为储蓄总额,为收入总额改革开放后改革开放前39显然,只要显然,只要 、不同时为零,上述模型就能刻画不同时为零,上述模型就能刻画改革开放前后我国居民储蓄收入模型结构是否发生改革开放前后我国居民储蓄收入模型结构是否发生变化回归方程:回归方程:2 121211E|,1 2E|,0(3)ttttttYX DXYX DX改革开放后()()改革开放前240与单独对两端分别回归相比:与单独对两端分别回归相比:1.用一个回归代替多个回归,简化分析用一个回归代替多个回归,简化分析2.可以方便地对模型结构的差异做各种可以方便地对模型结构的差异做各种假设检验(四种模型都可以容纳在一假设检验(四种模型都可以容纳在一个模型里)。
个模型里)3.合并回归增加了自由度,提高了参数合并回归增加了自由度,提高了参数估计的精确性估计的精确性41(2 2)交互效应分析)交互效应分析交互作用交互作用:一个解释变量的边际效应有时可能要依赖于另一一个解释变量的边际效应有时可能要依赖于另一个解释变量为此,个解释变量为此,Klein和和Morgen(1951)(1951)提出了提出了有关收入和财产在决定消费模式上相互作用的假有关收入和财产在决定消费模式上相互作用的假设他们认为消费的边际倾向不仅依赖于收入,设他们认为消费的边际倾向不仅依赖于收入,而且也依赖于财产的多少而且也依赖于财产的多少 较富有的人可能会较富有的人可能会有不同的消费倾向有不同的消费倾向42为了捕获该影响,设为了捕获该影响,设 假设边际假设边际消费倾向消费倾向 依赖于财产依赖于财产 一个简单的表示方法一个简单的表示方法就是就是 代入消费函数,有:代入消费函数,有:由于由于 捕获了收入和财产之间的相互作用而被称捕获了收入和财产之间的相互作用而被称为为交互作用项交互作用项显然,刻画交互作用的方法,在变量为数量显然,刻画交互作用的方法,在变量为数量(定量定量)变量时,变量时,是以乘法方式引入虚拟变量的。
是以乘法方式引入虚拟变量的CYuCYYZu12Z12ZYZ43例例:是否发展油菜籽生产与是否发展养蜂生产的是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益的影响研究差异对农副产品总收益的影响研究模型设定为模型设定为:(1 1)式中)式中,以加法形式引入虚拟变量暗含何假设以加法形式引入虚拟变量暗含何假设?122332311100iiiiiiiYDDXuYXDD()其中:(农副产品收益);(农副产品投入)发展养蜂生产发展油菜籽生产;其他其他44(1 1)式以加法形式引入,暗含的假设为:)式以加法形式引入,暗含的假设为:菜籽生产和养蜂生产是菜籽生产和养蜂生产是分别独立地影响分别独立地影响农副品生产农副品生产总收益但是,在发展油菜籽生产时,同时也发展总收益但是,在发展油菜籽生产时,同时也发展养蜂生产,所取得的农副产品生产总收益,可能会养蜂生产,所取得的农副产品生产总收益,可能会高于不发展养蜂生产的情况即在是否发展油菜籽高于不发展养蜂生产的情况即在是否发展油菜籽生产与养蜂生产的虚拟变量生产与养蜂生产的虚拟变量 和和 间,很可能间,很可能存在着一定的交互作用,且这种交互影响对被解释存在着一定的交互作用,且这种交互影响对被解释变量农副产品生产收益会有影响。
变量农副产品生产收益会有影响2iD3iD45问题:问题:如何刻画同时发展油菜籽生产和养蜂生产的如何刻画同时发展油菜籽生产和养蜂生产的交互作用?交互作用?基本思想基本思想:在模型中引入相关的两个变量的乘积在模型中引入相关的两个变量的乘积区别之处区别之处在于,上页定义中的交互效应是针对数量在于,上页定义中的交互效应是针对数量变量,而现在是定性变量变量,而现在是定性变量,又应当如何处理又应当如何处理?46为了反映为了反映交互效应交互效应,将(,将(1 1)变为:)变为:基础类型:基础类型:发展油菜籽生产:发展油菜籽生产:发展养蜂生产:发展养蜂生产:同时发展油菜籽和同时发展油菜籽和养蜂生产:养蜂生产:1iiiYXu13iiiYXu()12iiiYXu()1234iiiYXu()12233423iiiiiiiYDDD DXu47如何检验交互效应是否存在?如何检验交互效应是否存在?若拒绝原假设,即交互效应对若拒绝原假设,即交互效应对 产生了影响(应产生了影响(应该引入模型)该引入模型)2340414H0H0iiDDt看系数对应的 值:即检验:Y48作用作用:提高模型的描述精度提高模型的描述精度虚拟变量也可以用来代表数量因素的不同阶段。
虚拟变量也可以用来代表数量因素的不同阶段分段线性回归就是类似情形中常见的一种分段线性回归就是类似情形中常见的一种一个例子一个例子:研究不同时段我国居民的消费行为研究不同时段我国居民的消费行为实际数据表明实际数据表明,1979年以前,我国居民的消费支年以前,我国居民的消费支出出 呈缓慢上升的趋势;从呈缓慢上升的趋势;从1979年开始,居民消年开始,居民消费支出为快速上升趋势费支出为快速上升趋势如何刻画我国居民在不同时段的消费行为?如何刻画我国居民在不同时段的消费行为?(3 3)分段回归分析)分段回归分析tY49基本思路:基本思路:采用乘法方式引入虚拟变量的手段采用乘法方式引入虚拟变量的手段显然,显然,1979年是一个转折点,可考虑在这个转折年是一个转折点,可考虑在这个转折点作为虚拟变量设定的依据若设点作为虚拟变量设定的依据若设 1979,当当 时可引入虚拟变量为什么选择时可引入虚拟变量为什么选择1979作为转折点?)作为转折点?)*X*t X50(t1955,1956,2004)依据上述思路,有如下描述我国居民在不同时段依据上述思路,有如下描述我国居民在不同时段消费行为模型:消费行为模型:居民消费趋势方程:居民消费趋势方程:011979ttYtu年以前:*012()ttYttXDu10tttXDtX其 中:*02121979()ttYXtu年以后:511979年之前,回归模型的斜率为年之前,回归模型的斜率为 ;1979年之前,回归模型的斜率为年之前,回归模型的斜率为 ;若统计检验表明,若统计检验表明,显著不为零,则我国居民的消显著不为零,则我国居民的消费行为在费行为在1979年前后发生了明显改变。
年前后发生了明显改变11212*XXY2分析分析52第三节第三节 案例分析案例分析为了考察改革开放以来中国居民的储蓄存款与收为了考察改革开放以来中国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄(蓄存款年底余额代表居民储蓄(),以国民总),以国民总收入收入GNI代表城乡居民收入,分析居民收入对储代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系,并建立相应的计量经济蓄存款影响的数量关系,并建立相应的计量经济学模型学模型 Y53表表8.1 8.1 国民总收入与居民储蓄存款国民总收入与居民储蓄存款 单位:亿元单位:亿元 年年 份份国民总收国民总收入入(GNI)城乡居民城乡居民人民币储人民币储蓄存款年蓄存款年底余额底余额()城乡居民城乡居民人民币储人民币储蓄存款增蓄存款增加额(加额()年年 份份国民总收国民总收入入(GNI)城乡居民人城乡居民人民币储蓄存民币储蓄存款年底余额款年底余额 ()城 乡 居 民城 乡 居 民人 民 币 储人 民 币 储蓄 存 款 增蓄 存 款 增额额()19783624.1210.6NA199121662.5 9241.62121.819794038.228170.4199226651.911759.42517.819804517.8399.5118.5199334560.515203.53444.119814860.3532.7124.219944667021518.86315.319825301.8675.4151.7199557494.929662.38143.519835957.4892.5217.1199666850.538520.88858.5数据来源:数据来源:中国统计年鉴中国统计年鉴2004,中国统计出版社。
表中,中国统计出版社表中“城乡居民人民币城乡居民人民币储蓄存款年增加额储蓄存款年增加额”为年鉴数值,与用年底余额计算的数值有差异为年鉴数值,与用年底余额计算的数值有差异YYYYYY54表表8.1 国民总收入与居民储蓄存款国民总收入与居民储蓄存款(续)(续)单位:亿元单位:亿元年年 份份国民总收国民总收入入(GNI)城乡居城乡居民人民民人民币储蓄币储蓄存款年存款年底余额底余额()城乡居城乡居民人民民人民币储蓄币储蓄存款增存款增加额加额()年年 份份国民总收入国民总收入(GNI)城乡居民人城乡居民人民币储蓄存民币储蓄存款年底余额款年底余额 ()城乡居民人城乡居民人民币储蓄存民币储蓄存款增加额款增加额()19847206.71214.7322.2199773142.746279.8775919858989.11622.6407.9199876967.253407.57615.4198610201.42237.6615199980579.459621.86253198711954.53073.3835.720008825464332.44976.7198814922.33801.5728.2200195727.973762.49457.6198916917.85146.91374.22002103935.386910.613233.2199018598.47119.81923.42003116603.2103617.716631.9YYYYYY55 为了研究为了研究19782003年期间城乡居民储蓄存款随收入的年期间城乡居民储蓄存款随收入的变化规律是否有变化变化规律是否有变化,考证城乡居民储蓄存款、国民总收考证城乡居民储蓄存款、国民总收入随时间的变化情况,如下图所示:入随时间的变化情况,如下图所示:56 从上图中,尚无法得到居民的从上图中,尚无法得到居民的储蓄行为发生明显改变储蓄行为发生明显改变的详尽信息。
若取居民储蓄的增量(的详尽信息若取居民储蓄的增量(),并作时序),并作时序图(见左下图)图(见左下图):YY57 从居民储蓄增量图从居民储蓄增量图(上页左图上页左图)可以看出,城乡居可以看出,城乡居民的储蓄行为表现出了明显的民的储蓄行为表现出了明显的阶段特征阶段特征:在:在1996年和年和2000年有两个明显的转折点再从城年有两个明显的转折点再从城乡居民储蓄存款增量与国民总收入之间关系的散乡居民储蓄存款增量与国民总收入之间关系的散布图看(见上页右图),也呈现出了相同的阶段布图看(见上页右图),也呈现出了相同的阶段性特征58 为了分析居民储蓄行为在为了分析居民储蓄行为在19961996年前后和年前后和20002000年前后三个阶段年前后三个阶段的数量关系,引入虚拟变量的数量关系,引入虚拟变量 和和 和和 的选择,是以的选择,是以19961996、20002000年两个转折点作为依据,年两个转折点作为依据,并设定了如下以加法和乘法两种方式同时引入虚拟变量的的并设定了如下以加法和乘法两种方式同时引入虚拟变量的的模型:模型:其中:其中:123142YYGNIGNI66850.50GNI88254.00ttttttt D Du11199601996ttDt年以后 年及以前21200002000ttDt年以后 年及以前D1D2D1D259 对上式进行回归后,有:对上式进行回归后,有:60即有:即有:由于各个系数的由于各个系数的t检验均大于检验均大于2,表明各解释变量的,表明各解释变量的系数显著地不等于系数显著地不等于0,居民人民币储蓄存款年增加,居民人民币储蓄存款年增加额的回归模型分别为:额的回归模型分别为:1YY -830.4045 0.1445GNI -0.2914 GNI-66850.50 se172.1626 0.0057 0.0272 -4.8234 25.1700 -10.7192 tttt Dt2 0.5602 GNI-88254.00se 0.0401 13.9581ttDt61123YY -830.4045 0.1445GNI1996YYYY 18649.8312-0.1469GNI19962000YY-30790.0596 0.4133GNI2000tttttttttt t t t 这表明三个时期居民储蓄增加额的回归方程在统计这表明三个时期居民储蓄增加额的回归方程在统计意义上确实是不相同的。
意义上确实是不相同的1996年以前收入每增加年以前收入每增加1亿元,居民储蓄存款的平均增加亿元,居民储蓄存款的平均增加0.1445亿元;在亿元;在2000年以后,则为年以后,则为0.4133亿元,已发生了很大变化亿元,已发生了很大变化62上述模型与城乡居民储蓄存款与国民总收入之间上述模型与城乡居民储蓄存款与国民总收入之间的散布图是吻合的,与当时中国的实际经济运行的散布图是吻合的,与当时中国的实际经济运行状况也是相符的状况也是相符的需要指出的是,在上述建模过程中,主要是从教需要指出的是,在上述建模过程中,主要是从教学的目的出发运用虚拟变量法则,学的目的出发运用虚拟变量法则,没有考虑通货没有考虑通货膨胀因素膨胀因素而在实证分析中,储蓄函数还应当考而在实证分析中,储蓄函数还应当考虑通货膨胀因素虑通货膨胀因素631.1.虚拟变量是人工构造的取值为虚拟变量是人工构造的取值为0和和1的作为属性的作为属性变量代表的变量变量代表的变量2.2.虚拟变量个数的设置有一定规则:在有截距项虚拟变量个数的设置有一定规则:在有截距项的模型中,若定性因素有的模型中,若定性因素有 个相互排斥的类型,个相互排斥的类型,只能引入只能引入 个虚拟变量,否则会陷入所谓个虚拟变量,否则会陷入所谓“虚拟变量陷阱虚拟变量陷阱”,产生完全的多重共线性。
产生完全的多重共线性第八章第八章 小小 结结m-1m643.3.在计量经济模型中,加入虚拟解释变量的途径在计量经济模型中,加入虚拟解释变量的途径有两种基本类型:一是加法类型;二是乘法类有两种基本类型:一是加法类型;二是乘法类型以加法方式引入虚拟变量改变的是模型的型以加法方式引入虚拟变量改变的是模型的截距;以乘法方式引入虚拟变量改变的是模型截距;以乘法方式引入虚拟变量改变的是模型的斜率4.4.解释变量只有一个分为两种相互排斥类型的定解释变量只有一个分为两种相互排斥类型的定性变量而无定量变量的回归,称为方差分析模性变量而无定量变量的回归,称为方差分析模型655.5.解释变量包含一个分为两种类型定性变量的回解释变量包含一个分为两种类型定性变量的回归时,只使用了一个虚拟变量;解释变量包含归时,只使用了一个虚拟变量;解释变量包含一个两种以上类型的定性变量的回归时,定性一个两种以上类型的定性变量的回归时,定性变量有变量有 种类型,依据虚拟变量设置规则引入种类型,依据虚拟变量设置规则引入了了 个虚拟变量个虚拟变量6.6.解释变量包含两个(或解释变量包含两个(或 个)定性变量的回归个)定性变量的回归中,可选用了两个(或中,可选用了两个(或 个)虚拟变量去表示,个)虚拟变量去表示,这并不会出现这并不会出现“虚拟变量陷阱虚拟变量陷阱”。
1mmkk667.7.以乘法形式引入虚拟解释变量的主要作用在于:以乘法形式引入虚拟解释变量的主要作用在于:对回归模型结构变化的检验;定性因素间交互对回归模型结构变化的检验;定性因素间交互作用的影响分析;分段线性回归等作用的影响分析;分段线性回归等67第八章第八章 结结 束束 了!了!。