1计量经济学 Econometrics计量经济学计量经济学(本科本科)讲义讲义Lecture Notes for Econometrics(undergraduate)南开大学国际经济与贸易系南开大学国际经济与贸易系孙浦阳孙浦阳 本节课的内容包含本节课的内容包含:幂函数,指数函数,(全、半幂函数,指数函数,(全、半对数函数,双曲线函数,对数函数,双曲线函数,2、3次多项式函数,次多项式函数,logistic曲线2非线性模型模型 倒数模型 对数函数模型p93 指数函数模型 p94 多项式函数模型p91 双曲线函数模型p93 可以线性化的非线性模型 幂函数模型p95 指数函数模型p94 生长曲线(logistic)模型p943非线性模型非线性模型4非线性模型非线性模型5非线性模型的处理方式非线性模型的处理方式(引见引见)6非线性模型的转换:多项式模型非线性模型的转换:多项式模型典型的非标准化的线性模型典型的非标准化的线性模型令变量 ,同样可以进行参数的OLS估计kkikiXX*多项式模型的基本函数可表达为:kiuXXXYikkiikii,2,1,221102例子:三元线性回归模型-多项式方程 yt=b0+b1 xt+b2 xt2+b3 xt3+ut 令xt 1=xt,xt 2=xt2,xt 3=xt3,上式变为 yt=b0+b1 xt 1+b2 xt 2+b3 xt 3+ut 例子:二元线性回归模型-多项式方程 yt=b0+b1 xt+b2 xt2+ut 令xt 1=xt,xt 2=xt2上式变为 yt=b0+b1 xt 1+b2 xt 2+ut 二元多项式和三元多项式二元多项式和三元多项式相差一点,但是图形表示相差一点,但是图形表示相差很大,注意区别相差很大,注意区别二元图示参照讲义二元图示参照讲义18页页三元图示参照三元图示参照13页页 7实际中是否出现?经济学中的成本(cost)与产量(production)曲线与左图相似。
b10,b20,b30)(b10,b30)(b2 0)yt=a+b Lnxt+ut,(b 0)(b 0)典型的两个图示如下典型的两个图示如下(最好熟记,日后使用方便最好熟记,日后使用方便)15非线性模型的转换:非线性模型的转换:对数线性模型对数线性模型模型的函数形式可变为:模型的函数形式可变为:iiiiiiuXYuXYlnln2121或iiiiiuXYuXYi*2121*或根据解释变量的观测值,进行OLS估计,得到:因此可得到原模型的估计方程:*2121*iiiXYXYi或iiXiXYeYiln2121或5.56.06.57.07.58.08.59.01.80 1.85 1.90 1.95 2.00 2.05 2.10 2.15 2.20 2.25 2.30LOG(LOG(INCOME)LOG(FOOD)28个省市自治区个省市自治区19852019年城镇居民人均食品支出年城镇居民人均食品支出food与人均收入与人均收入income的关系的关系案例:案例:28个省市自治区个省市自治区19852019年城镇居民年城镇居民 人均食品支出人均食品支出food与人均收入与人均收入income的关系的关系5.56.06.57.07.58.08.59.06.06.57.07.58.08.59.09.510.0LOG(CINCOME)LOG(Cfood)17非线性模型的转换:指数函数模型-10010203040506050100150200250300350400-0.4-0.20.00.20.40.60.81.01.250100150200250300350400)0(,)0(,baeybaeyttttubxtubxt上式等号两侧同取自然对数,得 Lnyt=Lna+b xt+ut 令Lnyt=yt*,Lna=a*,那么 yt*=a*+b xt+ut 变量yt*和xt已变换成为线性关系。
可使用线性处理方式,比如OLS典型的两个图示如下(最好熟记,日后使用方便)18硫酸的透明度(y)与硫酸中金属杂质(x)的含量影响透明度的主要金属杂质是铁、钙、铅、镁等问题:请某家咨询类公司,得出结果到底金属杂质对透明度的影响有多大数学建模,然后得出影响系数,系数可以反映程度测量了样本,得硫酸透明度y与铁杂质含量x的散点图如下其中用了五种不同的模型来得出检验系数(注意比较)指数函数模型例子:硫酸透明度与铁杂质含量的关系指数函数模型例子:硫酸透明度与铁杂质含量的关系 (1)y=121.59-0.91 x (2)1/y=0.069-2.37(1/x)(10.1)(-5.7)(18.6)(-11.9)R2=0.42,s.e.=36.6,F=32 R2=0.76,s.e.=0.009,F=142 19 (3y=-54.40+6524.83(1/x)(4Lny=1.99+104.5(1/x)(-7.2)(16.3)(22.0)(21.6)R2=0.86,s.e.=18.2,F=266 R2=0.91,s.e.=0.22,F=468)1(5.10433.7xey 复原,Lny=Ln(7.33)+104.5(1/x)指数函数模型例子指数函数模型例子:咨询公司评估硫酸透明度和杂咨询公司评估硫酸透明度和杂质质20(5非线性估计结果是)1(1.1003.8xey R2=0.96EViews输入方法:Y=C(1)*EXP(C(2)*(1/X)C(1)和C(2)是两个系数样本点与指数拟合曲线 指数函数模型例子:硫酸透明度与铁杂质含量的关系以上以上5 5个不同方法的比个不同方法的比较较方法方法1,2,31,2,3都偏差很大都偏差很大方法方法4 4和方法和方法5 5最合适最合适方法方法4 4与方法与方法5 5是相似的是相似的方法方法5 5更为有效更为有效211/yt=a+b/xt+ut (或 yt=1/(a+b/xt+ut))令yt*=1/yt,xt*=1/xt,得 yt*=a+b xt*+ut 已变换为线性回归模型。
留意:双曲线函数还有另一种表达方式,yt=a+b/xt+ut 令xt*=1/xt,得yt=a+b xt*+ut 上式已变换成线性回归模型yt=a+b/xt+ut 1/yt=a+b/xt+ut 双曲线模型22 双曲线模型双曲线模型炼钢厂钢包容积炼钢厂钢包容积Y Y与钢包使用次数与钢包使用次数X X的的关系关系(相比较模型相比较模型)第一分析师:线性模型并估计 第二分析师:简单对数模型并估计y=7.85+0.27 x y=6.16+1.83 Lnx (19.6)(5.7)(16.0)(10.1)R2=0.71 R2=0.89 普通线性模型 对数模型23 第三分析师:双倒数模型建立倒数模型估计,1/y=0.081+0.1339(1/x)(42.1)(14.1)R2=0.94炼钢厂钢包容积Y与钢包使用次数X的关系(相比较模型)问题:是否双倒数模型的估计最好?如何评判第三个分析师做的最好?三把尺子经济学意义是什么?(R-square的意义)第三个分析师做的模型里的X最有效的解释了Y24 幂函数的重要应用 Cobb-Douglas生产函数 对C-D生产函数的分析 三个实际问题:a)同时考虑到经济理论和计量模型的b)估算国家或者地区的统计制度的实际情况c)样本数据的统计特性,比如可采集性和统计统一性 比如,对Y的取值一般都是采用GDP,比较准确的反映了宏观经济发展水平,同时数据较为齐全 对K的取值相对负责了很多(资本一般包括固定资本和流动资产)对L的取值,数据行最复杂,涉及到劳动力市场 对以上的解释(p97)很值得学习,这是计量经济学联系经济学的最好的解释25 天津市对数化的GDPt亿元和对数化的从业人员数Lt,亿元和对数化的资金Kt,亿元散点图如下以上是一种典型的C-D模型以上不是简单的线性关系,所以在第一次尝试线性模型估算时,是不准确的X=Labour(劳动力市场)X=Capital(资本市场)幂函数的重要应用 Cobb-Douglas生产函数26幂函数的重要应用 Cobb-Douglas生产函数27 逻辑曲线(Logistic模型第94页:S-曲线模型一致 美国人口统计学家广泛研究了有机体的生长,得到了上述数学模型。
逻辑斯谛曲线或生长模型常用于描述有机体生长发育过程其中k和0分别为yt的上限和下限(特别注意K代表什么)a,b 为待估参数曲线有拐点,曲线的上下两部分对称于拐点ttubtautftekeky11)(,0 ttttLimykLimy28 逻辑曲线(Logistic模型292019年5月1日至6月1日中国内地非典新增疑似病例数分析 来源:张晓桐教授讲义案例 逻辑曲线(Logistic模型302019年5月1日至6月1日中国内地非典新增疑似病例数分析 05010015020025030035051015202530Y05010015020025030035051015202530YYF1 -101234505101520253035LOG(500/Y)-1)t311985-2019年中国家用汽车拥有量以年增长率23%,年均增长55万辆的速度飞速增长建立中国家用汽车拥有量模型时,主要考虑如下因素:(1城镇居民家庭人均可支配收入;(2城镇总人口;(3家用汽车产量;(4公路交通完善程度;(5家用汽车价格由于国产家用汽车价格与进口家用汽车价格差距较大,而且家用汽车种类很多,统计分种类的家用汽车销售价格与销售量非常困难,所以因素“家用汽车价格暂且略去不用。
定义变量名如下:Y:中国家用汽车拥有量万辆)X1:城镇居民家庭人均可支配收入元)X2:全国城镇人口亿人)X3:全国家用汽车产量万辆)X4;全国公路长度万公里)多元非线性回归多元非线性回归中国家用汽车拥有量决定因素分析中国家用汽车拥有量决定因素分析32 轿车拥有量与人均可支配收入 轿车拥有量与全国城镇人口轿车拥有量与全国汽车产量 轿车拥有量与全国公路长度多元非线性回归多元非线性回归中国家用汽车拥有量决定因素分析中国家用汽车拥有量决定因素分析33Y=-925.66+0.0057X1+62.94 X2+0.41 X3+7.73X4 (-5.7)(0.2)(0.8)(0.8)(5.0)R2=0.99,DW=1.4,T=18,(19852019)看相关系数阵,Y与X1,X2,X3,X4的相关系数都在0.9以上,但输出结果中,解释变量X1,X2,X3的回归系数却通不过显著性检验多元非线性回归多元非线性回归中国家用汽车拥有量决定因素分析中国家用汽车拥有量决定因素分析34看散点图,把Y与X3,X4处理成线性关系,把Y与X1,X2处理成幂函数抛物线关系,得结果如下,Y=317.19+0.00000326X12-363 X2+74.41 X22+0.31X3+1.48X4 (2.9)(4.4)(-7.3)(9.5)(2.1)(3.0)R2=0.9991,DW=2.0,T=17,(19852019)每个变量都具有很高的显著性。
拟合优度也提高了,没有异方差也没有自相关样本内拟合如图多元非线性回归多元非线性回归中国家用汽车拥有量决定因素分析中国家用汽车拥有量决定因素分析。