发展经济学论文1 基尼系数的计算方法及数学推导2001 金融三班袁源摘要:本文归纳了基尼系数的四种计算方法:直接计算法、拟合曲线法、分组计算法和分解法,并进行了数学推导和证明在此基础上,文章比较了各种算法优缺点,分析了误差可能产生的环节关键词:洛伦茨曲线基尼系数一、洛伦茨曲线和基尼系数1905 年,统计学家洛伦茨提出了洛伦茨曲线,如图一将社会总人口按收入由低到高的顺序平均分为10 个等级组,每个等级组均占10的人口,再计算每个组的收入占总收入的比重然后以人口累计百分比为横轴,以收入累计百分比为纵轴,绘出一条反映居民收入分配差距状况的曲线,即为洛伦茨曲线为了用指数来更好的反映社会收入分配的平等状况,1912 年,意大利经济学家基尼根据洛伦茨曲线计算出一个反映收入分配平等程度的指标,称为基尼系数(G)在上图中,基尼系数定义为:G=SASA+B式(1)当 A 为 0 时,基尼系数为0,表示收入分配绝对平等;当B 为 0 时,基尼系数为1,表示收入分配绝对不平等基尼系数在01 之间,系数越大,表示越不均等,系数越小,表示越均等二、基尼系数的计算方法式(1)虽然是一个极为简明的数学表达式,但它并不具有实际的可操作性。
为了寻求具有可操作性的估算方法,自基尼提出基尼比率以来,许多经济学家和统计学家都进行了这方面的探索在已有的研究成果中,主要有四种有代表性的估算方法,结合自己的计算,笔者将它们归纳为直接计算法、拟合曲线法、分组计算法和分解法1、直接计算法直接计算法在基尼提出收入不平等的一种度量时,就已经给出了具体算法,而且这种算法并不依赖于洛伦茨曲线,它直接度量收入不平等的程度定义O X Y E C A B 图一发展经济学论文2 n nj=1 i=1Yj Yi/n2,0 2u 式(2)式中,是基尼平均差,Yj Yi是任何一对收入样本差的绝对值,n 是样本容量,u 是收入均值定义G=/2u,0 G1 式(3)可以证明:G=/2u2SA(证明过程见附录一),而由式(1)G=SA/SA+B,SA+B=1/2,G=2SA,因此,式(2)中定义的G 即为基尼系数,综合式(2)、(3),基尼系数的计算方法为:G=1 2n2 u n nj=1 i=1Yj Yi式(4)直接计算法只涉及居民收入样本数据的算术运算,很多学者认为理论上看,只要不存在来源于样本数据方面的误差,就不存在产生误差的环节实际上,在附录一证明过程当中将看到,直接计算法依然采用了以直代曲法计算面积,只不过这个过程在样本数据范围内达到了最小近似,其精确度直接取决于样本数据本身。
因此,可以认为它不带任何误差的计算了样本数据的基尼系数值2、拟合曲线法拟合曲线法计算基尼系数的思路是采用数学方法拟合出洛伦茨曲线,得出曲线的函数表达式,然后用积分法求出B 的面积,计算基尼系数通常是通过设定洛伦茨曲线方程,用回归的方法求出参数,再计算积分例如,设定洛伦茨曲线的函数关系式为幂函数:I=P式(5)根据选定的样本数据,用回归法求出洛伦茨曲线,例如,m,=n.求积分SB=01 mpndp=m n+1 式(6)计算G=SASA+B=SA+BSBSA+B 12m n+1 式(7)拟合曲线法的在两个环节容易产生谬误:一是拟合洛伦茨曲线,得出函数表达式的过程中,可能产生误差;二是拟合出来的函数应该是可积的,否则就无法计算3、分组计算法这种方法的思路有点类似用几何定义计算积分的方法,在X 轴上寻找n 个分点,将洛伦茨曲线下方的区域分成n 部分,每部分用以直代曲的方法计算面积,然后加总求出面积分点越多,就越准确,当分点达到无穷大时,则为精确计算发展经济学论文3 假设分为n 组,每组的收入为Yi,则每个部分P 的面积为:SP=1 i-1Yi i Yi2n nYi 式(8)加总得到:G=SASA+B=SA+BSBSA+B 12limk n 1 i-1Yi i Yi2n nYi 式(9)这是精确计算基尼系数的表达式,当分点n 个数有限时,定义:yi=YinYi 式(10)得到近似表达式:G=2SA=2 n(y1+2y2+nyn)(n+1n)式(11)(证明过程见附录二)分组计算法不依赖于洛伦茨曲线的函数形式,但在以直代曲的环节会出现误差,增加分点的个数可以减少这种误差。
4、分解法上述的计算方法的最终目的都在于求出基尼系数的值,而分解法则是在求出上述值的基础上,力图研究基尼系数的构成因素,除了得出总的基尼系数的信息之外,在计算过程中还能够获得分解部分内部的基尼系数值另外,分解法求出基尼系数的过程一般都依赖于已有部分的基尼系数的值,从这个意义上说,分解法并不是独立计算基尼系数的方法,它更重要的意义在于对基尼系数的分解,即定义的各个不同基尼系数值之间的相互关系伦敦经济学院收入分配方法论专家Cowell 教授提出,基尼系数在不同人群组之间无法完全分解于尽总体基尼系数除了包括各个组内差距之外,还应包括组间差距和相互作用项公式为:G=kWiGi+Ib+(fi)式(12)式中,G是总体基尼系数,Gi是第 i 组内部的基尼系数(i=1,2,,n),Wi是 Gi的权数,Ib是组间的差距指数,(fi)是相互作用项fi)是各个组之间收入分布的重叠程度特别地,当各个组之间收入分布完全不重叠时,(fi)0式(12)地意义在于形式化地表述了对总体基尼系数进行分解的思路和框架,但由于没O X Y E C A B P 图二发展经济学论文4 有给出 Wi、Ib和(fi)的具体计算方法,还不能用于基尼系数的计算。
经济学家Sundrum(1990)在他的欠发达国家的收入分配一书中介绍了一种对一国或地区基尼系数进行分解的方法,其数学公式为:G=P12u1u G1+P22u2u G2+P1P2u1u2u 式(13)式中,G 表示总体基尼系数,G1和 G2分别表示农村和城镇的基尼系数,P1、P2分别表示农村人口和城镇人口占总人口的比重,u1、u2、u 分别表示农村、城镇和总体的人均收入对比式(12)和式(13),可以发现式(13)是式(12)的一种具体运用,P12u1u G1和 P22u2u G2可以作为以P12u1u 和 P22u2u 为权重的kWiGi,P1P2u1u2u 则为组间差距指数Ib值得注意的是式中没有(fi)项,意味着(fi)0 成立,因此这种算法隐含的假设条件是农村与城镇的收入分布完全不重叠此外,采用这种计算方法还必须满足条件:在估算城乡内部的基尼系数时所用的居民收入数据的口径是相同或相近的这种方法会在可能在两个环节产生误差:一是用其他方法估计城乡各自的基尼系数G1和 G2时,可能产生误差;二是城乡收入分布一般会在不同程度上重叠附录一:证明:G=/2u2SA 第一步,分解n nj=1 i=1Yj Yi设将收入按从低到高排列Y1、Y2、Yn,则上式可以分解为矩阵A:Y1 Y2Yn1YnY1 Y2 Yn1Yn 0 Y2 Y1Yn1Y1YnY1Y2 Y10 Yn1Y2YnY2Yn1 Y1Yn1Y20 YnYn1Yn Y1YnY2 0将矩阵中各项加总得到:2(n1)Yn(n 2)Yn1 Y2(n1)Y1(n2)Y2 Yn1 2(n1)Yn(n 3)Yn1(n5)Yn2(1n)Y2(n1)Y1第二步,计算1 2n2u 取样本均值u=Y1Y2 Ynn=nYin 1 2n2u1 2n nYi发展经济学论文5 综上,第一步、第二步,得到G1 n nYi(n1)Yn(n3)Yn1(n5)Yn2(1n)Y2(n1)Y1式(14)第三步,计算SB如图四,计算每一部分面积SP SP1 2 AB(AC BD)1 i-1Yi i Yi2n n Yi SBn1 i-1Yi i Yi2n nYi 第四步,计算SASA=SABSB1 2 n1 i-1Yi i Yi2n nYi 1 2n nnYin i-1Yi i YinYi 分解 nnYin i-1Yi i Yi得到矩阵B nnYin i-1Yi i YinnYin i-1Yi i YiY1 Y2 Yn Y1 Y2 Yn Y1 Y2 Yn Y1 Y2 YnY1Y1 Y1 Y2Y1 Y2 Y1Y2Y3Y1 Y2 Yn2 Y1Y2 Yn1Y1 Y2 Yn1 Y1Y2 YnYn Yn1 Y2Yn Yn1 Y3 Y1Yn Yn1 Y4 Y1Y2Yn Y1 Y2 Yn2 Y1 Y2 Yn1图四i1 i P A B C O X Y E C A B P Xn Xi1 Xi 图三D 发展经济学论文6 加总最后一行,得到:nnYin i-1Yi i Yi(n1)Yn(n2)Yn1 Y2(n1)Y1(n2)Y2 Yn1(n 1)Yn(n3)Yn1(n5)Yn2(1n)Y2(n1)Y1SA=1 2n nnYin i-1Yi i YinYi 1 2nnYi(n1)Yn(n3)Yn1(n5)Yn2(1n)Y2(n1)Y1式(15)比较式(14)和式(15)可得 G=/2u2SA。
附录二:证明:当分点个数n 有限时,G=2SA=2 n(y1+2y2+nyn)(n+1n)定义:yi=YinYi SP1 2 AB(AC BD)1 i-1Yi i Yi2n n Yi 1 2n(iYi nYi i-1Yi nYi )SBn1 i-1Yi i Yi2n nYi SA=SABSB1 2 n1 i-1Yi i Yi2n nYi 1 2n nnYi(n i-1Yi i Yi)n Yi 1 2n nnYin(2 i Yi Yi)n Yi 1 2n nn Yin(2 i YiYi)nYi 1 2n(2n2 n iyi2nyi)n+1 2n 分解 nn i yi得到矩阵C:n n i yinn iyiy1y2 yn y1y2 yn y1y2 yn y1y2 yn y1 y1y2y1y2y3 y1y2 yn1 y1y2 yn Yn Yn1 Y2Yn Yn1 Y3Yn Yn1 Y4 Yn0 加总最后一列,得到发展经济学论文7 nn iyi(n-1)yn+(n2)yn1 y2 SA1 2n(2n 2 n i yi 2nyi)n+1 2n 1 n(y1+2y2+nyn)n+1 2n G=2SA=2 n(y1+2y2+nyn)(n+1n)参考资料:1、Sundrum.R.M,1990,Incom Distribution in Less Developed Counties,London and New York:Routledge 2、Cowell.F.A,2000,Measurement of Inequality,in Handbook of Income Distribution,eds.By A.Atkirrson and F.Bourguignon,Northholland 3、熊俊:基尼系数估算方法的比较研究;财经问题研究2003 年 1 月第 1 期4、王文森:基尼系数及推广应用;统计与预测;2003 年 1 月第 1 期。