文档详情

统计学原理-计算公式

gui****hi
实名认证
店铺
DOC
478.50KB
约9页
文档ID:152926933
统计学原理-计算公式_第1页
1/9

0 m -1m +1位值平均数计算公式1、众数: 是一组数据中出现次数最多的变量值组距式分组下限公式:M =L0m0D+ 1D +D12×dm0Ldmm0:代表众数组下限;:代表组距;D = f1 m0D = f2 m0- f- f00:代表众数组频数—众数组前一组频数:代表众数组频数—众数组后一组频数2、中位数:是一组数据按顺序排序后,处于中间位置上的变量值M =L +n +1 e m 中位数位置 = 分组向上累计公式: e2Sf2-Sfmem -1e×dmeLme代表中位数组下限;Sm -1e:代表中位数所在组之前各组的累计频数;fme代表中位数组频数;dme代表组距3、四分位数: 也称四分位点,它是通过三个点将全部数据等分为四部分,其中每部分包含25%,处在 25%和 75%分位点上的数值就是四分位数其公式为:Q =1n +14Q =2n +12(中位数)Q =33( n +1)4实例数据总量 : 7 , 15, 36 , 39, 40, 41一共 6 项Q1 的位置 =(6+1)/4=1 75 Q2 的位置 =(6+1 )/2=3 。

5 Q3 的位置 =3(6+1 )/4=5.25 Q1 = 7+ (15-7 )×( 1 75-1 )=13 ,Q2 = 36+(39 —36 )×( 3.5 —3 )=37.5 ,Q3 = 40+ (41 —40 )×( 5.25 —5)=40 25数值平均数计算公式1、简单算术平均数: 是将总体单位的某一数量标志值之和除以总体单位x +x +¼¼x SxX = 1 2 n =其公式为: n n2、加权算术平均数: 受各组组中值及各组变量值出现的频数(即权数 f)大小的影响,11 2 S f其公式为:x f +x f +¼¼ x f Sxf X = 1 1 2 2 i i =f + f +¼¼ f Sf 1 2 i3、加权算术平均数的频率:其公式为:f f fX =X 1 +X 2 +¼¼SX n =SX ×Sf Sf SffSf4、调和平均数:由于只掌握每组某个标志的数值总和(M)而缺少总体单位数(f) 的资料,不能直接采用加权算术平均数法计算平均数,则应采用加权调和平均数其公式为:H =SmmSx5、简单几何平均数: 就是 n 个变量值(Xn)连乘积的 n 次方根:其公式为:G =nX ×X ×X ¼¼ X =n PX 1 2 3 n6、加权几何平均数: 如果变量值较多,其出现的次数不同,则应采用加权几何平均数,其公式为:G =f +f +¼¼f 1 2nX1f1×X2f2¼¼ Xnfn= PXf标志变异绝对指标及成数计算公式一、标志变异绝对指标 :1、异众比率 (又称离异比率或变差比,它是指非众数组的频数占总频数的比率):公式即,V =rSf - fiSfim=1 -fmSfi2、极差 (也称全距,它是一组数据的最大值与最小值这差R = X -X公式即: max min3、平均差(总体各单位标志值对算数平均数的绝对离差的算术平均数,平均差是反映各标志 值对平均数的平均距离,平均差越大,说明总体各标志值越分散,平均差越小,说明 各标志值越集中),公式即为:(未分组情况)A.D =Sx -xn(分组情况):A.D =Sx -x · f Sf4、方差和标准差:方差(是各变量值与其均值离差平方的平均数),公式即为:(未分组情况)s2=S(x -x ) n2(分组情况):s2=S(x -x ) Sf2· f标准差(方差的平方根),2x 公式即为:(未分组情况)s=S(x -x ) n2(分组情况):s=S(x -x ) 2 · f Sf方差的数学性质:变量的方差等于变量平方的平均数减去变量平均数的平方。

方差的简便算法:方差=平方的平均数-平均数的平方平方的平均数表示为:Sxn2平均数的平方表示为:æSxöç ÷èn ø2方差简便算法的公式即为:s2 =x 2 -( x ) 2二、是非标志的平均数、方差、标准差:是非标志:将总体分成具有某种性质和不具有某种性质的两部分,我们所关心的标志表 现称为“是”,另一标志标现称为“非"例如:产品分为合格与不合格品.成数:总体中,是非标志只有两种表现,我们把具有某种表现和不具有某种表现的单位占 全部总体单位的比重称为成数具有某种性质的成数用(p)表示,不具有某种性 质的用(q)表示p+q=1.[成数的平均数(均值 )就是成数本身]成数方差:s2= p (1 -p )成数标准差:s=p (1 -p抽样平均误差、极限误差计算公式1、抽样平均误差: 反映所有的样本平均数与总体平均数的平均误差,用 平均数公式:S(x -m)2 ss = =重置抽样公式为:M nsx表示.其中 s 表示总体标准差, n 表示样本容量,M 为样本个数.不重抽样公式为:s =xS(x -m)2 s N -n = ·M n N -1其中 N 为总体单位数.成数公式:重置抽样公式为:sP=P (1 -P ) n不重置抽样公式为:sP=P (1 -P ) N -n ×n N -12、极限误差 :样本统计量与被估计的总体参数的离差的绝对值所容许的最大值,又称边际误差,用D来表示.x -X £Dxp -P £Dpz =Dsx,用文字表述为:概度率=抽样极限误差÷抽样平均误差.概率保证程度用 F (z)表示,又叫置信度或置信水平,它是 z 的函数。

33 、计算:D n =2 2 2 3、计算题步骤: 第一套: F (z)求D第二套: D求 F (z)1、抽样计算x Þ 区间估计 S (x)Þsx1、抽样计算x Þ 区间估计 S (x)Þsx2、根据: F (z)查表z2、根据: z =Dsx查表F (z)3、计算:D=z ×sx,写出 x :(x-D,x+D)3、由 x 和 D,写出(x-D,x+D)4、成数计算步骤: 第一套: F (z)求D第二套: D 求 F (z)1、抽样计算P Þ 区间估计 S (x)Þsp1、抽样计算P Þ 区间估计 S (x)Þsp2、根据: F (z)查表 D =z ×sppz写出( P -D ,P +D )p P2、根据: z = P 查表 F (z)sP3、由 P 和 D ,写出( P -D ,P +D )p p P样本容量、相关系数、估计标准误差一、样本容量的确定1、平均数:重复抽样下样本容量z2 sD2;不重复抽样下样本容量n =Nz 2s2 ( N -1) D2 +z 2s22、成数:重复抽样下样本容量n =z 2 ×p(1 -p ) Dp;不重复抽样下样本容量n =Nz ( N -1) D2p×p(1 -p )+z 2 ×p(1 -p)二、相关系数: 性条件下说明两个变量之间相关关系密切程度的统计分析指标。

公式 1:r =S(x -x )( y -y ) S(x -x ) 2 ×S(y-y ) 2=S(x -x )( y -y ) S(x -x ) 2 × S( y -y ) 2公式 2:r =nSx2nSxy -Sx×Sy -(Sx)2×nSy2-(Sy)2公式 3:r =xy -x ×y s ×sx y三、一元线性回归分析 :只涉及一个自变量时称为一元回归1、估计回归方程可表示为:y =b +b x 0 1,其中 b 是估计的回归直线在 y 轴上的截距,是当 x =0 时的期望值;b 是直线的斜率,称为 0 141 2 2 0 y =b +b x0 1 ① 、时期序列的序时平均数:1 2n -1回归系数,表示当 x 每变动一个单位时 y 的值平均变动 2、最小二乘法(残差平方和最小)b =1nSxy -( Sx)( Sy) nSx2 -( Sx) 2b =y -b x 0 1b =1S( x -x )( y -y ) n Sxy -Sx×Sy=S( x -x ) 2 n Sx 2 -( Sx) 2b =0Sy Sx-bn n三、回归直线的似合程度1、判定系数(可决系数):等于相关系数的平方。

r 2 =b × 1nSx2 -(Sx) 2 nSy2 -(Sy) 22、估计标准误差:实际观察值与回归估计值离差平方和的均方根 反映实际观察值在回归直线周围的分散状况 从另一个角度说明了回归直线的拟合程度计算公式为S =yS( y -y ) 2 Sy -b Sy -b Sxy = 0 1n -2 n -2四、利用回归方程式进行估计1、点估计:对于自变量 x 的一个给定值 x ,根据回归方程得到因变量 y 的一个估计值 根据回归方程: 得出 y 的估计值.时间序列的分析指标1、绝对数时间序列的计算: (用算术平均数计算)y = y +y +¼¼ y =Sy / n1 2 n②、时点序列的序时平均数:连续时点:连续每天资料不同:持续天内资料不变:y =Sy / n y =Syt / St间断时点:间隔时间相等序时平均数的计算(首末折半):y =1 1 y +y +¼¼ +y + y2 2n -1n间断时点:间隔不相等序时平均数的计算:51 2 n n y =(y +y y +y y +y 1 2 )t +( 2 3 )t +¼¼+( n -1 n2 2 2St)tn -12、绝对数或平均数时间序列的序时平均数:应先分别求出构成相对数或平均数的分子和分母的平均数,而后再进行对比(先平均,再对比):y =a / b3、增长量:增长量=报告期水平—基期水平。

逐期增长量: 是报告期水平与前一期水平之差,表示本期比前一期增长的绝对数量累积增长量: 是报告期水平与某一固定时期水平之差,说明报告期与某一固定期增长的绝 逐期增长量与累积增长量之间存在一定的关系: 各逐期增长量的和等于相应时期的累积增长 量;两相邻时期累积增长量之差等相应时期的逐期增长量.4 、 平均增长量:Dy =S( y -y ) y -y i i-1 = n 0n n(n 为逐期增长量个数,它是观察数量的个数减 1)平均增长量=逐期增长量之和/逐期增长量个数=累积增长量/观察期数5、发展速度: 发展速度=报告期水平/基期水平环比发展速度: 是报告期发展水平与前一水平之比,说明现象逐期发展变化的程度定基发展速度: 是报告期发展水平与某一固定时期水平之比,说明现象整个观察期内总的发 展变化程度以上两种发展速度之间存在着一定的数量 :各个环比发展速度的连乘积等于最末期的定基发 展速度;两个相邻的定基发展速度之比等于相应的各期环比发展速度.6、增长速度:增长速度=增长量/基期水平=报告期水平-基期水平/基期水平=发展速度-1环比增长速度 : G = y -yi ii -1/ yi -1= y / yii -1-1 (i=1,2…n)定基增长速度: G = y -y / y = y / y -1 (i=1,2…n)i i 0 0 i 0环比增长速度与定基增长速度之间没有直接关系 :若由环比增长速度推算定基增长速度,可先 将各环比增长速度加 1 后连乘,再将结果减 1,即得定期增长速度.7、平均发展速度: 用水平法(几何平均法)计算,公式为:R =ny y y y y 1 ´ 2 ´¼ n = Õ i =y y y y y 0 1 n -1 i -1n0(i=1。

2…n)8、平均增长速度: 又称增长率,是用于描述现象在整个观察期内平均增长变化程度的指标,通常用平均发展速度减 1 来求得G=R -19 、长期趋势分析: 移动平均法:通过扩大时间序列的时间间隔,并按一定的间隔长期逐期移 动,分别计算出一系列平均数,由这些平均数形成的新的时间序列对原时间序列的波动 起到一定人修匀作用,削弱了原序列中短期偶然因素的影响,从而呈现出现象发展的基本 变动趋势60 0S p q1 公式为:y = y +y +¼ y 1 i +1K +i -1/ K(式中 K 为间隔长度,是大于 1 小于 n 的正整数)最小平方法 :又称最小二乘法直线趋势模型:当时间序列的逐期长增长量大致相同,或利用散点图观察现象的变动近似一条直线时,可采用下列线性模来描述:yt=a +bt根据最小平方法的基本要求,可得:b =n Sty -StSy n St 2 -( St) 2综合指数、平均指数1、加权综合指数:拉氏:销售指数(数量指数):q1/ 0=Sp q0 1Sp q0 0(基期变量值加权)帕氏 :价格指数 (质量指数 ):p1/ 0Sp q= 1 1Sp q0 1(报告期变量值加权)公式中 q1 / 0表示数量指数, q 和 q 表示一组项目基期和报告期的物量数值;0 1p1 / 0表示质量指数; p 和 p 表示一组项目的基期和报告期的质量数值。

0 12、股票价格指数: 即以报告期发行量为权数(同度量因素)进行加权综合公式为:p1/ 0Sp q= 1 1Sp q0 13、加权平均指数 :数量指标平均指数编制的一般原则是:以基期价值量指标为权数,计算数量指标个体指数的 加权算术平均数 加权算术平均指数:q1/ 0=qS 1 p Sp q0 = 0 1 Sp q Sp q0 0 0 0(数量指数)质量指标平均指数编制的一般原则是:以报告期价值量指标为权数,计算质量指标个体指数 的加权调和平均数加权调和平均指数:p1/ 0Sp q Sp q = 1 1 = 1 11 Sp q0 1p / p1 0(质量指数)7。

下载提示
相关文档
正为您匹配相似的精品文档