第二十一章 统计与统计数据一、统计的含义统计工作,即统计实践活动,是指利用科学的方法,搜集、整理、分析和提供有关社会现象数字资料的工作的总称基本任务是对国民经济和社会发展状况进行统计调查、统计整理和统计分析,提供统计资料和咨询,实行统计监督统计数据是统计工作活动过程所取得的反映国民经济和社会现象的数字资料以及与相关的其他资料的总称包括:原始的调查资料以及经过加工、整理、分析而成系统的统计资料是统计工作的成果或“产品”统计学是关于搜集、整理、分析和解释统计数据的科学,是一门认识方法论性质的科学,其目的是探索数据内在的数量规律性二、统计数据的计量尺度采用的计量尺度由低级到高级、由粗略到精确分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度一)定类尺度定类尺度是最粗略、计量层次最低的计量尺度,它是对某种属性进行分类或分组,各类各组之间的关系是并列、平等而且互相排斥的对定类尺度的计量结果,可以计算每一类或组中各元素或个体出现的频数例如:某班级共100人,男48人,女52人人口按性别分为男、女,一个人要么是男,要么是女,只能属于其中一类二)定序尺度定序尺度是对各类之间的等级差或顺序差的一种测度。
利用定序尺度不仅可以分为不同的类别,而且可以反映各类的优劣、量的大小或顺序定序尺度它只是测度了类别之间的顺序,而未测量出类别之间的精确差值该尺度的计量结果只能比较大小,不能进行加、减、乘、除等数学运算例如:某班级共100人,及格48人,不及格52人学生成绩可以分为优、良、中、及格和不及格等五类三)定距尺度定距尺度是对现象类别或次序之间间距的测度不但可以用数字表示现象各类别的不同和顺序大小的差异,而且可以用确切的数值反映现象之间在量方面的差异使用的计量单位一般为实物单位(自然或物理)或者价值单位反映现象规模水平的数据必须以定距尺度计量,例如产品产量、人口数、国内生产总值等都以定距尺度为计量尺度定距尺度的计量结果可以计算差值,进行加、减运算例如:某班级100人,98分48人,58分52人长度用“米”度量,温度用“摄氏度”度量,时间用“小时”,成绩用百分制等四)定比尺度定比尺度是用于反映现象的结构、比重、速度、密度等数量关系其结果可以进行加、减、乘、除等运算例如:人均国民生产总值为1000美元/人将一个企业创造的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率三、统计数据的类型按所采用的计量尺度划分:定性数据(品质数据):分类数据、顺序数据(用文字表述,前者不区分顺序,后者有顺序)定量数据(数量数据):数值型数据(现象的数量特征,用数值来表现)例如:对品质数据通常可以计算出各组的频数或频率,而数值型数据则可以用更多的统计方法进行处理。
四、统计指标及其类型统计指标按其所反映的内容或其数值表现形式,可分为总量指标、相对指标和平均指标三种总量指标又称为绝对数,是反映现象总体规模的统计指标,通常以绝对数的形式来表现例如:土地面积、国内生产总值、财政收入等总量指标按其所反映的时间状况不同又可分为时期指标和时点指标时期指标又称时期数,反映现象在一段时期内的总量通常可以累积,从而得到更长时期内的总量例如:产品产量、能源生产总量、财政收入、商品零售额等时点指标又称时点数,反映的是现象在某一时刻上的总量通常不能累积,各时点数累积后没有实际意义例如:年末人口数、科技机构数、股票价格等库存量是时期指标,月末库存量是时点指标相对指标是两个绝对数之比,如经济增长率、物价指数、全社会固定资产投资增长率等平均指标又称平均数或均值,反映的是现象在某一空间或时间上的平均数量状况,如人均国内生产总值、人均利润数据类型单位个数绝对数1个相对数0个平均数2个或以上第二十二章 统计调查一、统计调查的概念与币种类(一)统计调查的概念与作用统计调查包括搜集第一手统计数据和搜集第二手统计数据两种统计调查主要是搜集第一手统计数据,是统计活动所取得的初级统计数据,是原始的统计信息。
二)统计调查的种类1、按调查对象的范围分为:全面调查、非全面调查全面调查:包括全面统计报表、普查非全面调查:包括非全面统计报表、抽样调查、重点调查、典型调查2、按调查登记的时间是否连续分为:连续调查、不连续调查二、统计调查的方式在我国,常用的统计调查的方式有统计报表、普查、抽样调查、重点调查和典型调查一)统计报表统计报表是我国目前搜集统计数据的一种重要方式,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式按调查对象范围的不同可分为:全面统计报表和非全面统计报表大多数统计报表都是全面报表按报送周期长短不同可分为:日报、月报、季报、年报等按报表内容和实施范围不同可分为:国家的、部门的、地方的统计报表二)普查普查是为某一特定目的而专门组织的一次性全面调查普查是适合特定目的、特定对象的一种调查方式,主要用于了解处于某一时点状态上的社会经济现象的基本全貌特点:1)普查通常是一次性的或周期性的2)普查一般需要规定统一的标准调查时间3)普查的数据一般比较准确4)普查的使用范围比较窄三)抽样调查抽样调查是实际中应用最广泛的一种调查方式和方法,它是从调查对象的总体中抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特往的一种非全面调查。
通常把所要调查研究的事物或现象的全体称为总体,而把组成总体的每个元素(成员)称为个体,一个总体中所含的个体的数量称为总体容量例如:要研究某城市居民的家庭收入状况,那么这个城市所有家庭的收入状况就是我们的研究总体,而每个家庭的收入状况就是个体在研究居民家庭收入时,随机抽取1 000户来进行调查,这1 000户就是一个样本,样本容量就是1 000特点:1)经济性这是抽样调查的一个最显著优点2)时效性强3)适应面广可用于全面调查和非全面调查4)准确性高在实际应用中,抽样方法主要有两种:概率抽样和非概率抽样概率抽样是根据一个已知的概率选取被调查者,无须调查人员在选样中判断或抽选,是最理想、最科学的抽样方法,它能够将调查误差中的抽样误差限制在一定范围之内,但也是花费较大的抽样方法概率抽样有以下几种形式:1)简单随机抽样是最基本的形式,它是完全随机地选择样本2)分层抽样分两个步骤:首先将总体分成不同的“层”,然后在每一“层”内进行抽样3)整群抽样例如:在市场调查的入户调查中,可以对被选作抽样单位的某个大院的每家每户进行调查4)等距抽样,又称系统抽样是在样本框中每隔一定距离抽选一个被调查者比较常用,有时还可与整群抽样法和分层抽样法结合使用。
非概率抽样不是完全按随机原则选取样本非概率抽样有三种形式:1)由调查人员自由选择被调查者的非随机选样2)通过某些条件过滤选择某些被调查者参与调查的判断抽样法3)不属于要进行总体推论的大多数项目都会使用非概率抽样法四)重点调查重点调查是一种非全面调查,它是在所要调查的总体中选择一部分重点单位进行的调查所选择的重点单位虽然只是全部单位中的一部分,重点是所要调查的对象在数量上占较大比重重点调查的适用范围很广,当调查目的只要求了解基本状况和发展趋势,不要求掌握全面数据,采用重点调查就比较适宜例如:为了及时了解全国城市零售物价的变动趋势,就可以对全国的35个大中型城市的零售物价的变化进行调查,这种调查就是重点调查又如,要及时了解全国工业企业的增加值和资产总额情况,只需对全国大中型工业企业进行重点调查即可因为虽然大中型工业企业数占全国工业企业数不到5%,但这些大中型企业的增加值和资产总额却占全国工业的60%以上重点调查能以较少的投入、较快的速度取得某些现象主要标志的基本情况或变动趋势五)典型调查典型调查是一种非全面调查,在对被调查对象进行全面分析的基础上,有意识地选择若干具有典型意义的或有代表性的单位进行的调查,并不要求所要调查的对象在数量上占较大比重。
典型调查的主要作用有:1)弥补全面调查的不足;2)在一定条件下可以验证全面调查数据的真实性例如:在一次重大普查之后,可以选择若干个典型单位,检查统计数据的准确程度典型调查与其他调查方法比较,具有灵活机动,是一种必不可少的方法这种调查由于受“有意识地选出若干有代表性单位”的限制,在很大程度上受到人们主观认识的影响,必须同其他调查结合起来使用,才能避免出现片面性重点调查和典型调查虽然都是非全面调查,但它们与抽样调查有很大不同抽样调查是随机地抽取调查单位,而重点调查和典型调查的单位不是随机抽取的,具有一定的主观性三、统计数据搜集的方法(一)搜集第一手统计数据的方法搜集调查对象的原始数据,常用的方法有直接观察法、报告法、采访法等任何一种调查都必须采用一定的调查方法去搜集原始数据二)搜集第二手数据的方法通过各种渠道获取现成的第二手数据,是十分重要而有效的手段主要来源有公开的出版物、未公开的内部调查等公开出版或报道的社会经济统计数据主要来自国家和地方的统计部门以及各种报刊媒介一些由于受公开发表篇幅限制或保密等原因未公开发表的内部调查的数据,特别是调查的原始数据,是非常宝贵的第二手数据资源通过与原调查单位进行合作,并注意保密及合理使用等问题。
利用间接来源的统计数据,必须注意几个问题:1)要评估第二手数据的可用价值无法找到原始的调查背景资料,或数据保存不完全,会降低第二手数据的使用价值2)要注意指标的含义、口径、计算方法是否具有可比性,避免误用和滥用3)注意弥补缺失数据和进行质量检查4)引用统计数据时,一定要注明数据来源四、统计数据的质量统计数据的误差通常是统计数据与客观现实之间的差距,误差有:登记性误差、代表性误差登记性误差调查者造成的登记性误差:调查方案中有关规定不明导致的填报错误、抄录错误、汇总错误被调查者造成的登记性误差:人为因素干扰有意虚报或瞒报调查数据,这种误差是可以消除的代表性误差主要是指在用样本数据进行推断时所产生的随机误差原因主要有:1)抽取样本时没有遵循随机原则;2)样本结构与总体结构存在差异;3)样本容量不足这类误差通常是无法消除的,但事先可以进行控制或计算二)统计数据的质量要求及检查①精度,即最低的抽样误差或随机误差;②准确性,即最小的非抽样误差或偏差;③关联性;④及时性;⑤一致性;⑥最低成本第二十三章 统计数据的整理与显示数据整理通常包括数据的预处理、分类或分组、汇总等几个方面的内容,是统计分析之前的必要步骤。
数据的预处理是数据整理的先前步骤包括:数据的审核、筛选、排序等一、品质数据的整理与显示(一)分类数据的整理与显示1.频数与频数分布频数( Frequency),也称次数,是落在各类别中的数据个数把各个类别及其相应的频数全部列出来就是频数分布或称次数分布将频数分布用表格的形式表现出来就是频数分布表比例( Proportion)比例是一个总体中各个部分的数量占总体数量的比重,公式:0 ≤ Ni/N ≤1各部分的比例之和等于l,公式:∑(Ni/N)=1百分比( Percentage)比例×100%就是百分比或百分数比率(Ratio)可以是一个总体中各不同部分的数量对比,由于比率不是总体中部分与整体之间的对比关系,因而比值可能大于1比例与比率的区别:1)比例对分母不做要求;比率的分母应为1或1002)所有比例之和为1;比率与1无关3)比例是个体与总体之比;比率是两个个体之比例如:某班级共152人,其中男生52人,女生100人1)男生频数为52,女生频数为100;2)男生比例为52/152,女生比例为100/152,两者之和为1;3)男生所占百分比为52/152×100%,女生所占百分比为100/152×100%4)男生女生比率为52/100,女生男生比率为100/52(两者与1无固定关系)2.分类数据的图示反映分类数据的图示方法包括:条形图和圆形图。
如果两个总体或两个样本的分类相同且问题可比,还可以绘制环形图条形图( Bar chart)可以横置或纵置,纵置时也称为柱形图条形图有单式、复式等形式在表示定类数据的分布时,用条形图的高度来表示各类别数据的频数或频率各类别放在纵轴,称为条形图;放在横轴,称为柱形图圆形图( Pie chart)也称饼图,主要用于表示总体中各组成部分所占的比例,研究结构性问题十分有用总体中各部分所占的百分比用圆内的各个扇形面积表示二)顺序数据的整理与显示频数、比例、百分比、比率、条形图和圆形图等,也都适用于对顺序数据的整理与显示有些方法适用于对顺序数据的整理与显示,却不适用于分类数据对于顺序数据,除了可使用上面的整理与显示技术外,还可以计算累积频数和累积频率(百分比)1.累积频数和累积频率1)累积频数(Cumulative Frequencies):将各类别的频数逐级累加起来方法有两种:①从类别顺序的开始方向最后方累加频数(数值型数据是从变量值小方向变越值大方累加频数),称为向上累积;②方向相反,称为向下累积通过累积频数,可以看出某一类别的频数之和2)累积频率或百分比(Cumulative Peirentages):将各类别的百分比逐级累加起来,也有向上累积和向下累积两种方法。
某国有企业工人工资状况工资等级工人数百分比向上累积向下累积工人数百分比(%)工人数百分比(%)一级10018.910018.9530100二级12523.622542.543081.1三级10519.833062.330557.5四级8015.141077.420037.7五级509.446086.812022.6六级356.649593.47013.2七级254.752098.1356.6八级101.9530100101.9合计530100 - - - - 二、数值型数据的整理与显示(一)数据的分组分组的方法有:单变量值分组和组距分组单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量且变量值较少的情况组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组在连续变量或变量值较多的情况下,通常采用组距分组采用组距分组需要经过以下几个步骤:1)确定分组组数要求:①划分的组数,既不应太多也不应太少②组数的确定,要尽量保证组间资料的差异性与组内资料的同质性③采用的分组办法,要能够充分显示客观现象本身存在的状态。
2)对原始资料进行排序3)求极差最大值-最小值便得到极差4)确定各组组距在实行等距分组的情况下,组距的确定办法为:组距 = 极差/组数(一般取5或10的倍数)组距与组数成反比关系,组数越多,组距越小;组数越少,组距越大组距是每组观察值的最大差,即每组的上限值与下限值之间的差用公式表示就是:组距 = 某组的上限值一该组的下限值5)确定组限组限是组与组之间的界限上限值与下限值的平均数称为组中值组中值的代表性如何,取决于组中观察值的变化是否呈对称分布状态组中值的一般计算方法为:组中值 =(上限+下限)/2确定组限时应注意:①第一组的下限值应比最小的观察值小,最后一组的上限值应比最大的观察值大②如无必要不要使用开口组③组限值应能被5除尽,一般要用整数表示6)确定各组观察值出现的频数采用组距分组时应需要遵循:①“不重不漏”的原则②习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,应计算在下限组内7)制作频数分布表例如:某班级考试成绩分别为91、98、93、103、97、95、100、96、93、99、98,对其分组成绩区间组中值频数频率(%)90-9592.533/11×10095-10097.566/11×100100-105102.522/11×100合计-11100(二)数值型数据的图示1.直方图是用矩形的宽度和高度来表示频数分布的图形。
无论是等距分组的数据还是不等距分组的数据,我们用矩形的面积或频数密度来表示各组的频数分布更为合适,因为直方图下的总面积等于l直方图与条形图不同:条形图是用条形的长度(横置时)表示各类别频数多少,其宽度(表示类别)则是固定的,与面积无意义;直方图是用面积表示各组频数的多少,高度表示每一组的频数或百分比,宽度则表示各组的组距,因此其高度与宽度均有意义由于分组数据具有连续性,直方图的各矩形是连续排列,而条形图则是分开排列2.折线图也称频数多边形图,是在直方图的基础上,把直方周顶部的中点(即组中值)用直线连接起来需要注意,折线同的两个终点要与横轴相交三、统计表统计表和统计图作为显示统计数据的两种基本方式一)统计表的构成统计表是用于显示统计数据的基本工具统计表一般由四个主要部分组成,即表头、行标题、列标题和数字资料,可在统计表的下方加上表外附加表外附加通常放在统计表的下方,主要包括资料来源、指标的注释和必要的说明等内容二)统计表的设计统计表的设计应符合科学、实用、简练、美观的要求设计统计表时要注意:1)要合理安排统计表的结构2)表头一般应包括表号、总标题和表中数据的单位等内容总标题应简明确切地概括出统计表的内容,一般需要表明统计数据的时间( When)、地点(Where)以及何种数据(What),即标题内容应满足3W要求。
3)表中的上下两条横线一般用粗线,中间的其他线要用细线,统计表的左右两边不封口,列标题之间一般用竖线隔开,表中尽量少用横竖线4)可在表的下方加上注释,但要注明资料来源第二十四章 数据特征的测度对统计数据特征的测度要从三个方面进行:1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;2)分布的离散程度,反映各数据远离其中心值的趋势;3)分布的偏态和峰度,反映数据分布的形状一、集中趋势的测度集中趋势就是寻找数据一般水平的代表值或中心值,包括:位置平均数和数值平均数位置平均数是按数据的大小顺序或出现频数的多少,确定的集中趋势的代表值,主要有:众数、中位数等;数值平均数是根据全部数据计算出来的平均数,主要有:算术平均数、几何平均数等一)众数众数是一组数据中出现频数最多的那个数值用众数反映集中趋势,非常直观,不仅适用于品质数据,也适用于数值型数据众数是一个位置代表值,不受极端值的影响二)中位数把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数寻找中位数时,注意数据个数,如奇数、偶数(当中数值除2)例如:某地级市下辖9个县,每个县的面积如下(单位:平方千米),计算该市下辖县面积的中位数:1 455 2 019 912 1 016 1 352 1 031 2 128 1 075 2 000中位数位置=(9+1)÷2=5,中位数为1 352,即M,=1 352(平方千米)行政区划调整后,该市现在下辖1 0个县,该市下辖县的面积(单位:平方千米)从小到大依次为:912 1 000 1 016 1 031 1 075 1 352 1 455 2 000 2 019 2 128中位数位置=(10+1)÷2=5.5,中位数为1 213.5 中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据。
中位数也是一个位置代表值,不受极端值的影响三)算术平均数算术平均数是全部数据的算术平均,又称均值算术平均数是集中趋势最主要的测度值,是进行统计分析和统计推断的基础它主要适用于数值型数据,但不适用于品质数据1.简单算术平均数主要用于处理未分组的原始数据例如:某班级考试成绩分别为91、98、93、103、97、95、100、96、94、99、98,求算术平均数?=(91+98+93+103+97+95+100+96+94+99+98)/11 = 1064/11 = 96.732.加权算术平均数主要用于处理经分组整理的数据权数以百分比表示,各层权数之和等于1OO,权数一律取整数例如:某班级考试成绩分布如下表所示,求算术平均数?成绩区间组中值频数90-9592.5395-10097.56100-105102.52X =(92.5*3+97.5*6+102.5*2)/11 = (277.5+585+205)/11 = 1067.5/11 = 97.05计算和运用算术平均数需注意:1)在数值不变的情况下,哪一组的频数多,该组的数值对平均数的作用就大2)算术平均数易受极端值的影响四)几何平均数n个观察值连乘积的n次方根就是几何平均数。
计算几何平均数要求各观察值之间存在连乘积关系,它的主要用途是:①对比率、指数等进行平均;②计算平均发展速度与各组数值大小、各组频数有关综合考虑所有数据,受极端值影响没充分运用所有数据,不受极端值影响二、离散程度的测度离散程度是数据之间的差异程度或频数分布的分散程度离散程度测度衡量数据总体偏离代表性数据的程度,是误差的概念,即指标越大,误差越大,代表性越差主要包括:极差、方差和标准差,离散系数等一)极差极差是最简单的变异指标最大值 - 最小值,又称全距缺点:未充分利用所有数据、易受极端值影响反映的是变量分布的变异范围或离散幅度,仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响二)标准差和方差标准差是总体所有单位标志值与其平均数离差之平方的平均数的平方根方差就是标准差的平方标准差是最常用的变异指标优点是能充分利用所有数据信息;缺点是有单位,不便于不同数据间的比较极差、标准差和方差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响,采用不同计量单位计量的变量值,其离散程度的测度值也就不同三)离散系数离散系数也称标准差系数,通常是就标准差来计算,是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标。
优点是便于不同数据间离散程度比较第二十五章 时间序列一、时间序列及其分类社会经济现象总是随着时间的推移而变化,呈现动态性从静态上揭示研究对象在具体时间、地点,条件下的数量特征和数量关系,从动态上反映其发展变化过程及规律性统计对事物进行动态研究的基本方法是编制时间序列时间序列也称动态数列,由两个基本因素构成:1)被研究现象所属时间,2)是反映该现象一定时间条件下数量特征的指标值按构成要素中统计指标值的表现形式分为:绝对数时间序列、相对数时间序列和平均数时间序列三种类型时点序列中,每一指标值反映现象在一定时点上的瞬间水平,例如:年底总人口数绝对数时间序列可以派生出相对数和平均数时间序列例如:城镇人口比重是相对数时间序列,人均国内生产总值是平均数时间序列二、时间序列的水平分新(一)发展水平发展水平是时间序列中对应于具体时间的指标数值也就是说,在绝对数时间序列中,发展水平就是绝对数;在相对数和平均数时间序列中,发展水平表现为相对数或平均数时间序列的第一项指标为最初水平,最末项称为最末水平,处于二者间各期指标称为中间水平(y0,y1… yn)基期水平是作为对比的基础时期的水平;报告期水平是所要反映与研究的那一时期的水平。
二)平均发展水平平均发展水平也称序时平均数或动态平均数,是对时间序列中各时期发展水平计算的平均数1.绝对数时间序列序时平均数的计算1)由时期序列计算序时平均数计算公武为:例职:某企业2000年-2006年销售输入分别为120万元、110万元、130万元、150万元、140万元、200万元、250万元,求这段时间内的年平均销售收入?=(120+110+130+150+140+200+250)/7 = 157.142)由时点序列计算序时平均数时点序列的指标值反映现象在某一时点上的瞬间水平以“天”作为最小时间单位又分为:连续时点序列、间断时点序列资料逐日登记的是连续时点序列;资料不是逐日登记,而是间隔较长一段时间后再登记一次,然后依序排列的是间断时点序列第一种情况,由连续时点计算又分为两种情形:①资料逐日登记且逐日排列,即已掌握了整段考察时期内连续性的时点数据可采用简单算术平均数方法计算例如:某企业1月1日——10日职工人数如下所示,求这段时间内平均工人数:日期12345678910人数20222132243029283249 =(20+22+21+32+24+30+29+28+32+49)/10②资料登记的时间单位仍然是1天,但实际上只在指标值发生变动时才记录一次。
可采用加权算术平均数的方法计算序时平均数;权数是每一指标值的持续天数例如:某企业1月1日——31日职工人数如下所示,只有在工人数变动时记录,求这段时间内平均工人数:日期1-56-1718-2223-2930-31人数2021242832M=(20*5+21*12+24*5+28*7+32*2)/ 31第二种情况,由间断时点计算又分为两种情形:①每隔一定的时间登记一次,间隔相等计算思想是“两次平均”:先求各个时间间隔内的平均数,再对这些平均数进行简单算术平均例如:某企业第一季度职工人数如下所示,求这段时间内平均工人数:日期1.12.13.14.1人数20212428M = [(20+21)/2+(21+24)/2+(24+28)/2]/(4-1)②每隔一定的时间登记一次,间隔不相等计算思想是“两次平均”:第一次平均计算与间隔相等的间断相同,第二次时用间隔长度作为权数,计算加权算术平均数例如:某企业职工人数如下所示,求这段时间内平均工人数:日期1.14.17.19.112.1人数2021242832M = {[(20+21)/2]*(4-1)+[(24+21)/2]*(7-4)+[(28+24)/2]*(9-7)+[(32+28)/2]*(12-9)} / (12-1)2.相对数或平均数时间序列序时平均数的计算相对数或平均数时间序列是派生数列,相对数或平均数通常是由两个绝对数对比形成的。
必须分别求出分子指标和分母指标时间序列的序时平均数,然后再进行对比例如:某企业2007年1-6月份销售输入分别为120万元、110万元、130万元、150万元、140万元、200万元,工人数如下表所示,求1-6月份的平均每人每月销售收入?日期1.12.13.14.15.16.17.18.1人数20222132243029281、月销售额平均My = (120+110+130+150+140+200)/6=141.67Mr = [(20+22)/2+(22+21)/2+(21+32)/2+(32+24)/2+(24+30)/2+(30+29)/2]/(7-1) = 25.58 {[(20+29)/2+22+21+32+24+30]/(7-1)} = 141.67/25.58 = 5.54万元 /人/月例如:计算我国1992年至1997年第三产业从业人员数占总从业人员人数比重的年平均数年份199219931994199519961997从业人员数655546637367199679476885069600其中:第三产业(万人)129791407115456168511790118375第三产业所占比重(%)19.8021.2023.0024.8026.0026.40A = [(12979+18375)/2+14071+15456+16851+17901]/(1997-1992) = 15991.2B = [(65554+69600)/2+66373+67199+67947+68850]/(1997-1992) = 67589.2Y = a/b = 15991.2/67589.2=23.66%(三)增长量与平均增长量1.增长量增长量是报告期发展水平与基期发展水平之差,增长量可分为:逐期增长量和累计增长量。
用公式表示为:增长量 = 报告期水平 - 基期水平1)逐期增长量,是报告期水平与前一期水平之差2)累计增长量,是报告期水平与某一固定时期水平(时间序列最初水平)之差,用公式表示为:累计增长量等于相应时期逐期增长量之和例如:某企业2000-2007年度生产量分别为:年度20002001200220032004200520062007生产量2022213224302928求:1)00-07年的累积增长量为多少? ∆I = yi-y0 = 28-20 = 82)各逐期增长量为多少? = 3)00-07年的平均增长量是多少? = 8/(2007-2000) = 1.142.平均增长量平均增长量(算术平均逐期增长量)平均增长量是时间序列中逐期增长量的序时平均数:逐期增长量与累计增长量之间的数量关系:例如:某企业2000-2007年度生产量分别为:年度20002001200220032004200520062007相对于前一年的逐期增长量2022213224302928求:1)00-07年的累积增长量为多少? = (20+22+21+32+24+30+29) = 1772)00-07年的平均增长量是多少? = 177/(2007-2000) = 25.29例如:某企业2000-2007年度生产量分别为:年度20002001200220032004200520062007相对于1999年的累积增长量2022213224302928求:1)各逐期增长量为多少?年度20002001200220032004200520062007相对于前一年的逐期增长量202-111-86-1-12)00-07年的平均增长量是多少? = (20+2-1+11-8+6-1)/7 = 29/7 = 4.14三、时间序列的速度分新(一)发展速度与增长速度1.发展速度发展速度是以相对数形式表示的两个不同时期发展水平的比值。
由于基期选择的不同,发展速度有:定基与环比定基发展速度是报告期水平与某一固定时期水平(通常是最初水平)的比值相对于某个基础水平,在一定时期内总的发展速度定基发展速度时间序列中,各时期比较的基础固定在一个共同的水平上;环比发展速度是报告期水平与其前一期水平的比值相邻两个时期(逐期)发展变化的程度环比发展速度时间序列,呈现各时期发展水平交替作为报告期与基期使用的循环对比状态区别,但也存在着一定的数量依存关系:第一,定基发展速度等于相应时期内各环比发展速度的连乘积第二,两个相邻时期定基发展速度的比率等于相应时期的环比发展速度2.增长速度增长速度是报告期增长量与基期水平的比值由于基期选择的不同,发展速度有:定基与环比若增长量为逐期增长量,则计算的是环比增长速度定基增长速度与环比增长速度不能像定基发展速度与环比发展速度那样互相推算,因为定基增长速度不等于相应时期内各环比增长速度的连乘积;两个相邻时期定基增长速度的比率也不等于相应时期的环比增长速度例如:某企业2000-2007年度生产情况分别为:年度20002001200220032004200520062007生产量2022213224302928求:1)00-07年的定基增长速度为多少? = 2/20 -1/20 11/20 -8/20 6/20 -1/20 -1/202)各环比增长速度为多少? = 2/20 -1/22 11/21 -8/32 6/24 -1/30 -1/293)00-07年的平均增长速度多少? = 平均增长速度 = 平均发展速度-1 = (28/20)1/7-1例如:某企业2000-2007年生产量分别为:年度20002001200220032004200520062007相对前期环比增长速度20%22 %21 %32 %24 %30 %29 %28 %求:1)00-07年的定基增长速度为多少? = 1.2*1.22*1.21*1.32*1.24*1.3*1.29-12)00-07年的平均增长速度是多少? = (1.2*1.22*1.21*1.32*1.24*1.3*1.29)1/7-1(二)平均发展速度与平均增长速度平均发展速度,反映现象在一定时期内逐期发展变化的一般程度平均增长速度,反映现象在一定时期内邃期增长(降低)变化的一般程度。
重点是平均发展速度指标,是与平均发展速度之间的数量关系:平均增长速度 = 平均发展速度-l,由平均发展速度的计算结果求得的目前计算平均发展速度通常采用几何平均法,也称水平法原理是:一定时期内现象发展的总速度等于各期环比发展速度的连乘积三)速度的分析与应用1)当时间序列中的指标值出现0或负数时,不宜计算速度,适宜直接用绝对数进行分析增长1%的绝对值”2)环比增长速度是相对数,一般用百分数表示例如:某企业2000年生产总量为2000万件,2002年生产总量为2400万件,按照这样的发展速度,该企业2007年度生产量为多少?求:2002年定基发展速度 = 2400/2000 = 120%求:2000-2002年平均发展速度 =(1.2)1/2 = 109.54%求:2007年定基发展速度 = (1.0954)7求:2007年生产量 = 2000 *(1.0954)7 = 第二十六章 统计指数一、指数的概念和分类指数,广义地讲,任何两个数值对比形成的相对数都可以称为指数;狭义地讲,指数是用于测定多个项目在不同场合下综合变动的一种特殊相对数从不同角度出发,指数可以分为以下几种主要类型:按所反映的内容不同,可以分:数量指数(销售量指数、生产量指数)和质量指数(价格指数、产品成本指数)。
按计入指数的项目多少不同,可分:个体指数(反映一个项目变动的相对数)和综合指数(反映多个项目综合变动的相对数)按计算形式不同,可分:简单指数(各项目权数相同)和加权指数(各项目权数不同)目前普遍应用的是加权指数二、加权综合指数较为常用的是基期加权综合指数和报告期加权综合指数两种形式一)基期加权综合指数基期加权综合指数又称拉氏指数,是在计算一组项目的综合指数时,把作为权数的各变量值固定在基期拉氏指数由于以基期变量值为权数,使不同时期的指数具有可比性不能反映出消费量的变化拉氏数量指数,是假定价格不变的条件下报告期销售量的综合变动,它不仅可以单纯反映出销售量的综合变动水平,也符合计算销售量指数的实际要求,因此,拉氏数量指数在实际中应用得较多数量指数引起的价格变动,求数量指数用拉氏分子分母中有3个“0” (报告期)(二)报告期加权综合指数报告期加权综合指数又称帕氏指数,是在计算一组项目的综合指数时,把作为权数的变量值固定在报告期帕氏指数因以报告期变量值为权数,因而不同时期的指数缺乏可比性但帕氏指数可以同时反映出价格和消费结构的变化,具有比较明确的经济意义帕氏数量指数由于包含了价格的变动,意味着是按调整后的价格来测定物量的综合变动,因此帕氏数量指数在实际中应用得较少。
质量指数,由价格引起的销售变动,求价格指数用拉氏分子分母中有3个“1”(基期)三、指数体系(一)总量指数与指数体系总量指数是由两个不同时期的总量对比形成的相对数得到各个因素指数,如商品销售额指数可分解为销售量与价格两个因素指数二)指数体系的分析与应用例:某商场基期、报告期销售情况如下: 价格销售量P0P1Q0Q1甲产品100120400300乙产品506010080丙产品200150300500求:1.总销售额指数∑P1Q1 / ∑P0Q0 = (120*300+60*80+150*500)/(100*400+50*100+200*300)求:2.基期到报告期销售额的变化量∆ = ∑P1Q1 - ∑P0Q0 = (120*300+60*80+150*500)-(100*400+50*100+200*300)求:3.销售价格指数(单独由于价格改变导致销售额的变化率)∑P1Q1 / ∑P0Q1 = ( 120*300+60*80+150*500)/(100*300+50*80+200*500)求:4.单独由于销售价格的改变而使得该商场销售额的变化量∑P1Q1 - ∑P0Q1 = (120*300+60*80+150*500)-(100*300+50*80+200*500)求:5.销售量指数(单独由于销售量改变导致销售额的变化率)∑P0Q1 / ∑P0Q0 = (100*300+50*80+200*500)/(100*400+50*100+200*300)求:6.单独由于销售量的改变而使得该商场销售额的变化量∑P0Q1 - ∑P0Q0 = (100*300+50*80+200*500)-(100*400+50*100+200*300)求:7.各指数之间的关系7. 销售额指数=价格指数*销售量指数∑P1Q1 / ∑P0Q0 = ∑P1Q1 / ∑P0Q1 * ∑P0Q1 / ∑P0Q0 =求:8.各变化量之间的关系∆ = ∑P1Q1 - ∑P0Q0 = ∑P1Q1 - ∑P0Q1 + ∑P0Q1 - ∑P0Q0 销售额变动 = 价格变动的影响额 + 销售量变动的影响额四、几种常用的价格指数(一)零售价格指数主要有商品零售价格指数、居民消费价格指数、农业生产资料价格指数、农产品收购价格指数、工业品出厂价格指数、固定资产投资价格指数等。
最为密切的是商品零售价格指数和居民消费价格指数二)消费价格指数居民消费价格指数可以观察消费价格的变动水平及对消费者货币支出的影响,研究实际收入和实际消费水平的变动状况城市居民消费价格指数是反映城市职工及其家庭所购买的生活消费品和服务项目价格变动趋势和程度的相对数,能反映城乡居民所购买的生活消费品价格和服务项目价格的变动趋势和程度外,还具有以下几个方面的作用:1)反映通货膨胀状况2)反映货币购买力变动3)反映对职工实际工资的影响三)股票价格指数股票价格通常与两个直接因素相关:一是预期股息,二是银行存款利息率股票价格的高低与预期股息成正比,与银行存款利息率成反比1)股价平均数股价平均数是股票市场上多种股票在某一时点上的算术平均值,一般以收盘价来计算2)股票价格指数股票价格指数是反映某一股票市场上多种股票价格变动趋势的一种相对数,其单位一般以“点”表示,即将基期指数作为1OO,每上升或下降一个单位称为“l点”。