文档详情

社会经济统计学第3章统计数据的整理与显

zhu****ng
实名认证
店铺
2024-12-10
PPT
430.50KB
约27页
社会经济统计学第3章统计数据的整理与显_第1页
1/27
社会经济统计学第3章统计数据的整理与显_第2页
2/27
社会经济统计学第3章统计数据的整理与显_第3页
3/27

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第,3,章 统计数据的整理与展示,3.1,统计数据整理概述,3.2,统计分组,3.3,次数分布,3.4,统计整理数据的显示,3.1,统计数据整理概述,一、统计整理的含义:对原始统计数据进行加工汇总,使之系 统化、条理化、科学化、反映数据分布规律的工作过程三、统计整理的意义:统计调查的继续,统计分析的前提四、统计数据的审核:统计数据的检查和处理1,、完整性审核,2,、准确性审核:逻辑检查;计算检查3,、适用性和时效性审核(二手数据),二、统计整理的内容:审核;分组;汇总加工;编制图表;系统积累3.2,统计分组,一、统计分组的概念与原则,1,、概念:按照某个或若干标志将总体划分为若干部分;其中每个部分成为组例如,按照性别,人口可以分为男、女两组2,、原则:,(,1,)组间差异性(分)、组内同质性(合);,(,2,)互斥原则、穷尽原则二、统计分组的作用,1,、划分现象类型;,2,、揭示现象内部的结构;,3,、研究现象之间的数量依存关系三、分组标志的选择,1,、根据研究目的选择;,2,、选择最能反映现象本质特征的标志;,3,、根据现象所处的具体历史条件或经济条件选择。

四、统计分组的分类,1,、按分组标志类型:品质标志分组;数量标志分组2,、按分组标志数量和排列方式:简单分组;复合分组;平行分组男,女,90,以上,男,女,80 90,男,女,70 80,男,女,60 70,男,女,60,以下,男,女,90,以上,80 90,70 80,60 70,60,以下,3.3,次数分布,一、次数分布的概念和构成要素,1,、概念:分组及总体中各单位在各组间的分布(次数)按一定顺序形成的排列,也称为次数分布数列,简称分布数列2,、要素:分组;次数按性别分组,次数(频数),男,30,女,20,合计,50,频率(,%,),60,40,100,次数分布表,二、次数分布数列的分类,1,、品质分布数列,2,、变量分布数列,(,1,)离散型:,单项、组距(等距、不等距);,(,2,)连续型:,等距、不等距单词,按字母数,分组,单词数,0 2,18,3 5,14,6 8,15,9 11,2,12 14,1,合计,50,学生,按成绩,分组,学生,人数,50 60,5,60 70,13,70 80,18,80 90,12,90 100,2,合计,50,工人平均日产量(件),工人人数,1,5,2,13,3,18,4,12,5,2,合计,50,人口,按年龄,分组,人口数(万人),1,岁以下,1,1 7,岁,6,7 17,岁,12,17 55,岁,24.6,55,以上,8.1,合计,51.7,单项数列 等距数列 不等距数列,三、组距数列的编制,1,、基本概念,(,1,)组限,组的最小值(下限);,组的最大值(上限);,(,2,)组距,=,上限,-,下限(组限重叠),组距,=,相邻两组限之差(组限重叠、不重叠),(,3,)组中值,闭口组:组中值,=,(下限,+,上限),/2,缺下限:组中值,=,该组上限,相邻组组距,/2,缺上限:组中值,=,该组下限,+,相邻组组距,/2,学生,按成绩,分组,学生,人数,60,以下,5,60 70,13,70 80,18,80 90,12,90,以上,2,合计,50,2,、编制步骤(以等距数列为例),(,1,)排序,计算全距:,全距,=,最大值,最小值;,例,全距,=99,56=43,;,(,2,)确定组数,K,,计算组距,d,:,组数根据数据多少、经验、,习惯等确定,,5 20,组;,组距,=,全距,/,组数,的调整;,例,,K=5,,,43,/5 =9,,,取,d=10,;,89,88,76,99,74,60,82,60,89,86,93,99,94,82,77,79,97,78,95,92,87,84,79,65,98,67,59,72,84,85,56,81,77,73,65,66,83,63,79,70,56,59,60,60,63,65,65,66,67,70,72,73,74,76,77,77,78,79,79,79,81,82,82,83,84,84,85,86,87,88,89,89,92,93,94,95,97,98,99,99,某班,40,位同学统计学成绩,(,3,)确定组限:,最小组下限小于等于最小值;,最大组上限大于等于最大值;,组限选方便的数或,引起事物质变的界限;,连续型变量分组组限重叠;,离散型变量分组组限不重叠;,56,59,60,60,63,65,65,66,67,70,72,73,74,76,77,77,78,79,79,79,81,82,82,83,84,84,85,86,87,88,89,89,92,93,94,95,97,98,99,99,某班,40,位同学统计学成绩,(,4,)计算频数,编制变量数列:,56,59,60,60,63,65,65,66,67,70,72,73,74,76,77,77,78,79,79,79,81,82,82,83,84,84,85,86,87,88,89,89,92,93,94,95,97,98,99,99,某班,40,位同学统计学成绩,按成绩分组,人数,比重(,%,),50 60,2,5,60 70,7,17.5,70 80,11,27.5,80 90,12,30,90 100,8,20,合计,40,100,某班学生统计学成次数分布表,3,、组距数列编制原则,(,1,)适合于连续变量或离散变量取值较多场合;,(,2,)组数根据数据多少、经验、习惯等确定,,5 20,组;,(,3,)组距或组限使用方便的数,或体现质变的临界值;,(,4,)数据分布均匀,使用等距分组;不均匀,使用不等距分组;,根据需要拆分、合并组,或使用开口组;,(,5,)连续型变量分组组限重叠,上限不在本组内;,(不重不漏),(,6,)离散型变量分组组限不重叠,下限、上限都在本组内;,(,7,)频数合计与原始数据个数相等。

例,】,某,50,名居民月纯收入资料如下表所示,,试对数据进行分组,并编制次数分布表1500,3560,1280,1480,1930,460,740,1850,1710,1320,1550,1140,1690,2230,2400,2100,1570,1200,1900,2200,580,1850,1600,2750,1670,2500,2600,4000,500,2900,680,1050,2300,3350,1420,1870,2000,850,1360,1750,1820,1000,1240,1750,1630,2000,1650,1190,1730,3100,460,850,1200,1420,1600,1710,1850,2000,2300,2900,500,1000,1240,1480,1630,1730,1850,2000,2400,3100,580,1050,1280,1500,1650,1750,1870,2100,2500,3350,680,1140,1320,1550,1670,1750,1900,2200,2600,3560,740,1190,1360,1570,1690,1820,1930,2230,2750,4000,解:(,1,)排序,计算全距:,R=4000 460=3540,;,(,2,)确定组数,计算组距:,取,K=9,,则,3540/9 =392,,故取,d=400,;,(,3,)确定组限:,400-800,800 1200,,,1200 1600,,,1600 2000,,,2000 2400,2400 2800,,,2800 3200,,,3200 3600,,,3600 4000,;,460,850,1200,1420,1600,1710,1850,2000,2300,2900,500,1000,1240,1480,1630,1730,1850,2000,2400,3100,580,1050,1280,1500,1650,1750,1870,2100,2500,3350,680,1140,1320,1550,1670,1750,1900,2200,2600,3560,740,1190,1360,1570,1690,1820,1930,2230,2750,4000,(,4,)计算频数,,编制变量数列,,并形成次数分布表:,按收入分组,人数,比重(,%,),400 800,5,10,800 1200,5,10,1200 1600,10,20,1600 2000,15,30,2000 2400,6,12,2400 2800,4,8,2800 3200,2,4,3200 3600,2,4,3600 4000,1,2,6,12,11,22,18,36,9,18,4,8,1,2,460,850,1200,1420,1600,1710,1850,2000,2300,2900,500,1000,1240,1480,1630,1730,1850,2000,2400,3100,580,1050,1280,1500,1650,1750,1870,2100,2500,3350,680,1140,1320,1550,1670,1750,1900,2200,2600,3560,740,1190,1360,1570,1690,1820,1930,2230,2750,4000,(,5,)调整:组的合并、拆分与重组。

按收入分组,人数,比重(,%,),400 800,5,10,800 1200,5,10,1200 1600,10,20,1600 2000,15,30,2000 2400,6,12,2400 2800,4,8,2800 3200,2,4,3200 3600,2,4,3600 4000,1,2,按收入分组,人数,比重(,%,),400 1000,1000 1500,1500 2000,2000 2800,2800 3200,3200 4000,不等距变量数列,【,课堂练习,】,某车间同工种的,40,名工人完成个人生产定额百分数如下:,97,88,123,115,119,158,112,146,117,108,105,110,107,137,120,136,125,127,142,118,103,87,115,114,117,124,129,138,100,103,92,95,113,126,107,108,105,119,127,104,试根据上述资料,编制变量分配数列3.4,统计整理数据的显示,一、统计图,1,、直方图,工人,按加工零件数分组,人数,80 90,3,90 100,7,100 110,13,110 120,5,120 130,2,合计,30,某车间工人加工零件数直方图,2,、折线图,某车间工人加工零件数直方图,零件数,工,人,数,频,率,密,度,次数分布的主要类型,对称分布,右偏分布,左偏分布,正,J,型分布,反,J,型分布,U,型分布,3,、累计次数分布,工人,按加工零件数分组,人数,较小制累计,较大制累计,80 90,3,90 100,7,100 110,13,110 120,5,120 130,2,合计,30,某车间工人加工零件数累计次数分布表,较小制累计,较大制累计,3,30,10,27,23,20,28,7,30,2,某车间工人加工零件数累计次数分布图,零件数,累,计,工,人,数,较小制累计,较大制累计,累计次数(或累计频率)的应用:,洛伦茨曲线,20C,初,美经济、统计学家洛伦茨根据意大利经济学家帕累托,(V.Pareto),提出的收入分配公式绘制而成;,分析该国家或地区分配的平均程度。

A,B,累积的人口百分比,累积的收入百分比,20C,初,意经济学家基尼,(G.Gini),:基尼系数,G,=A/A+B,;,基尼系数小于,0.2,,表明分配平均;,基尼系数在,。

下载提示
相关文档
正为您匹配相似的精品文档