统计学第二章数据搜集第第 2 2 章章 数据搜集数据搜集2.1 2.1 数据来源数据来源2.2 2.2 调查数据调查数据2.3 2.3 实验数据实验数据2.4 2.4 数据误差数据误差统计学第二章数据搜集学习目标了解数据的来源了解数据的来源理解数据的调查方法理解数据的调查方法掌握调查方案的结构和设计掌握调查方案的结构和设计掌握调查问卷设计掌握调查问卷设计了解实验数据了解实验数据了解数据的误差了解数据的误差统计学第二章数据搜集2.1.1 数据的间接来源数据的间接来源2.1.2 数据的直接来源数据的直接来源统计学第二章数据搜集二手数据的来源二手数据的来源二手数据的特点二手数据的特点二手数据的评估二手数据的评估2.1.1 2.1.1 数据的间接来源数据的间接来源统计学第二章数据搜集二手数据的来源二手数据的来源中国统计出版社n统计部门和政府部门公布的有关资料,如各类统计年鉴n各类经济信息中心、信息咨询机构、专业调查机构等提供的数据n各类专业期刊、报纸、书籍所提供的资料n各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料n从互联网或图书馆查阅到的相关资料 统计学第二章数据搜集二手数据的特点收集容易,采集成本低收集容易,采集成本低作用广泛作用广泛 分析所要研究的问题分析所要研究的问题 提供研究问题的背景提供研究问题的背景 帮助研究者更好地定义问题帮助研究者更好地定义问题 检验和回答某些疑问和假设检验和回答某些疑问和假设 寻找研究问题的思路和途径寻找研究问题的思路和途径收集二手资料在研究中应优先考虑收集二手资料在研究中应优先考虑统计学第二章数据搜集二手数据的评估二手数据的评估数据是谁收集的?数据是谁收集的?可信度评估可信度评估为什么目的而收集的?为什么目的而收集的?数据是怎样收集的?数据是怎样收集的?什么时候收集的?什么时候收集的?统计学第二章数据搜集使用二手数据需要注意的问题使用二手数据需要注意的问题 应注意数据的含义、计算口径和计算方法,避应注意数据的含义、计算口径和计算方法,避免误用或滥用;免误用或滥用;注意二手数据的时间性,不能用过时的数据;注意二手数据的时间性,不能用过时的数据;应充分搞清这些数据的来源和可靠程度;应充分搞清这些数据的来源和可靠程度;应注明数据的出处,以尊重他人的劳动成果。
应注明数据的出处,以尊重他人的劳动成果统计学第二章数据搜集数据的直接来源数据的直接来源(原始数据原始数据)调查数据调查数据 通过调查方法获得的数据通过调查方法获得的数据 通常是对社会现象而言通常是对社会现象而言 通常取自有限总体通常取自有限总体 实验数据实验数据 通过实验方法得到的数据通过实验方法得到的数据 通常是对自然现象而言通常是对自然现象而言 也被广泛运用到社会科学中也被广泛运用到社会科学中如心理学、教育学、社会学、经济学、管理学等如心理学、教育学、社会学、经济学、管理学等 统计学第二章数据搜集搜集数据的基本方法搜集数据的基本方法2.2.42.2.4调查方案的设计调查方案的设计统计学第二章数据搜集2.2.1 2.2.1 统计调查方式统计调查方式统计调查方式统计调查方式统计学第二章数据搜集 普查是为某一特定目的而专门组织的一次性全面调查普查是为某一特定目的而专门组织的一次性全面调查特点:特点:普查通常是一次性的或周期性的例如国务院规定每普查通常是一次性的或周期性的例如国务院规定每1010年进行一次人口普查年进行一次人口普查普查一般需要规定统一的标准时点例如,第普查一般需要规定统一的标准时点。
例如,第5 5次人口次人口普查的标准时间为普查的标准时间为20002000年年1111月月1 1日日0 0时普查数据的准确性、标准化程度均较高普查数据的准确性、标准化程度均较高 ;普查的调查项目较少,适用范围较狭窄,调查资料缺乏普查的调查项目较少,适用范围较狭窄,调查资料缺乏深度普查普查(census)(census)统计学第二章数据搜集 抽样调查抽样调查(sampling survey)(sampling survey)1.1.从总体中随机抽取一部分单位作为样本进行从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征调查,并根据样本调查结果来推断总体特征的数据收集方法的数据收集方法 统计学第二章数据搜集统计报表统计报表(statistical report forms)(statistical report forms)1 1、统计报表是依照国家有关法规的规定,自上而下地统一布、统计报表是依照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式置、自下而上地逐级提供基本统计数据的一种调查方式2 2、统计报表要以一定的原始记录为基础,按照统一的表格形、统计报表要以一定的原始记录为基础,按照统一的表格形式、统一的指标项目、统一的报送时间和报送程序进行填报。
式、统一的指标项目、统一的报送时间和报送程序进行填报按填报范围不同可分为全面报表和非全面报表按填报范围不同可分为全面报表和非全面报表 按报送周期不同可分为日报、月报、季报、年报等按报送周期不同可分为日报、月报、季报、年报等按填报内容和实施范围不同可分为国家、部门和地方统按填报内容和实施范围不同可分为国家、部门和地方统计报表计报表 统计学第二章数据搜集抽样方法概率抽样非概率抽样方便抽样判断抽样自愿抽样雪球抽样简单随机抽样系 统 抽 样分 层 抽 样整 群 抽 样统计学第二章数据搜集 概率抽样概率抽样 (1 1)简单随机抽样()简单随机抽样(simple random sampling)从有限总体抽取样本时,如果总体从有限总体抽取样本时,如果总体中每一个体都有同等机会被选入样本,这种抽样中每一个体都有同等机会被选入样本,这种抽样称为简单随机抽样,得到的样本称为随机样本称为简单随机抽样,得到的样本称为随机样本(random sample)统计学第二章数据搜集 实践中,得到随机样本并不容易即使选择对象的确是实践中,得到随机样本并不容易即使选择对象的确是随机的,最理想的情况所得到的样本也只代表那些愿意回随机的,最理想的情况所得到的样本也只代表那些愿意回答问题人的观点所组成的总体;没有回答问题的人的观点答问题人的观点所组成的总体;没有回答问题的人的观点永远不会被这种调查的样本所代表。
永远不会被这种调查的样本所代表比如在肺癌研究中,人们往往看到吸烟和肺癌的关系的数比如在肺癌研究中,人们往往看到吸烟和肺癌的关系的数据;这些数据并不是整个人群中采集的随机样本,它们可据;这些数据并不是整个人群中采集的随机样本,它们可能只是医院中的病人记录中得到的能只是医院中的病人记录中得到的在报纸和网上也有问卷,但得到的只是上了网和有这份在报纸和网上也有问卷,但得到的只是上了网和有这份报刊,而且愿意回答的人的观点报刊,而且愿意回答的人的观点统计学第二章数据搜集抽样框是有关总体全部单位的名录抽样框是有关总体全部单位的名录特点特点简单、直观,在抽样框完整时,可直接从中抽取样简单、直观,在抽样框完整时,可直接从中抽取样本本用样本统计量对目标量进行估计比较方便用样本统计量对目标量进行估计比较方便局限性局限性当当N N很大时,不易构造抽样框很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难抽出的单位很分散,给实施调查增加了困难没有利用其他辅助信息以提高估计的效率没有利用其他辅助信息以提高估计的效率所以规模较大的调查中,很少直接采用简单随机抽样,所以规模较大的调查中,很少直接采用简单随机抽样,一般把这种方法与其他方法结合起来使用。
一般把这种方法与其他方法结合起来使用统计学第二章数据搜集(2 2)分层(分类)随机抽样()分层(分类)随机抽样(stratified samplingstratified sampling)先根据某一特征把总体分为若干类(层,根据某一特征把总体分为若干类(层,stratumstratum),再从各类),再从各类中按简单随机抽样原则进行抽样中按简单随机抽样原则进行抽样比如按照教育程度把要访问的人群分成几类,再在每一类中比如按照教育程度把要访问的人群分成几类,再在每一类中按其所占比例进行抽样按其所占比例进行抽样男生男生女生女生样本样本统计学第二章数据搜集 层内个体之间的差异越小,而不同层之间层内个体之间的差异越小,而不同层之间的差异越大时,分层抽样的效果好的差异越大时,分层抽样的效果好统计学第二章数据搜集 (3 3)整群随机抽样()整群随机抽样(cluster samplingcluster sampling)先把总)先把总体分为若干群(体分为若干群(clustercluster),再以群为单位进行随机),再以群为单位进行随机抽样,对抽出来的群进行普查抽样,对抽出来的群进行普查比如在某县进行调查,首先在所有村中选取若干比如在某县进行调查,首先在所有村中选取若干村子,然后只对这些村子的人进行调查。
显然,如果村子,然后只对这些村子的人进行调查显然,如果各村情况差异不大,这种抽样还是方便的否则就会各村情况差异不大,这种抽样还是方便的否则就会增大误差增大误差统计学第二章数据搜集(4 4)系统抽样)系统抽样 系统抽样(也称等距抽样):将总体系统抽样(也称等距抽样):将总体N N个单位按某个单位按某种顺序排列,按规则确定一个随机起点,再每隔一种顺序排列,按规则确定一个随机起点,再每隔一定间隔逐个抽取样本单位的抽样方法定间隔逐个抽取样本单位的抽样方法直线等距抽样:直线等距抽样:将总体分成将总体分成n n个组,每组有个组,每组有 k k=N/n=N/n个单位在第一组随机选择一个单位,之后每隔在第一组随机选择一个单位,之后每隔k k个选择一个个选择一个N=64n=8k=8第一组第一组统计学第二章数据搜集非概率抽样非概率抽样 方便抽样:方便抽样:选择容易接触的个体作为调查研究对象选择容易接触的个体作为调查研究对象 判断抽样:判断抽样:根据研究者的判断,选择根据研究者的判断,选择“有代表性有代表性”或或“典型性典型性”的样本单位;的样本单位;自愿抽样:自愿抽样:指被调查者自愿参加,成为样本中的一分子,指被调查者自愿参加,成为样本中的一分子,向调查人员提供有关信息。
向调查人员提供有关信息滚雪球抽样滚雪球抽样统计学第二章数据搜集滚雪球抽样滚雪球抽样 其原理是先找到最初的样本单位,然后根据他们其原理是先找到最初的样本单位,然后根据他们提供的信息去获得新的样本单位;这种过程不断提供的信息去获得新的样本单位;这种过程不断继续,直到完成规定的样本容量为止继续,直到完成规定的样本容量为止主要用于对稀少群体的调查主要用于对稀少群体的调查例如某研究部门在调查保姆问题时,先访问了例如某研究部门在调查保姆问题时,先访问了7 7名名保姆,然后再请她们提供其他保姆名单,逐步扩保姆,然后再请她们提供其他保姆名单,逐步扩大到近百人大到近百人统计学第二章数据搜集 实际上每个抽样通常都可能是各种抽样方法的组合既实际上每个抽样通常都可能是各种抽样方法的组合既要考虑精确度,还要根据客观情况考虑方便性、可行性和经要考虑精确度,还要根据客观情况考虑方便性、可行性和经济性不能一概而论不能一概而论这些抽样方法的选择多半是艺术,而不是科学这些抽样方法的选择多半是艺术,而不是科学不仅抽样方法,而且调查方法、问卷设计、调查过程等,不仅抽样方法,而且调查方法、问卷设计、调查过程等,均可能是致命的均可能是致命的。
统计学第二章数据搜集练 习1 1、某小区、某小区40004000户居民从户居民从1-40001-4000编号,在编号,在1-1001-100中随中随机抽取机抽取1 1个号码个号码3 3,则,则3 3、103103、20339032033903构成抽样构成抽样调查样本调查样本2 2、为了解某地区职工家庭状况,将职工家庭按居委、为了解某地区职工家庭状况,将职工家庭按居委会分组,并以居委会为单位进行简单随机抽样,会分组,并以居委会为单位进行简单随机抽样,在对抽中的居委会所辖每户职工家庭进行调查在对抽中的居委会所辖每户职工家庭进行调查3 3、对农作物单位面积产量调查,按平原、丘陵、山、对农作物单位面积产量调查,按平原、丘陵、山区分组来抽选样本单位区分组来抽选样本单位系统抽样系统抽样整群随机抽样整群随机抽样分层随机抽样分层随机抽样统计学第二章数据搜集2.2.32.2.3搜集数据的基本方法搜集数据的基本方法访问法访问法 面谈调查面谈调查 邮寄调查(自填式)邮寄调查(自填式)调查调查 座谈会座谈会 个别深度访谈个别深度访谈观察法观察法统计学第二章数据搜集面谈调查(personal interview)标准式访问通常按事先设计标准式访问通常按事先设计好的问卷进行好的问卷进行非标准式访问事先一般不制非标准式访问事先一般不制作问卷作问卷统计学第二章数据搜集面谈调查中的注意事项面谈调查中的注意事项 在调查中,调查者到在调查中,调查者到人地生疏的地方搜集资料,人地生疏的地方搜集资料,且被调查者往往又不愿意提供的这些资料,为顺且被调查者往往又不愿意提供的这些资料,为顺利完成调查访问工作,利完成调查访问工作,调查者调查者事前的准备工作非事前的准备工作非常重要。
事前的准备工作包括常重要事前的准备工作包括以下内容:以下内容:仪容仪表仪容仪表 携带访问工具携带访问工具 预约并先了解访问对象预约并先了解访问对象 熟记问题及方法熟记问题及方法运用各种技巧激发被调查者主动合作运用各种技巧激发被调查者主动合作注意自身的安全注意自身的安全统计学第二章数据搜集邮寄调查邮寄调查 (mail survey)(mail survey)也称邮寄问卷调查也称邮寄问卷调查,是一种标准化调查是一种标准化调查调查者与被调查者没有直接的语言交流,信息的传递调查者与被调查者没有直接的语言交流,信息的传递依赖于问卷依赖于问卷通过某种方式将调查表或问卷送至某调查者手中,由通过某种方式将调查表或问卷送至某调查者手中,由被调查者填写,然后将问卷寄回指定收集点被调查者填写,然后将问卷寄回指定收集点问卷或表格的发放方式有邮寄、宣传媒介传送、专门问卷或表格的发放方式有邮寄、宣传媒介传送、专门场所分发三种场所分发三种统计学第二章数据搜集调查调查 (telephone survey)(telephone survey)调查者利用与被调查者进行语言交流以获得信息时效快、成本低问题的数量不宜过多 统计学第二章数据搜集座谈会座谈会 (colloquia)(colloquia)1.1.也称集体访谈也称集体访谈2.2.将一组被调查者集中在调查现场,让他们对调查的将一组被调查者集中在调查现场,让他们对调查的主题发表意见以获得资料主题发表意见以获得资料3.3.参加座谈会的人数不宜过多,一般为参加座谈会的人数不宜过多,一般为6 61010人人4.4.侧重于定性研究侧重于定性研究统计学第二章数据搜集个别深度访问个别深度访问 (personal Interviewing)(personal Interviewing)一次只有一名受访者参加、针一次只有一名受访者参加、针对特殊问题的调查对特殊问题的调查适合于较隐秘的问题,如个人适合于较隐秘的问题,如个人隐私问题;或较敏感的问题,隐私问题;或较敏感的问题,如政治方面的问题如政治方面的问题侧重于定性研究侧重于定性研究统计学第二章数据搜集观察法观察法 (observational method)(observational method)1.1.就调查对象的行动和意识,就调查对象的行动和意识,调查人员边观察边记录以收调查人员边观察边记录以收集所需信息集所需信息2.2.特点:调查人员不是强行介特点:调查人员不是强行介入,能够在被调查者不察觉入,能够在被调查者不察觉的情况下获得资料的情况下获得资料统计学第二章数据搜集2.2.4 调查设计调查设计 调查方案的结构调查方案的结构 调查问卷设计调查问卷设计统计学第二章数据搜集调查方案的结构调查方案的结构(survey plan)(survey plan)调查方案的内容调查方案的内容统计学第二章数据搜集调查目的调查目的 (objective of survey)(objective of survey)1.1.调查要达到的具体目标调查要达到的具体目标回答回答“为什么调查?为什么调查?”2.2.调查之前必须明确调查之前必须明确例如,例如,2000 2000 年年11 11 月月1 1 日零时举行的全国第五次人口普查的日零时举行的全国第五次人口普查的调查方案中,明确规定这次调查的目的就在于:为了准确的调查方案中,明确规定这次调查的目的就在于:为了准确的查清第四次全国人口普查以来我国人口在数量、地区分布、查清第四次全国人口普查以来我国人口在数量、地区分布、结构和素质方面的变化,为科学的制定国民经济和社会发展结构和素质方面的变化,为科学的制定国民经济和社会发展战略规划,统筹安排人民的物质和文化生活,检查人口政策战略规划,统筹安排人民的物质和文化生活,检查人口政策执行情况,提供可靠的资料。
可见,在这一调查方案中,调执行情况,提供可靠的资料可见,在这一调查方案中,调查目的是具体和明确的查目的是具体和明确的统计学第二章数据搜集关于当前大学生的消费情况调查方案关于当前大学生的消费情况调查方案 调查目的部分:调查目的部分:了解当前大学生的消费情况,分析大学生消费的了解当前大学生的消费情况,分析大学生消费的现状,指出大学生高消费的误区,并提出建设性现状,指出大学生高消费的误区,并提出建设性的对策思考的对策思考在此基础上,在此基础上,提出相应的改进建议,为今后的大提出相应的改进建议,为今后的大学生消费提供一个可供参考的方案学生消费提供一个可供参考的方案形成大学生以艰苦奋斗为荣,骄奢淫逸为耻的消形成大学生以艰苦奋斗为荣,骄奢淫逸为耻的消费观,费观,创建节约型校园文化创建节约型校园文化引导他们在考虑个引导他们在考虑个人消费时不忘光荣传统,科学规划安排,人消费时不忘光荣传统,科学规划安排,使个人使个人消费标准与家庭情况相适应消费标准与家庭情况相适应教育学生要教育学生要树立勤树立勤俭节约、科学的消费意识俭节约、科学的消费意识为什么为什么社会经济意义和作用社会经济意义和作用解决什么问题解决什么问题统计学第二章数据搜集调查对象和调查单位调查对象和调查单位 (Respondent and Survey unit)(Respondent and Survey unit)调查对象:调查研究的总体或调查范围调查对象:调查研究的总体或调查范围调查单位:需要对之进行调查的单位。
可以是调查单位:需要对之进行调查的单位可以是调查对象的全部单位调查对象的全部单位(全面调查全面调查),也可以是调,也可以是调查对象中的一部分单位查对象中的一部分单位(非全面调查非全面调查)回答回答“向谁调查?向谁调查?”统计学第二章数据搜集举例 北京市大学生消费情况调查方案的调查对象和调查单位北京市大学生消费情况调查方案的调查对象和调查单位:学校类型,力求学校类型,力求涵盖综合性大学以及文、理科大学涵盖综合性大学以及文、理科大学,选取选取1111所高校所高校为:中央财经大学、北京外国语大学、北京为:中央财经大学、北京外国语大学、北京交通大学、北京民族大学、北京理工大学、人民大学、清交通大学、北京民族大学、北京理工大学、人民大学、清华大学、北京航空航天大学、北京师范大学、北京林业大华大学、北京航空航天大学、北京师范大学、北京林业大学、北京大学对于抽样方法有以下考虑:学、北京大学对于抽样方法有以下考虑:1 1、大一新生大一新生刚入学,刚入学,代表性较差代表性较差,因而只调查其他,因而只调查其他年级,抽样的年级人数比为年级,抽样的年级人数比为2 2:2 2:1 1;2 2、调查中尽量保证、调查中尽量保证男女比例男女比例为为1 1:1 1;3 3、进行、进行整群抽样整群抽样,即分别在大二和大三中随机抽取,即分别在大二和大三中随机抽取两个班,在大四中随机抽取一个班。
两个班,在大四中随机抽取一个班统计学第二章数据搜集调查项目调查项目 (Survey items)(Survey items)调查的具体内容调查的具体内容(研究课题的概念化、操作化、研究课题的概念化、操作化、指标化)指标化)通常表现为表格或问卷通常表现为表格或问卷回答回答“调查什么?调查什么?”统计学第二章数据搜集大学生消费情况调查大学生消费情况调查 生活方面生活方面校内饮食、校外饮食、服装、校内饮食、校外饮食、服装、日化用品及其他日化用品及其他 学习方面学习方面书籍、考试费、费书籍、考试费、费 休闲娱乐休闲娱乐旅游、网上冲浪、电影、音旅游、网上冲浪、电影、音乐、通讯乐、通讯统计学第二章数据搜集方案设计中的其他问题方案设计中的其他问题统计学第二章数据搜集调查问卷设计调查问卷设计提问项目的设计提问项目的设计回答项目回答项目(答案答案)的设计的设计问题顺序的设计问题顺序的设计什么是问卷什么是问卷统计学第二章数据搜集什么是问卷?什么是问卷?(questionnaires)(questionnaires)用来搜集调查数据的一种工具用来搜集调查数据的一种工具调查者根据调查目的和要求所设计的,由一系列调查者根据调查目的和要求所设计的,由一系列问题、备选答案、说明等组成的表格。
问题、备选答案、说明等组成的表格不同的调查问卷在具体结构、题型、措词、版式不同的调查问卷在具体结构、题型、措词、版式等设计上会有所不同,但在结构上一般都由开头等设计上会有所不同,但在结构上一般都由开头部分、甄别部分、主体部分和背景部分组成部分、甄别部分、主体部分和背景部分组成 统计学第二章数据搜集问卷的基本结构问卷的基本结构开头开头部分部分甄别甄别部分部分主体主体部分部分背景背景部分部分统计学第二章数据搜集开头部分开头部分(卷首语卷首语)统计学第二章数据搜集 问卷的结构 问卷的卷首语,即一封致被调查者的短信,由于它问卷的卷首语,即一封致被调查者的短信,由于它常常放在问卷的封面,故又称封面信常常放在问卷的封面,故又称封面信u 我是谁?我是谁?u 我们要调查什么?我们要调查什么?u 我们为什么进行这项调查?我们为什么进行这项调查?u 我们为什么找你作调查?我们为什么找你作调查?u 我们的调查有什么用?我们的调查有什么用?u 我们的调查不会有损于被调查者的利益我们的调查不会有损于被调查者的利益统计学第二章数据搜集填写要求:填写要求:请您在所选择答案的题号上画圈请您在所选择答案的题号上画圈 对只许选择一个答案的问题只能画一个圈;对对只许选择一个答案的问题只能画一个圈;对可选多个答案的问题,请在你认为合适的答案可选多个答案的问题,请在你认为合适的答案上画圈上画圈 需填写数字的题目在留出的横线上填写需填写数字的题目在留出的横线上填写 对于表格中选择答案的题目,在所选的栏目内对于表格中选择答案的题目,在所选的栏目内画勾画勾1.1.对注明要求您自己填写的内容,请在规定的地对注明要求您自己填写的内容,请在规定的地方填上您的意见方填上您的意见 开头部分开头部分(填写说明填写说明)统计学第二章数据搜集开头部分开头部分(问卷编号问卷编号)问卷编号是将问卷中的调查项目变成数字的工问卷编号是将问卷中的调查项目变成数字的工作过程,主要用于识别问卷、调查者、被调查作过程,主要用于识别问卷、调查者、被调查者姓名、地址等。
者姓名、地址等用于识别问卷便于校对检查、更正错误用于识别问卷便于校对检查、更正错误 也便于分类整理,易于计算机处理和统计分析也便于分类整理,易于计算机处理和统计分析 统计学第二章数据搜集甄别部分甄别部分甄别也称为过滤,它是先对被调查者进行过滤,甄别也称为过滤,它是先对被调查者进行过滤,筛选掉不需要的部分,然后针对特定的被调查者筛选掉不需要的部分,然后针对特定的被调查者进行调查进行调查通过甄别,可以筛选掉与调查事项有直接关系的通过甄别,可以筛选掉与调查事项有直接关系的人,以达到避嫌的目的人,以达到避嫌的目的可以确定哪些人是合格的被调查者,哪些人不是可以确定哪些人是合格的被调查者,哪些人不是甄别的目的是确保被调查者合格,能够作为该调甄别的目的是确保被调查者合格,能够作为该调查项目的代表,从而符合调查研究的需要查项目的代表,从而符合调查研究的需要 统计学第二章数据搜集甄别部分甄别部分S1请问您或您的家庭成员有没有在下列行业工作的呢?请问您或您的家庭成员有没有在下列行业工作的呢?1广告、公关机构 2市场研究、咨询、调查机构 3电视,广播,报纸等媒介机构 终止访问 4轿车制造 5轿车批发、零售 6以上皆无继续访问S2请问您的年龄是:请问您的年龄是:120岁以下终止访问 220岁30岁 330岁40岁 440岁50岁 550岁以上终止访问 统计学第二章数据搜集主体部分主体部分是调查问卷的核心内容是调查问卷的核心内容包括所要调查的全部问题,主要由问题和包括所要调查的全部问题,主要由问题和答案所组成答案所组成 统计学第二章数据搜集背景部分背景部分通常放在问卷的最后,主要是有关被调查通常放在问卷的最后,主要是有关被调查者的一些背景资料者的一些背景资料该部分所包含的各项问题,可使研究者根该部分所包含的各项问题,可使研究者根据背景资料对被调查者进行分类比较分析据背景资料对被调查者进行分类比较分析 什么工作?育程度?统计学第二章数据搜集背景部分背景部分 A请请 问问 您您 的的 教教 育育 程程 度?度?(901)没 受 过 正 式 教 育 1 小 学,初 中 2 高 中,职 高,中 专,技 校 3 大 专,大 学 或 以 上 4 B请请 问问 您您 的的 职职 业业 和和 职职 位位 是是 什什 么?么?(902)普 通 职 员,工 人1 部 门 经 理 负 责 人/高 级 管 理 人 员 2 公 司 老 板,厂 长,总 经 理 3 专 业 人 员 4 个 体 户,自 营 职 业 5 失 业,待 业 6 学 生7 离 退 休 人 员 8 其 他(请注明)9 统计学第二章数据搜集 提问项目的设计提问项目的设计提问的内容尽可能短 用词要确切、通俗可按6W准则加以推敲。
6W即Who(谁),Where(何处),When(何时),Why(为什么),What(什么事),How(如何)一项提问只包含一项内容 避免诱导性提问 避免否定形式的提问 避免敏感性问题 统计学第二章数据搜集用词要确切、通俗用词要确切、通俗统计学第二章数据搜集一项提问只包含一项内容一项提问只包含一项内容统计学第二章数据搜集避免诱导性提问避免诱导性提问统计学第二章数据搜集避免否定形式的提问避免否定形式的提问统计学第二章数据搜集回答项目(答案)的设计统计学第二章数据搜集回答的类型与方法回答的类型与方法开放性问题开放性问题(自由回答型自由回答型)封闭性问题封闭性问题(选择回答型选择回答型)两项选择法两项选择法多项选择法多项选择法顺序选择法顺序选择法评定尺度法评定尺度法限制选择型限制选择型多项选择型多项选择型单项选择型单项选择型统计学第二章数据搜集开放性问题开放性问题对问题的回答未提供任何具体的答案,由被调对问题的回答未提供任何具体的答案,由被调查者根据自己的想法自由作出回答查者根据自己的想法自由作出回答属于自由回答型属于自由回答型优点:比较灵活,适合于搜集更深层次的信息,优点:比较灵活,适合于搜集更深层次的信息,特别适合于那些尚未弄清各种可能答案或潜在特别适合于那些尚未弄清各种可能答案或潜在答案类型较多的问题。
而且可以使被调查者充答案类型较多的问题而且可以使被调查者充分表达自己的意见和想法,有利于被调查者发分表达自己的意见和想法,有利于被调查者发挥自己的创造挥自己的创造缺点:由于会出现各种各样的答案,给调查后缺点:由于会出现各种各样的答案,给调查后的资料整理带来一定困难的资料整理带来一定困难 统计学第二章数据搜集开放性问题开放性问题 您认为我国目前的广告宣传中,存在的您认为我国目前的广告宣传中,存在的 主要问题是什么?主要问题是什么?您对这种捷达新款车有何更具体的看法?您对这种捷达新款车有何更具体的看法?统计学第二章数据搜集封闭性问题封闭性问题对问题事先设计出了各种可能的答案,由被调查者从中对问题事先设计出了各种可能的答案,由被调查者从中选择选择优点:问题的答案是标准化的,有利于被调查者对问题优点:问题的答案是标准化的,有利于被调查者对问题的理解和回答,也有利于调查后的资料整理的理解和回答,也有利于调查后的资料整理缺点:对答案的要求较高,对一些比较复杂的问题,有缺点:对答案的要求较高,对一些比较复杂的问题,有时很难把答案设计周全时很难把答案设计周全设计时要注意:问题的答案是选择回答型,所以设计出设计时要注意:问题的答案是选择回答型,所以设计出的答案一定要穷尽和互斥的答案一定要穷尽和互斥回答方法有:两项选择法、多项选择法、顺序选择法、回答方法有:两项选择法、多项选择法、顺序选择法、评定尺度法等评定尺度法等 统计学第二章数据搜集封闭性问题封闭性问题(两项选择法两项选择法)答案只有两项,要求被调查者选择其中之一答案只有两项,要求被调查者选择其中之一来回答来回答优点:被调查者只需在二者之中选择一项,优点:被调查者只需在二者之中选择一项,回答比较容易;调查后的数据处理也很方便回答比较容易;调查后的数据处理也很方便缺点:得到的信息量较少;当被调查者对两缺点:得到的信息量较少;当被调查者对两项答案均不满意时,很难作出回答项答案均不满意时,很难作出回答 统计学第二章数据搜集封闭性问题封闭性问题(多项选择法多项选择法)在设计问卷时,对一个问题给出三个或三个以上在设计问卷时,对一个问题给出三个或三个以上的答案,让被调查者从中选择进行回答的答案,让被调查者从中选择进行回答根据要求选择的答案多少不同,有以下类型根据要求选择的答案多少不同,有以下类型 单项选择型:要求被调查者对所给出的问题答案选择单项选择型:要求被调查者对所给出的问题答案选择其中的一项其中的一项 多项选择型:要求被调查者对所给出的问题答案中,多项选择型:要求被调查者对所给出的问题答案中,选出自己认为合适的答案,数量不受限制选出自己认为合适的答案,数量不受限制 限制选择型:要求被调查者在所给出的问题答案中,限制选择型:要求被调查者在所给出的问题答案中,选出自己认为合适的答案,但数量要受一定限制选出自己认为合适的答案,但数量要受一定限制 统计学第二章数据搜集封闭性问题封闭性问题(单项选择法实例单项选择法实例)单项选择型单项选择型 您觉得哪种类型的广告宣传效果最好?您觉得哪种类型的广告宣传效果最好?(选一项选一项)1电视广告电视广告 2广播广告广播广告 3杂志广告杂志广告 4报纸广告报纸广告 5路牌广告路牌广告 统计学第二章数据搜集封闭性问题封闭性问题(多项选择法实例多项选择法实例)多项选择型多项选择型 请问您在购买小轿车时,主要考虑哪些因素?请问您在购买小轿车时,主要考虑哪些因素?(选出您认为合适的答案选出您认为合适的答案)1价格价格 6维修费用维修费用 2款式款式 7乘坐舒适乘坐舒适 3品牌品牌 8行使平稳行使平稳 4耗油量耗油量 9加速性能加速性能 5售后服务售后服务 10制动性能制动性能 统计学第二章数据搜集封闭性问题封闭性问题(顺序选择法顺序选择法)问题答案有多个,要求被调查者在回答时,对所选的答问题答案有多个,要求被调查者在回答时,对所选的答案按要求的顺序或重要程度加以排列。
其中,对所选的案按要求的顺序或重要程度加以排列其中,对所选的的答案数量可以进行一定的限制,也可以不进行限制的答案数量可以进行一定的限制,也可以不进行限制问题答案不仅可以反映所要调查的内容,而且可以反映问题答案不仅可以反映所要调查的内容,而且可以反映出被调查者对问题的看法,从而增加了信息量出被调查者对问题的看法,从而增加了信息量 您在购买这种牌子的电视机时,主要是考虑哪些因素?您在购买这种牌子的电视机时,主要是考虑哪些因素?1产品的品牌产品的品牌 2价格合理价格合理 3售后服务售后服务 4外形美观外形美观 5维修方便维修方便 (按重要程度进行排序)(按重要程度进行排序)统计学第二章数据搜集封闭性问题封闭性问题(评定尺度法评定尺度法)问题答案,由表示不同等级的形容词组成,并按照一定的程度排序,由被调查者依次选择 您对这种新款轿车是否感到满意?1非常满意;2比较满意;3一般 4不太满意;5不满意统计学第二章数据搜集问题顺序的设计问题顺序的设计问题的安排应具有逻辑性问题的安排应具有逻辑性问题的顺序应先易后难问题的顺序应先易后难能引起被调查者兴趣的问题放在前面能引起被调查者兴趣的问题放在前面开放性问题放在后面开放性问题放在后面版面格式的设计版面格式的设计问卷的结构安排要合理,问卷的主体部分要突出、问卷的结构安排要合理,问卷的主体部分要突出、醒目醒目不要编排过密,各问题之间要留出一定的空间不要编排过密,各问题之间要留出一定的空间外表及内容的印刷要美观外表及内容的印刷要美观统计学第二章数据搜集2.3 实验数据实验数据是指在实验中控制实验对象而搜集到实验数据是指在实验中控制实验对象而搜集到的变量的数据。
的变量的数据统计学第二章数据搜集实验组是随即抽选的实验对象的子集在这个实验组是随即抽选的实验对象的子集在这个子集中,每个单位接受某种特别的处理子集中,每个单位接受某种特别的处理对照组中每个单位不接受实验组成员所接受的对照组中每个单位不接受实验组成员所接受的某种特别的处理某种特别的处理为什么需要对照组?为什么需要对照组?统计学第二章数据搜集统计学第二章数据搜集统计学第二章数据搜集注意:注意:p 实验组合对照组的产生应遵循随机原则,即实验组合对照组的产生应遵循随机原则,即将实验单位随机地分配到实验组和对照组将实验单位随机地分配到实验组和对照组p 实验组和对照组应该是匹配的实验组和对照组应该是匹配的匹配是指对实验单位的背景材料进行分析比匹配是指对实验单位的背景材料进行分析比较,将情况类似的每对单位分别随机地分配较,将情况类似的每对单位分别随机地分配到实验组和对照组到实验组和对照组统计学第二章数据搜集 人的意愿人的意愿 如果实验对象为人,人们都有自己的生活方式和处事原则,都有如果实验对象为人,人们都有自己的生活方式和处事原则,都有自己的爱好和兴趣,他们未必会按照研究者的要求和布置行事自己的爱好和兴趣,他们未必会按照研究者的要求和布置行事。
心理问题心理问题 在实验中人们对被研究非常敏感,这使得他们更加注意自我,从在实验中人们对被研究非常敏感,这使得他们更加注意自我,从而走到事物的另一个极端而走到事物的另一个极端道德问题道德问题统计学第二章数据搜集统计学第二章数据搜集统计学第二章数据搜集2.4 2.4 数据误差数据误差数据误差是指通过调查搜集到的数据与研究对数据误差是指通过调查搜集到的数据与研究对象真实结果之间的差异象真实结果之间的差异数据的误差有两类:数据的误差有两类:抽样误差抽样误差 非抽样误差非抽样误差研究调查误差的主要目的是找出导致误差产生的原研究调查误差的主要目的是找出导致误差产生的原因,进而采取对策避免、减少误差或控制误差水平因,进而采取对策避免、减少误差或控制误差水平统计学第二章数据搜集 抽样误差抽样误差如果总体是一锅八宝粥,随机样本是充分如果总体是一锅八宝粥,随机样本是充分搅拌后的八宝粥中的任意一勺搅拌后的八宝粥中的任意一勺 该勺中的八宝粥的成分比例应该和整个一该勺中的八宝粥的成分比例应该和整个一锅粥类似锅粥类似 搅拌越充分,样本的代表性也越好搅拌越充分,样本的代表性也越好统计学第二章数据搜集 一勺八宝粥中的成分比例和整锅不尽相一勺八宝粥中的成分比例和整锅不尽相同,可能稍微多些或稍微少些。
这是很正同,可能稍微多些或稍微少些这是很正常的,因为样本的特征不一定和总体完全常的,因为样本的特征不一定和总体完全一样这种差异不是错误,而是必然会出现的抽这种差异不是错误,而是必然会出现的抽样误差(样误差(sampling errorsampling error)统计学第二章数据搜集抽样误差抽样误差(sampling error)(sampling error)由于抽样的随机性所带来的误差由于抽样的随机性所带来的误差 所有样本可能的结果与总体真值之间的平所有样本可能的结果与总体真值之间的平均性差异均性差异 影响抽样误差的大小的因素影响抽样误差的大小的因素 样本量的大小样本量的大小 总体的变异性总体的变异性统计学第二章数据搜集非抽样误差(non-sampling error)相对抽样误差而言相对抽样误差而言除抽样误差之外的,由于其他原因造成的除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异样本观察结果与总体真值之间的差异存在于所有的调查之中存在于所有的调查之中概率抽样,非概率抽样,全面性调查概率抽样,非概率抽样,全面性调查有抽样框误差、回答误差、无回答误差、有抽样框误差、回答误差、无回答误差、调查员误差、测量误差调查员误差、测量误差有关总体全部单位的有关总体全部单位的名录。
名录统计学第二章数据搜集误差的控制误差的控制抽样误差可计算和控制抽样误差可计算和控制非抽样误差的控制非抽样误差的控制调查员的挑选调查员的挑选调查员的培训调查员的培训督导员的调查专业水平督导员的调查专业水平调查过程控制调查过程控制调查结果进行检验、评估调查结果进行检验、评估现场调查人员进行奖惩的制度现场调查人员进行奖惩的制度统计学第二章数据搜集本章小结数据来源数据来源调查数据调查数据实验数据实验数据数据误差数据误差。