标准文案SPSS 分析调查问卷数据的方法SPSS 分析调查问卷数据的方法当我们的调查问卷在把调查数据拿回来后,我们该做的工作 就是用相关的统计软件进展处理,在此,我们以 spss 为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过程:定义变量﹑数据录入﹑统计分析和结果保存. 下面将从这四个方面来对问卷的处理做具体的介绍.Spss 处理:第一步:定义变量大多数状况下我们需要从头定义变量,在翻开 SPSS 后,我们可以看到和 excel 相像的界面,在界面的左下方可以看到Data View, Variable View 两个标签,只需单击左下方的Variable View 标签就可以切换到变量定义界面开头定义变量在表格上方可以看到一个变量要设置如下几项:name(变量名)、type(变量类型)、width(变量值的宽度)、decimals(小数位) 、label(变量标签) 、Values(定义具体变量值的标签)、Missing(定义变量缺失值)、Colomns(定义显示列宽)、Align(定义显示对齐方式)、Measure(定义变量类型是连续、有序分类还是无序分类).我们知道在spss 中,我们可以把一份问卷上面的每一个问题设为一个变量,这样一份问卷有多少个问题就要有多少个变大全量与之对应,每一个问题的答案即为变量的取值.现在我们 以问卷第一个问题为例来说明变量的设置.为了便于说明, 可假设此题为:1.请问你的年龄属于下面哪一个年龄段( )?A:20—29 B:30—39 C:40—49 D:50--59那么我们的变量设置可如下: name 即变量名为 1,type 即类型可依据答案的类型设置,答案我们可以用 1、2、3、4 来代替 A、B、C、D,所以我们选择数字型的,即选择 Numeric, width 宽度为 4,decimals 即小数位数位为 0〔由于答案没有小数点〕,label 即变量标签为“年龄段查询”。
Values 用于定义具体变量值的标签,单击 Value 框右半部的省略号,会弹出变量值标签对话框,在第一个文本框里输入 1,其次个输入 20—29,然后单击添加即可.同样道理我们可做如下设置,即1=20—29、2=30—39、3=40—49、4=50--59;Missing,用于定义变量缺失值, 单击 missing 框右侧的省略号,会弹出缺失值对话框, 界面上有一列三个单项选择钮,默认值为最上方的“无缺失值”;其次项为“不连续缺失值”,最多可以定义 3 个值;最终一项为“缺失值范围加可选的一个缺失值”,在此我们不设置缺省值,所以选中第一项如图;Colomns,定义显示列宽,可自己依据实际状况设置;Align,定义显示对齐 方式,有居左、居右、居中三种方式;Measure,定义变量类型是连续、有序分类还是无序分类以上为问卷中常见的单项选择题型的变量设置,下面将对一 些特别状况的变量设置也作一下说明.1. 开放式题型的设置:诸如你所在的省份是 这样的填空题即为开放题,设置这些变量的时候只需要将 Value 、Missing 两项不设置即可.2. 多项选择题的变量设置:这类题型的设置有两种方法即多重二分法和多重分类法,在这里我们只对多重二分法进展介绍. 这种方法的根本思想是把该题每一个选项设置成一个变量, 然后将每一个选项拆分为两个选项项,即选中该项和不选中该项.现在举例来说明在 spss 中的具体操作.比方如下一例: 请问您通常猎取闻的方式有哪些( )1 报纸 2 杂志 3 电视 4 收音机 5 网络在spss 中设置变量时可为此题设置五个变量,假设此题为问卷第三题,那么变量名分别为 3_1、3_2、3_3、3_4、3_5,然后每一个选项有两个选项选中和不选中,只需在 Value 一项中为每一个变量设置成 1=选中此项、0=不选中此项即可. 使用该窗口,我们可以把一个问卷中的全部问题作为变量在 这个窗口中一次定义。
到此,我们的定义变量的工作就根本上可以完毕了.下面我们要作就是数据的录入了.首先,我们要回到数据录入窗口, 这很简洁,只要我们点击软件左下方的 Data View 标签就可以了.其次步:数据录入Spss 数据录入有很多方式,大致有一下几种: 1.读取 SPSS 格式的数据2. 读取 Excel 等格式的数据3. 读取文本数据〔Fixed 和Delimiter) 4.读取数据库格式数据(分如下两步)〔1〕配置ODBC 〔2〕在SPSS 中通过 ODBC 和数据库进展但是对于问卷的数据录入其实很简洁,只要在spss 的数据录入窗口中直接输入就可以了,只是在这里有几点留意的事项需要说明一下.1. 在数据录入窗口,我们可以看到有一个表格,这个表格中 的每一行代表一份问卷,我们也称为一个个案.2. 在数据录入窗口中,我们可以看到表格上方消灭了 1、2、3、4、5…….的标签名,这其实是我们在第一步定义变量中, 我们为问卷的每一个问题取的变量名,即 1 代表第一题,2 代表其次题.以次类推.我们只需要在变量名下面输入对应问 题的答案即可完成问卷的数据录入.比方上述年龄段查询的例题,假设问卷上勾选了 A 答案,我们在 1 下面输入 1 就行了 (不要遗忘我们通常是用 1、2、3、4 来代替 A、B、C、D 的). 3.我们知道一行代表一份问卷,所以有几分问卷,就要有几 行的数据.在数据录入完成后,我们要做的就是我们的关键局部,即问卷的统计分析了,由于这时我们已经把问卷中的数据录入我 们的软件中了.第三步:统计分析有了数据,可以利用 SPSS 的各种分析方法进展分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正 确分析结果的关键。
这要依据我们的问卷调查的目的和我们 想要什么样的结果来选择.SPSS 有数值分析和作图分析两类方法.1. 作图分析:在 SPSS 中,除了生存分析所用的生存曲线图被整合到Analyze 菜单中外,其他的统计绘图功能均放置在 graph 菜单中该菜单具体分为以下几局部:: (1)Gallery:相当于一个自学向导,将统计绘图功能做了简 单的介绍,初学者可以通过它对 SPSS 的绘图力量有一个大致的了解2)Interactive:交互式统计图3)Map:统计地图4)下方的其他菜单项是我们最为常用的一般统计图,具体 来说有:条图 散点图线图 直方图饼图 面积图箱式图正态 Q-Q 图正态 P-P 图质量掌握图Pareto 图自回归曲线图凹凸图交相互关图序列图频谱图 误差线图作图分析简洁易懂,一目了然,我们可依据需要来选择我们需要作的图形,一般来讲,我们较常用的有条图,直方图,正态图,散点图,饼图等等,具体操作很简洁,大家可参阅相关书籍,作图分析更多状况下是和数值分析相结合来对试卷进 行分析的,这样的效果更好.2. 数值分析:SPSS 数值统计分析过程均在 Analyze 菜单中,包括:(1) 、Reports 和Descriptive Statistics:又称为根本统 计分析.根本统计分析是进展其他更深入的统计分析的前提, 通过根本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进展争论。
Reports 和 Descriptive Statistics 命令项中包括的功能是对单变量的描述统计分析Descriptive Statistics 包括的统计功能有: Frequencies(频数分析):作用:了解变量的取值分布状况Descriptives(描述统计量分析):功能:了解数据的根本统 计特征和对指定的变量值进展标准化处理Explore(探究分析):功能:考察数据的奇异性和分布特征Crosstabs(穿插分析):功能:分析事物〔变量〕之间的相互 影响和关系Reports 包括的统计功能有:OLAP Cubes(OLAP 报告摘要表):功能: 以分组变量为根底, 计算各组的总计、均值和其他统计量而输出的报告摘要则是指每个组中所包含的各种变量的统计信息Case Summaries(观测量列表):观察或打印所需要的变量值Report Summaries in Row:行形式输出报告Report Summaries in Columns:列形式输出报告(2) 、Compare Means(均值比较与检验):能否用样本均值估量总体均值?两个变量均值接近的样本是否来自均值一样的总体?换句话说,两组样本某变量均值不同,其差异是否 具有统计意义?能否说明总体差异?这是各种争论工作中常常提出的问题。
这就要进展均值比较以下是进展均值比较及检验的过程:MEANS 过程:不同水平下〔不同组〕的描述统计量,如男女的平均工资,各工种的平均工资目的在于比较术语:水平数〔指分类变量的值数,如 sex 变量有 2 个值,称为有两个水平〕、单元Cell〔指因变量按分类变量值所分的组〕、水 平组合T test 过程:对样本进展 T 检验的过程单一样本的 T 检验:检验单个变量的均值是否与给定的常数之间存在差异独立样本的 T 检验:检验两组不相关的样本是否来自具有一样均值的总体〔均值是否一样,如男女的平均收入是否一样, 是否有显著性差异〕配对 T 检验:检验两组相关的样本是否来自具有一样均值的总体(前后比较,如训练效果,治疗效果)one-Way ANOVA:一元(单因素)方差分析,用于检验几个〔三个或三个以上〕独立的组,是否来自均值一样的总体3) 、ANOVA Models(方差分析):方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法例如:医学界争论几种药物对某种疾病的疗效;农业争论土壤、肥料、日照时间等因素对某种农作物产量的影响;不同饲料对牲畜体 重增长的效果等,都可以使用方差分析方法去解决(4) 、Correlate(相关分析):它是争论变量间亲热程度的一 种常用统计方法,常用的相关分析有以下几种:1、线性相关分析:争论两个变量间线性关系的程度。
用相 关系数 r 来描述2、偏相关分析:它描述的是当掌握了一个或几个另外的变量的影响条件下两个变量间的相关性,如掌握年龄和工作经 验的影响,估量工资收入与受教育水平之间的相关关系3、相像性测度:两个或假设干个变量、两个或两组观测量之 间的关系有时也可以用相像性或不相像性来描述相像性测度用大值表示很相像,而不相像性用距离或不相像性来描述, 大值表示相差甚远(5) 、Regression(回归分析):功能:寻求有关联〔相关〕的 变量之间的关系在回归过程中包括:Liner:线性回归;Curve Estimation:曲线估量;Binary Logistic:二分变量规律回归;Multinomial Logistic:多分变量规律回归;Ordinal 序回归;Probit:概率单位回归;Nonlinear:非线性回归;Weight Estimation:加权估量;2-Stage Least squares: 二段最小平方法;Optimal Scaling 最优编码回归;其中最常用的为前面三个.(6) 、Nonparametric Tests(非参数检验):是指在总体不服从正态分布且分布状况不明时,用来检验数据资料是否来自 同一个总体假设的一类检验方法。
由于这些方法一般不涉及 总体参数故得名非参数检验的过程有以下几个:1.Chi-Square test 卡方检验2.Binomial test 二项分布检验3.Runs test 游程检验4.1-Sample Kolmogorov-Smirnov test 一个样本柯尔莫哥洛夫-斯米诺夫检验5.2 independent Samples Test 两个独立样本检验6.K independent Samples Test K 个独立样本检验7.2 related Samples Test 两个相关样本检验8.K related Samples Test 两个相关样本检验(7) 、Data Reduction(因子分析) (8)、Classify(聚类与判别)等等以上就是数值统计分析 Analyze 菜单下几项用于分析的数值统计分析方法的简介,在我们的变量定义以及数据录入完成后,我们就可以依据我们的需要在以上几种分析方法中选择假设干种对我们的问卷数据进展统计分析,来得到我们想要的结果.第四步:结果保存我们的spss 软件会把我们统计分析的多有结果保存在一个窗口中即结果输出窗口(output),由于spss 软件支持复制和粘贴功能,这样我们就可以把我们想要的结果复制﹑粘贴到我们的报告中,固然我们也可以在菜单中执行file->save 来保存我们的结果,一般状况下,我们建议保存我们的数据,结果可不保存.由于只要有了数据,假设我们想要结果的,我们可以随时利用数据得到结果.总结:以上便是 spss 处理问卷的四个步骤,四个步骤完毕后,我们需要spss 软件做的工作根本上也就完毕了,接下来的任务就是写我们的统计报告了.值得一提的是.spss 是一款在社会统计学应用格外广泛的统计类软件,学好它将对我们以后的工作学习产生很大的意义和作用.SPSS 的问卷分析中一份问卷是一个案,首先要依据问卷问题的不同定义变量。
定义变量值得留意的两点:一区分变量的 度量,Measure 的值,其中 Scale 是定量、Ordinal 是定序、Nominal 是指定类;二 留意定义不同的数据类型 Type各色各样的问卷题目的类型大致可以分为单项选择、多项选择、排序、 开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们具体举例介绍如下:1 单项选择题:答案只能有一个选项例一 当前贵组织机构是否设有面对组织的职业生涯规划系统?A 有 B 正在开创 C 没有 D 曾经有过但已中断编码:只定义一个变量, Value 值 1、2、3、4 分别代表 A、B、C、D 四个选项录入:录入选项对应值,如选 C 则录入 32 多项选择题:答案可以有多个选项,其中又有项数不定多项选择和 项数定多项选择1) 方法一〔二分法〕:例二 贵处的职业生涯规划系统工作涵盖哪些组群?画钩时请把全部提示考虑在内A 月薪员工 B 日薪员工 C 钟点工编码:把每一个相应选项定义为一个变量,每一个变量 Value值均如下定义:“0” 未选,“1” 选录入:被调查者选了的选项录入 1、没选录入 0,如选择被调查者选 AC,则三个变量分别录入为 1、0、1。
2) 方法二:例三 你认为开展保持党员先进性教育活动的最重要的目标是那三项:1〔 〕 2 〔 〕 3〔 〕A、提高党员素养B、加强基层组织C、坚持发扬民主D、激发创业热忱E、效劳人民群众F、促进各项工作编码:定义三个变量分别代表题目中的 1、2、3 三个括号,三个变量 Value 值均同样的以对应的选项定义,即:“1” A, “2” B,“3” C,“4” D,“5” E,“6” F录入:录入的数值 1、2、3、4、5、6 分别代表选项 ABCDEF, 相应录入到每个括号对应的变量下如被调查者三个括号分 别选 ACF,则在三个变量下分别录入 1、3、6注:能用方法二编码的多项选择题也能用方法编码,但是项数不 定的多项选择只能用二分法,即方法一是多项选择题一般处理方法3 排序题: 对选项重要性进展排序例四 您购置商品时在 ①品牌 ②流行 ③质量 ④有用 ⑤ 价格 中对它们的关注程度先后挨次是〔请填代号重排列〕 第一位 其次位 第三位 第四位 第五位编码:定义五个变量,分别可以代表第一位 第五位,每个变量的 Value 都做如下定义:“1” 品牌,“2” 流行,“3”质量,“4” 有用,“5” 价格录入:录入的数字 1、2、3、4、5 分别代表五个选项,如被调查者把质量排在第一位则在代表第一位的变量下输入“3 “。
4 选择排序题:例五 把例三中的问题改为“你认为开展保持党员先进性教育活动的最重的目标是那三项,并按重要性从高到低排序”,选项不变编码:以ABCDEF6 个选项分别对应定义 6 个变量,每个变量的 Value 都做同样的如下定义:“1” 未选,“2” 排第一, “3” 排其次,“4” 排第三录入:以变量的Value 值录入比方三个括号里分别选的是ECF,则该题的 6 个变量的值应当分别录入:1〔代表 A 选项未选〕、1、 3〔代表 C 选项排在其次〕、1、2、4注:该方法是对多项选择题和排序题的方法结合的一种方法,对 一般排序题〔例四〕也同样适用,只是两者用的分析方法不 同〔例四用频数分析、例五用描述分析〕,输出结果从不同的侧面反映问题的重要性〔前一种方法从位次从变量的频数 看排序,后一种方法从变量动身看排序〕5 开放性数值题和量表题:这类题目要求被调查者自己填入 数值,或者打分例六 你的年龄〔实岁〕: 编码:一个变量,不定义 Value 值录入:即录入被调查者实际填入的数值6 开放性文字题:假设可能的话可以依据含义相像的答案进展编码,转换成为 封闭式选项进展分析假设答案内容较为丰富、不简洁归类 的,应对这类问题直接做定性分析。
三 问卷一般性分析下面具体介绍 SPSS 中问卷的一般处理方法,操作以版本spss13.0 为例,以下提到的菜单项均在 Analyze 主菜单下1 频数分析:Frequencies 过程可以做单变量的频数分布表;显示数据文件中由用户指定的变量的特定值发生的频数;获 得某些描述统计量和描述数值范围的统计量适用范围:单项选择题〔例一〕,排序题〔例四〕,多项选择题的方法二〔例三〕频数分析也是问卷分析中最常用的方法实现: Descriptive statistics……Frequencies2 描述分析:Descriptives:过程可以计算单变量的描述统计量这些述统计量有平均值、算术和、标准差,最大值、 最小值、方差、范围和平均数标准误等适用范围:选择并排序题〔例五〕、开放性数值题〔例六〕 实现: Descriptive statistics……Descriptives,需要的统计量点击按钮 Statistics…中选择3 多重反响下的频次分析:适用范围:多项选择题的二分法〔例二〕实现:第一步在 Multiple Response……Define Sets 把一道多项选择问题中定义了的全部变量集合在一起,给的集合变 量取名,在 Dichotomies Counted value 中输入 1。
其次步在 Multiple Response……Frequencies 中做频数分析4 穿插频数分析:解决对多变量的各水平组合的频数分析的 问题适用范围:,适用于由两个或两个以上变量进展穿插分类形成的列联表,对变量之间的关联性进展分析比方要知道不 同工作性质的人上班使用交通工具的状况,可以通过穿插分 析得到一个二维频数表则一目了然实现:第一步依据分析的目的来确定穿插分析的选项,确定 掌握变量和解释变量〔如上例中不同工作性质的人是掌握变 量,使用交通工具是解释变量〕其次步选择 Descriptive statistics……Crosstabs 四 简洁图形描述介绍在做上述频数分析、描述分析等分析时就可以直接做出图形, 简洁便利,同时也可以另外作图SPSS 的作图功能在菜单Graphs 下,功能强大,图形清楚美丽现在把常用图简洁介绍如下1 饼图:又称圆图,是以圆的面积代表被争论对象的总体, 按各构成局部占总体比重的大小把圆面积分割成假设干扇形, 用以表示现象的局部对总体的比例关系的统计图频数分析 的结果宜用饼图表示2 曲线图:是用线段的升降来说明数据变动状况的一种统计图它主要表示现象在时间上的变化趋势、现象的安排状况 和 2 个现象的依存关系等。
3 面积图:用线段下的阴影面积来强调现象变化的统计图4 条形图:利用一样宽度条形的长短或凹凸表现统计数据大 小及变化的统计图五 问卷深入分析除了以上简洁的分析,spss 强大的功能还可以对问卷进展深入分析,比方常用的有聚类分析、穿插分析、因子分析、均 值比分析〔参数检验〕、相关分析、回归分析等由于涉及到很专业的统计学问,下面只将个人觉得比较有用的方法的 适用范围和分析目的简洁做介绍:1 聚类分析样本聚类,可以将被调查者分类,并依据这些属性计算各类 的比例,以便明确争论所关心的群体比方按消费特征对被 调查者的进展聚类2 相关分析相关分析是针对两变量或者多变量之间是否存在相关关系的分析方法,要依据变量不同特征选择不同的相关性的度量 方式问卷分析中的多数用的变量都属于分类变量,要承受 斯皮尔曼相关系数其中可以用卡方检验,其是对两变量之间是否具有显著性影 响的分析方法3 均值的比较与检验〔1〕Means 过程:对指定变量综合描述分析,分组计算计算均值再比较比方可以按性别变量分为男和女来争论二者收入是否存在差距〔2〕T 检验:独立样本t 检验用于不相关的样本是否开来自具有一样均值的总体的检验比方,争论购置该产品的顾客和不购置的顾客的收入是否有明显差异。
假设样本不独立则要用配对 t 检验比方争论参与职业培训后 工作效率是否提高4 回归分析问卷分析中的回归分析常承受的是用离散回归模型,一般是规律斯蒂模型,解释一个变量对另一变量的影响具体有多大 比方,争论对某商品的消费受收入的影响程度。