一个简单实用的数据管理软件一个简单实用的数据管理软件提要提要EPI Data 概述1生成数据文件2编写核对程序3数据录入4数据双录入核对5数据转出6EPI Data 概述EPI Data 在数据管理方面的最大优点 规则简单规则简单 数据文件生成与录入界面设计方便数据文件生成与录入界面设计方便 具备双份比较功能具备双份比较功能 具有多种常用数据库的输出接口具有多种常用数据库的输出接口 FreeFree医学统计工作的基本步骤研究设计收集资料整理资料分析资料数据录入数据核查数据管理EPI Data统计描述统计推断SAS SPSSStata等等统计分析EPI Data的三种基本的文件类型.QES QES 文件:数据库结构文件,决定数据库结构文件:数据库结构文件,决定数据库结构REC REC 文件:数据文件,主要用于存放数据文件:数据文件,主要用于存放数据CHKCHK文件:核对文件,存放控制数据录入的核对规则,文件:核对文件,存放控制数据录入的核对规则,起质量控制作用起质量控制作用EPI DataEPI Data数据库创建过程数据库创建过程1.1.数据库建立数据库建立 根据调查表制作数据库结构文件(根据调查表制作数据库结构文件(.qes qes)2.2.生成数据文件生成数据文件 根据数据库结构文件生成数据文件(根据数据库结构文件生成数据文件(.recrec)3.3.编写核对程序编写核对程序 即生成数据核对文件(即生成数据核对文件(.chkchk)(可跳过)可跳过)4.4.数据录入数据录入菜单菜单1.数据库建立(建立调查表)在下图所示的在下图所示的“1.“1.数据库建立数据库建立”按钮上点击,并选择按钮上点击,并选择“新新建建.QES.QES文件文件”,或者直接点击,或者直接点击 ,则可以开始创建数据库,则可以开始创建数据库结构,其界面如下图结构,其界面如下图输入调查表内容 在在EpiData EpiData 中,不同的数据类型应该选择相应的字段类型:中,不同的数据类型应该选择相应的字段类型:调查表中的日期在数据库中应该使用日期型字段;调查表中的日期在数据库中应该使用日期型字段;姓名、地址、主诉等需要输入文字的问题则需要设置为文姓名、地址、主诉等需要输入文字的问题则需要设置为文本型字段;本型字段;身高、体重、血压这样需要输入数字的问题要设置为数值身高、体重、血压这样需要输入数字的问题要设置为数值型字段,同时这也是为了满足数据分析阶段的需要,比如型字段,同时这也是为了满足数据分析阶段的需要,比如对数值型字段我们往往需要进行计算均数、标准差等等运对数值型字段我们往往需要进行计算均数、标准差等等运算,所以必须将这类问题设置为数值型字段。
算,所以必须将这类问题设置为数值型字段EpiData 中常用的字段类型(1)数值型字段数值型字段#.#.#数值型变量中只能用来接受从数值型变量中只能用来接受从0 0到到9 9的数字,数值可以是的数字,数值可以是整数也可以是小数一个整数也可以是小数一个#号代表一位数,用户可以根据号代表一位数,用户可以根据需要定义所需的数值位数,但包括小数点在内最大为需要定义所需的数值位数,但包括小数点在内最大为1414位在数据录入过程中和在数据录入过程中和.QESQES文件中小数点文件中小数点“.”“.”和逗号和逗号“,”都可以作为分隔符但是在一个字段中只能有一个都可以作为分隔符但是在一个字段中只能有一个分隔符,也就是说逗号不能作为分位数分隔符,也就是说逗号不能作为分位数字符型字段字符型字段 _ _ _ _ 下画线定义字符型变量的位数字符型变量内可以输入任下画线定义字符型变量的位数字符型变量内可以输入任何字符该类型变量的最大长度为何字符该类型变量的最大长度为8080个字符一个中文占个字符一个中文占两个字符两个字符EpiData 中常用的字段类型(2)是否型字段是否型字段 Y 是否变量内只可以存放是否变量内只可以存放Y,N,1,0 Y,N,1,0 和空格。
是否型变量的长度仅为和空格是否型变量的长度仅为1 1位当输入当输入 1 1 时计算机自动将其转换为时计算机自动将其转换为 YY同样,当录入同样,当录入00时则自动时则自动转换成转换成 NN日期型字段日期型字段 dd/mm/yyyy 在数据录入过程中,能录入的字符为数字和斜线在数据录入过程中,能录入的字符为数字和斜线(/)(/)如果所有日月年数值都录入的话则不必录入斜线比如如果所有日月年数值都录入的话则不必录入斜线比如20072007年年1010月月2323日日可以在数据录入时直接键入可以在数据录入时直接键入2310200723102007在光标移入下一个字段后,字在光标移入下一个字段后,字段内的值自动变为标准的段内的值自动变为标准的04/05/199904/05/1999如果录入的两位数的年份在如果录入的两位数的年份在5050到到9999之间的话,则被默认为之间的话,则被默认为2020世纪,前世纪,前面加面加“19”“19”如果年份值在如果年份值在0000和和4949之间的话则被默认为之间的话则被默认为2121世纪,前面世纪,前面加加“20”“20”如果只录入如果只录入04050405的话,则计算机系统年份自动加入到字段的话,则计算机系统年份自动加入到字段中。
中在录入完成后计算机会对录入的日期进行核对,以保证录入的日期值在录入完成后计算机会对录入的日期进行核对,以保证录入的日期值是合法的日期值在是合法的日期值在EpiDataEpiData中只认四位数年份中只认四位数年份字段输入直接输入:注意须在英文状态下输入,如右直接输入:注意须在英文状态下输入,如右图直接输入:图直接输入:菜单栏输入:按右方按菜单栏输入:按右方按钮根据需要在该窗口中钮根据需要在该窗口中选择相应的字段类型,比选择相应的字段类型,比如数值型,并根据实际情如数值型,并根据实际情况设置小数点位数,设置况设置小数点位数,设置完成后点击按钮完成后点击按钮补充1:字体设置 使用中文使用中文pipiataata时,建议用户对使用的字体进行设置时,建议用户对使用的字体进行设置在主界面上点击在主界面上点击“文件文件”按钮后选按钮后选“选项选项”如下图 择择“选项选项”面板上,分别选择面板上,分别选择“编辑窗口编辑窗口”、“显示数据显示数据表表”和和“有关资料有关资料”三个选项卡,再将字体设置为中文字三个选项卡,再将字体设置为中文字体,这时建议用户将这三个窗口中的字体设置为一致体,这时建议用户将这三个窗口中的字体设置为一致。
补充2:定义变量名格式:变量标格式:变量标 变量名变量名 变量编码变量编码方法:直接输入:如右图方法:直接输入:如右图 菜单栏更改变量名:菜单栏更改变量名:“工具工具”“”“更改变量名更改变量名”选择所选择所 要更改变量名的要更改变量名的.rec.rec文件变量名第一个字符一定为字母变量名第一个字符一定为字母(A-Z)A-Z),之后可含字母之后可含字母(A-Z)A-Z)和和数字数字(0-9)(0-9)变量名最多变量名最多1010个字符个字符变量名不能是中文变量名不能是中文补充3:预览数据库2.生成数据文件创建数据文件创建数据文件(.(.REC)REC)的方式有:的方式有:1.1.选择选择“数据输入数据输入/输出输出”选项下的选项下的“根据根据QESQES文件文件创建数据文件创建数据文件”2.2.在工作程序工具条上选择在工作程序工具条上选择“2.“2.生成数据文件生成数据文件”如下图如下图3.编写核对程序(质量控制)目的:方便录入,质量控制目的:方便录入,质量控制 在数据录入过程中都需要进行质量控制比如,对一些变在数据录入过程中都需要进行质量控制比如,对一些变量设置合法值、在一定条件下跳转等等。
在量设置合法值、在一定条件下跳转等等在EpiDataEpiData中这中这些功能的实现是通过一个专门的文件完成的也就是包含些功能的实现是通过一个专门的文件完成的也就是包含了核对程序的核对文件了核对程序的核对文件(.(.chk)chk)核对文件总是针对一个具体的数据文件(核对文件总是针对一个具体的数据文件(.recrec),),并在数并在数据录入过程中起作用因此,一般都是先有数据文件,然据录入过程中起作用因此,一般都是先有数据文件,然后才针对数据文件生成核对文件后才针对数据文件生成核对文件核查文件的文件名核查文件的文件名(.(.chk)chk)必须必须与数据库的文件名与数据库的文件名(.(.rec)rec)一致,一致,唯一不同的就是扩展名唯一不同的就是扩展名创建核查文件方法1 1、通过菜单创建、通过菜单创建选择选择“数据核对数据核对”选项下的选项下的“增加增加/更改核对文件更改核对文件”在工作流程栏上直接点击在工作流程栏上直接点击“3.“3.添加核对程序添加核对程序”选择要进行核查的选择要进行核查的recrec文件文件2 2、使用编辑器手动编写或修改所有、使用编辑器手动编写或修改所有CHECK CHECK 命令。
注意:命令注意:CHECK CHECK 的文件名必须与数据库(的文件名必须与数据库(recrec文件)的文件名相同,文件)的文件名相同,唯一不同的就是扩展名唯一不同的就是扩展名一般情况下,这两种方法我们都会用到用第一种方法可以进行最基本的CHECK 设置,然后用编辑器添加更复杂的CHECK 命令或文件水平(而不是变量水平)上的CHECK 命令常用的几个组合键 Alt+SAlt+S:相当于按相当于按CHECKCHECK设置窗口中的设置窗口中的“存盘存盘”按钮,保存按钮,保存所有的所有的CHECKCHECK设置同时,程序不会退出设置同时,程序不会退出Add/Revise Add/Revise checkschecks;Alt+D Alt+D 或者或者F9F9:相当于按相当于按CHECKCHECK设置窗口中的设置窗口中的“编辑编辑”按按钮,弹出钮,弹出CHECKCHECK命令的编辑窗口命令的编辑窗口Alt+CAlt+C:相当于按相当于按CHECKCHECK设置窗口中设置窗口中 的的“关闭关闭”,即退出建立核查文件(1)RangeRange(定义允许录入的范围)(定义允许录入的范围)LegalLegal(设置允许录入数值)(设置允许录入数值)Jumps Jumps(跳转)(跳转)Must EnterMust Enter(必须录入)(必须录入)RepeatRepeat(重复)(重复)Value Labels Value Labels(数值标签)(数值标签)Range(允许范围)在在“Range,Legal”Range,Legal”的定义框中键入允许录入的最小值和的定义框中键入允许录入的最小值和最大值,并用连字符最大值,并用连字符“-”“-”连接。
连接例如,键入例如,键入“1-4”“1-4”,表示当前变量只允许录入,表示当前变量只允许录入1 1、2 2、3 3、4 4四个数值四个数值如果只对最大值有限制,则用如果只对最大值有限制,则用“-“-INF”INF”(负无穷大)表示负无穷大)表示最小值如果只对最小值有限制,则可以用最小值如果只对最小值有限制,则可以用“INF”INF”(无无穷大)表示最大值穷大)表示最大值例如,键入例如,键入“-“-INF-10”INF-10”表示当前变量录入的数值必须表示当前变量录入的数值必须1010键入“0-“0-INF”INF”表示录入的数值必须表示录入的数值必须00Legal(允许值)允许值(允许值(legallegal)是在是在Range,Legal Range,Legal 的定义框中键入所有的定义框中键入所有允许输入的数值,数值之间以逗号或空格间隔如果使用允许输入的数值,数值之间以逗号或空格间隔如果使用空格作间隔,程序也会自动将其转换为逗号间隔空格作间隔,程序也会自动将其转换为逗号间隔例如,键入例如,键入“4,6,8,10”“4,6,8,10”表示当前变量只允许录入表示当前变量只允许录入4 4、6 6、8 8、10 10 四个数四个数 值。
值如果你的设置中既有允许的范围,又有允许值,那么范围如果你的设置中既有允许的范围,又有允许值,那么范围值必须放在前面,允许值放在后面值必须放在前面,允许值放在后面例如,键入例如,键入“2-6,8”“2-6,8”表示允许录入的数值包括表示允许录入的数值包括2 2、3 3、4 4、5 5、6 6 和和8 8键入“8,2-6”“8,2-6”,程序会提示错误程序会提示错误Jump(跳转)JUMPSJUMPS必须以必须以ENDEND结束需要指定:结束需要指定:1.1.当前变量某个可能录入的数值当前变量某个可能录入的数值2.2.与指定数值对应的、跳转的目标变量名与指定数值对应的、跳转的目标变量名格式:跳转值、大于号(格式:跳转值、大于号()、跳转的目标变量名)、跳转的目标变量名 跳转语句间用逗号分隔例如,跳转语句间用逗号分隔例如,11V23,2V40 V23,2V40 表示输入表示输入1 1 时,跳转到变量时,跳转到变量V23V23;输入输入2 2 时,跳转到变量时,跳转到变量V40V40如果定如果定义中包含空格或逗号,请用双引号把整个定义括起来例义中包含空格或逗号,请用双引号把整个定义括起来例如,如,”2.5 2.5V30”,”3,5V35”V30”,”3,5V35”END END 表示表示“跳转到数据录入表格的最后一个变量跳转到数据录入表格的最后一个变量”,WRITE WRITE 表示表示“将当前记录存盘将当前记录存盘”。
例如,设置跳转为例如,设置跳转为“1“1V30,2END,3WRITE”V30,2END,3WRITE”Must Enter(必须录入)和Repeat(重复)必须录入(必须录入(Must EnterMust Enter)这个命令要求必须给当前变量输入数值,否则无法进入下这个命令要求必须给当前变量输入数值,否则无法进入下一个变量一个变量重复(重复(RepeatRepeat)如果选择如果选择“Yes”Yes”(是),则前一条记录在当前变量上录是),则前一条记录在当前变量上录入的数据将在接下来的新记录上重复显示在数据录入过入的数据将在接下来的新记录上重复显示在数据录入过程中,重复显示的数据可以修改如果某些录入内容在不程中,重复显示的数据可以修改如果某些录入内容在不同记录间改动很少(例如,调查员姓名、调查者所属地区同记录间改动很少(例如,调查员姓名、调查者所属地区等),这项重复功能可以省去很多重复键入的工作等),这项重复功能可以省去很多重复键入的工作Value Labels(数值标签)数值标签是一组数值加上对应的文字注释,可以解释每个数值标签是一组数值加上对应的文字注释,可以解释每个数值代表的涵义。
数值代表的涵义例如,创建一个性别变量,用例如,创建一个性别变量,用1 1 表示男性,表示男性,2 2 表示女性表示女性如果设置了这个数值标签,在数据录入过程中,当你按如果设置了这个数值标签,在数据录入过程中,当你按F9F9,或数字键盘上的或数字键盘上的+时,程序会自动弹出一张表,告诉你时,程序会自动弹出一张表,告诉你1 1 和和2 2 各自对应的涵义各自对应的涵义Value Labels(数值标签)1 1、定义新标签、定义新标签 点击点击CHECKCHECK设置窗口中设置窗口中“Value label”Value label”旁边的旁边的“+”“+”钮,钮,会弹出一个会弹出一个“Edit valuelabels”Edit valuelabels”的窗口键入数值标签编辑完毕后,可以按菜单上的键入数值标签编辑完毕后,可以按菜单上的 “接受并关闭接受并关闭”按钮或者按钮或者Alt+A Alt+A 键关闭编辑窗口键关闭编辑窗口注意:如果标签的注释性文字中带有空格,请用引号括起注意:如果标签的注释性文字中带有空格,请用引号括起来如:1”1”Male gender”Male gender”Value Labels(数值标签)2 2、编辑已有的标签、编辑已有的标签 在在Value label Value label 的下拉列表中选择你要编辑的数值标签的下拉列表中选择你要编辑的数值标签的名字,然后点击右侧的钮,编辑窗口弹出。
修改后按菜的名字,然后点击右侧的钮,编辑窗口弹出修改后按菜单上的单上的“接受并关闭接受并关闭”按钮或者按钮或者Alt+A Alt+A 键,保存并关闭编键,保存并关闭编辑窗口3 3、给变量指定已有的标签、给变量指定已有的标签 在对应的变量上,从在对应的变量上,从Value label Value label 旁的下拉列表中选择相旁的下拉列表中选择相关的标签不同的变量可以共用相同的数值标签,你只需关的标签不同的变量可以共用相同的数值标签,你只需要定义一次要定义一次4 4、清除变量的数值标签、清除变量的数值标签 在对应的变量上,从在对应的变量上,从Value label Value label 的下拉列表中选择的下拉列表中选择 nonenone,即可清除在该变量上设置的数值标签即可清除在该变量上设置的数值标签4.数据录入按按“4.“4.数据录入数据录入”、“打开打开”的图标或的图标或“数据输入数据输入/输出输出”“”“数据输入数据输入/修改修改”,如下图,如下图打开打开.recrec文件录入时字符达到设置时位数时自动跳转,或按空格录入时字符达到设置时位数时自动跳转,或按空格键跳至下一空格键跳至下一空格4.1在变量间转换 在数据录入过程中,如果你使用鼠标实现在变量间的跳转,在数据录入过程中,如果你使用鼠标实现在变量间的跳转,则则CHECKCHECK文件中设置的录入规则通常无效。
激活下一个变文件中设置的录入规则通常无效激活下一个变量,你可以使用量,你可以使用EnterEnter、TabTab、键、或用鼠标直接点击目键、或用鼠标直接点击目标变量如果变量允许录入的字符数全部录满,则光标会自动移到如果变量允许录入的字符数全部录满,则光标会自动移到下一个变量,除非你在下一个变量,除非你在CHECK CHECK 文件中设置了文件中设置了CONFIRM CONFIRM 命令如果想回到上一个变量,可以按如果想回到上一个变量,可以按Shift+Tab Shift+Tab 键,或键,或键按按Ctrl+Home Ctrl+Home 键键 可以直接回到数据录入表格的第一个变量选择可以直接回到数据录入表格的第一个变量选择Ctrl+End Ctrl+End 则可以直接跳转到最后一个变量则可以直接跳转到最后一个变量4.2在记录间转换数据录入表格的窗口左下部有一个导航条数据录入表格的窗口左下部有一个导航条上图显示当前数据库有上图显示当前数据库有118118条记录,现在位于第条记录,现在位于第115115条记录红色条记录红色DEL DEL 显示为激活,表示当前记录已经被标记删除显示为激活,表示当前记录已经被标记删除。
移到第一条记录移到第一条记录移到前一条记录(或移到前一条记录(或Ctrl+PgUpCtrl+PgUp,或或F7F7)移到下一条记录(或移到下一条记录(或Ctrl+PgDnCtrl+PgDn,或或F8F8)移到最后一条记录移到最后一条记录开始录入新记录(或开始录入新记录(或Ctrl+NCtrl+N)删除记录或恢复一条删除的记录(或删除记录或恢复一条删除的记录(或Shift+DeleteShift+Delete),),这里需要说明这里需要说明的是,记录只是被标记为删除,实际上,这条记录仍然存在于数据库的是,记录只是被标记为删除,实际上,这条记录仍然存在于数据库中,是可恢复的在菜单中,是可恢复的在菜单“工具工具”中选择中选择“数据清理数据清理”,可以永远,可以永远的删除所有标记为删除的记录的删除所有标记为删除的记录4.3转至记录、查找记录快速找到已录入的记录快速找到已录入的记录 知道序列号知道序列号转至记录转至记录 不知道序列号不知道序列号查找记录:设置查找条件查找记录:设置查找条件方法:方法:“跳转跳转”“”“转至记录转至记录”或或“查找记录查找记录”5.数据双录入核对目的:双人或两次录入,双份数据比较,找出不一致项,检目的:双人或两次录入,双份数据比较,找出不一致项,检验数据录入质量。
验数据录入质量操作:按操作:按“5.“5.其它功能其它功能”“”“数据的双录入核对数据的双录入核对”,如,如下图下图选择两次录入的数据文件(选择两次录入的数据文件(.recrec)数据双录入核对选项选择关键字段:选择关键字段:即匹配字段,一般为记录号选项:选项:不考虑已删除的记录 忽略已经有删除标记的记录 不考虑字符型字段 不考虑字符型字段中的大小写 认为“A和“a相等 报告字段类型的区别 报告两个文件中变量名相同而变量类型不同的情况 不考虑第二个文件中的缺失记录 不给出第一个数据文件中有而第二个数据文件中没有的有关记录的信息注意:某一数据文件里的关键字不能重复6.数据转出目的:转换为其它类型数据库,以便统计分析之用目的:转换为其它类型数据库,以便统计分析之用做法:做法:按按“6.“6.数据转出数据转出”,如下图,如下图。