试卷信度与效度高考的性质最重要的在两个方面:一、高考是一种选拔性考试,高考成绩是高等学校录取新生的根据,这是高考的选拔性质二、高考是一种导向性考试,高考是中学教学的指挥棒,起着对中学教学的引导作用,这是高考的引导性质高考性质的这两方面决定了高考试题应有的信度、效度、难度和辨别度,而这些是我们进行高考生物复习一方面要清晰的,可以避免我们在复习时的盲目下面我先简朴地简介一下信度、效度、难度和辨别度四个概念:信度是指使用同一试卷对考生反复测验时,或两个平行试卷对考生测验时,所得测验分数的一致性和稳定性限度 ﻫ 效度是指考试有效性或对的性的质量指标,考试效度的高下反映着考试与否达到它的预定目的,与否考了要考的内容难度指试卷(题)的难易限度一般用试卷(题)的得分率或答对率表达,因此难度事实上是容易度或通过率其值在0~1之间,数值越大,阐明试卷(题)越容易辨别度是指试题对不同考生的知识、能力水平的鉴别限度如果一种题目的测试成果使水平高的考生答对(得高分),而水平较低的考生答错(得低分),它的辨别能力就很强题目的辨别度反映了试题这种辨别能力的高下一般觉得,辨别度的数值达到了0.3,便可以接受;低于0.3的题目,辨别能力差。
高考的性质决定了高考试题一方面要保证信度,缺少信度或信度较低都无法向几百万考生交代,无法向考生家长交代,无法向社会交代从这一角度看高考试题所考察的一定是拟定性和稳定性的内容,对于目前还没有被拟定的内容或者说有争议内容是不能作为高考命题根据的你懂得了吗?复习时,可不要让这样的问题挥霍你的精力呀!同步要注意,有些题目看起来让你回答的是假设和猜想,你可不要忘掉高考试题的拟定性,不要得意忘形呀,还是老诚实实从生物学的基本原理来回答,只有这样你才干得分OK!高考的效度规定高考试题是有效和对的的,考察的是考纲规定的内容你想想牵动着百万考生、千万家庭、亿万人员,如果哪位命题大人在命题中出了错误或者超过了考试规定,会怎么样呢?哪她可就大了,她将成为千夫所指,这样的事情是每一位命题人都不会干的鉴于此,我们的复习一定要紧紧盯住考试纲要,对考试纲要规定的内容理解、记牢,让它扎根心田;对于违背考试纲要或超过纲要规定的内容,则不要理睬;某些脑筋急转弯、文字游戏类的问题就让它见鬼去吧高考试题要有难度,这个难度有多大,平时复习需要用什么样的态度去看待不同难度的试题呢?高考试题的难度与参与考试人数和当年高等学校的录取人数是密切关联的。
去年山东省高考报名人数是70多万,实际录取人数接近40万,高考试题的难度定位应当是有助于把这40万考生选拔出来,因此,试题的难度系数应在0.6左右这意味着什么?意味着将有60%左右的考生通过高考被定位在基本较好、能力较强、具有学习潜能;而90年代只有10%左右的考生可以进入高校相比,那时10%左右的考生通过高考被定位在基本较好、能力较强、具有学习潜能这不是说目前学生中优秀的比例提高了,而是高考试题的难度变了,高考试题的侧重点变了变成什么样了呢?变成60%的试题是基本题目了你只有能把基本概念、基本原理、基本领实掌握了你就至少能拿到60%的分,你就进入了优秀基本较好、能力较强、具有学习潜能的考生的行列高三复习,特别是一轮复习的重点和目的就拟定了——基本概念、基本生物事实、基本生物学原理、基本生物学措施、基本生物学思想记住了,抓基本,把60%先抓在手中高考是选拔性考试,高考试题一定要有辨别度,以利于不同层次学校对人才的选拔因此高考还要有中档题和难度较大的题目,根据考生人数和录取人数的比例,这两类题目所占的比例将在40%左右对于生物学科讲,这部分试题的难度重要体目前生物科学思想和生物知识的运用,以及生物试题的解题技巧上。
要想在这部分试题中得高分也不难,需要在平时复习时注旨在做题目的同步总结措施,逐渐建立起生物科学的思维措施和纯熟生物学试题的解题技巧前60%是进入高校的保证,后40%则是进入较好大学所必需的,谁不想上大学,谁不想上好大学,因此这部分试题往往成了香饽饽,为此,此后每期我们都专门开设专门栏目进行,设计专门的创新题供人们热身这部分的确很重要,但要有前面的60%作基本,切不可逐末舍根呀测试信度(test reliability)也叫测试的可靠性,指的是测试成果与否稳定可靠也就是说,测试的成绩是不是反映了受试者的实际语言水平例如,如果同一套测试在对同一测试对象(即受试者自身没有变化)进行的多次测试中,受试者的分数忽高忽低的话,则阐明该测试缺少信度测试的信度与测试的效度有着密切的关系一般说来,只有信度较高的测试才干有较高的效度,但效度较高不能保证信度也一定较高测试的信度重要波及到试题自身的可靠性和评分的可靠性这两个方面试题自身与否可靠重要取决于试题的范畴、数量、试题的辨别度等因素;评分与否可靠则要看评分原则与否客观和精确测试的信度一般用一种有关系数(即两个数之间的比例关系)来表达,有关系数越大,信度则越高。
当系数为1.00时,阐明测试的可靠性达到最高限度;而系数是0.00时,则测试的可靠性降到最低限度在一般状况下,系数不会高到1.00,也不会降到0.00,而是在两者之间对信度指数的规定因测试类别的不同而不同,人们一般对原则化测试的信度系数规定在0.90以上,例如“托福”的信度大体为0.95,而课堂测试的信度系数则以0.70-0.80之间为可接受性系数测试信度的计算措施有诸多种,如下仅简介三种易于操作的措施: 1)重测法(the retesting method)用同一套试卷在两个不同步间内来测试同一批受试者,这样便获得两组分数,然后计算出两组分数的有关系数固然,在两次测试中,学生第二次的测试成绩理应比第一次的要高,由于在第二次测试时学生已有了进步并且临场经验也更丰富了但是若该试题是比较可靠的,每个学生在两次测试中的排名顺序应当是基本不变的2)交替形式法(the alternative method)对同一批受试者使用试题类型完全相似,难易限度相称,但具体题目不同的两套对等试卷先后进行两次测试,然后计算出两次得分的有关系数3)对半法(the split-half method)测试只进行一次,但将整份试卷的题目按单、双数提成两组来分别计分,算出两组分数的有关系数,然后再用Spearman-Brown的公式计算整份试卷的信度系数。
具体计算环节是:将两组分数的有关系数乘以2,再除以1加两组分数的有关系数 测试效度(test validity)亦称测试的有效性,指一套测试相应当测试的内容所测的限度也就是说,一套测试与否达到了它预定的目的以及与否测量了它要测量的内容例如:“Is photography an art orscience?Discuss.”这种题目以照相的知识为前提和重要内容,用来考语言能力,就不具有效性又如用听写来测量学生的听觉能力,其效度也是不抱负的,由于书面记录有声语言不仅波及学生的听觉能力,并且还与她们的书写速度、拼写能力、语法知识、记忆能力和对全文的理解能力等有关 测试的效度一般可分为如下几类: 1)表面效度(face validity)指测试应达到的卷面原则,即一套测试题从表面看来与否是合适的例如,若一次阅读理解力的测试涉及许多受试者没有学过的方言词汇,则可觉得这次测试缺少表面效度表面效度是测试出受试者正常水平的一种保证因素 2)内容效度(content validity)指一套测试题与否测试了应当测试的内容或者说所测试的内容与否反映了测试的规定,即测试的代表性和覆盖面的限度例如,如果某一套发音技能测试题仅仅考察发音所必须具有的某些技能,如只考单一音素的发音,而不考察重读、语调或音素在词语中的发音,那么,该测试的内容效度就很低。
3)编制效度(construct validity)指一套测试题的诸项目对编制该测试所根据的理论的各个基本方面的反映限度例如,以构造主义语言理论为基本,觉得系统的语言习惯是通过句型而获得的,那么,强调词汇和语法环境的测试题目就失去了编制效度 4)经验效度(empirical validity)经验效度是一种衡量测试有效性的量度,通过把一次测试与一种或多种原则尺度相对照而得出经验效度可分为两种:一是共时效度(concurrent validity),即将一次测试的成果同另一次时间相近的有效测试的成果相比较,或同教师的鉴定相比较而得出的系数;二是预测效度(predictive validity),即将一次测试的成果同后来的语言能力相比较,或是同教师后来对学生的鉴定相比较而得出的系数 一般来说,对某次测试的效度进行检查时,除了要根据教学大纲的规定和观念有效性的理论对试卷的内容进行考察以外,还须采用计算有关系数的定量措施,即计算出本次试卷与另一份已被拟定能对的反映受试者水平的试卷之间的有关系数系数高则有效性大课堂测试的效度应在0.4-0.7之间,规模较大的测试其效度应在0.7以上。