ZHC的质量控制

2017-04-17 16:58:26

ZHC的质量控制

 

中国人一般总是主张分数面前人人平等,认为考试是最公平的人员评价方式。事实上,考试的公平性问题并不象人们想象的那样简单。

首先,考试并不一定都可靠。2003年春SARS流行时期,各个机构的入口处都要测量体温,使大量先进的红外激光体温计热销。并非所有的体温计都是可靠的。有些误差在摄氏1度以上。我们以考试作为一个体温计对人的能力进行测量,考试这个体温计也并不是天然可靠的。如果这个体温计本身有质量问题,今天量一个温度,明天量又一个温度,你量一个温度,我量又一个温度,这样的考试就缺乏可靠性。

2002722日《南方日报》一篇题为高考作文两次改判背后的幸与不幸的文章披露,在2002年四川省高考语文阅卷工作中,一篇作文因与传统观点格格不入,评卷老师只给20分。将此文提出来与整个阅卷室的数十位评卷教师讨论,结果争议很大,从20多分改成了40多分,最后请示评卷指导委员会,最终被认为是一篇不可多得的佳作,给出了相当高的分数。(满分60

高考应算我国最严肃的考试之一。高考这把尺子,在被用来测量一个考生的语文能力的时候,尚存在如此大的伸缩性,其他考试的可靠性可能问题更大。一个好的考试,首先需要反映考生真实的水平。能否反映考生的真实水平?就是考试的可靠性问题,或信度问题。

其次,可靠的考试并不一定都有效。在一项关系考生命运的重要考试中有这样一道阅读理解题:

历来印章均以篆为宗,故治印章必先精通篆法,用字要有出处,变化须合六书,切忌生编  滥造或任意增减。

以篆为宗中的指的是:
A
.篆刻 B.篆法 C.篆字 D.书法

这道题的正确答案是篆字。在考试中,大部分考生选择了篆法。答对这道题,需要某些关于治印的专门知识。那些具有这方面知识的人,可以取得好的成绩。这类题目,可以反映出考生治印知识方面真实的水平。但是,这项考试的目的是考查阅读理解而不是治印。虽然考试成绩是可靠的,反映了考生某一方面的真实水平,但是,对于评价考生的阅读理解能力这一目的来说,有效性却有限。事后的统计分析数据显示,该题目鉴别能力很差,不能正确鉴别考生的语言能力。

所有考试的命题人员都会认为自己编制的考试是高分高能。实际应用的考试中,却常常存在一些高分低能的现象。高分低能的考试就是缺乏有效性的考试。考试能否实现考试目的?这就是考试的有效性问题,或效度问题。所谓效度,总是就一定的考试目的而言的。

第三,既可靠、又有效的考试,并不一定都有用。在一个大学毕业生的求职简历中,学习成绩单上写着现代汉语80。即使他所参加的现代汉语考试是一项既可靠、又有效的考试,根据他的这个成绩,我们也很难判断他的现代汉语课程学得究竟如何,更不用说据此去推测他的现代汉语水平的高低。如果任课老师评分政策比较严格,他这门课程可能学得很好;如果任课老师评分政策比较宽松严格,他这门课程可能学得并不好。或者说,我们从这个分数中的到的有关这个考生的评价信息很有限。分数中包含信息很少的原因是缺乏必要的参照系。

任何一组考试题目或考试任务,都可以得到一个正确回答数正确回答比例,都可以得到一个分数。但是,并不是对任何一个分数都可以做出与考试目的有关的解释,都可以被赋予意义,都可以成为决策的合理依据。考试的可靠性和有效性是对分数进行解释的基础,是赋予分数以意义的前提。此外,还需要有一个合理的分数体系。

事实上,考试的质量存在优劣之分。一般人的观念是:是英雄,是好汉,考场上,比比看。考不过,心服口服。现代教育测量学的观念是:何以见得一个人答不好这张试卷就做不好工作,完不成学业?在根据考试成绩做出招工、招生方面的决策时,需要拿出说明考试的信度、效度的证据。否则,就是对一个人就业、升学权利的侵害。

考试是一个衡量人的能力的天平体温计。这个天平体温计,本身存在着质量问题。有的质量较好,可以基本准确地反映人的能力水平。有的质量较差,在测量的过程中存在很大误差。这个体温计的质量如何?这个考试的质量如何?何以见得我没有通过某项考试就不能胜任一定的工作或学习任务?理由是什么?这些问题,应该得到合理的回答。由于考试往往关系到一个人的命运,与冰箱、彩电、洗衣机的质量问题相比,考试的质量问题应该受到更多的关注,考试更应该具有一张质量检验合格证

考试的目的是提高人员素质,维护社会公平。但是,并非所有考试都一定能够带来人员素质的提高,都能够实现社会的公平。语言能力测试并非始于今日,从八股取士到现行的高考作文,语言能力测试在我国古已有之。中国古代的科举考试是形式上非常完备的考试,有些保证公平的措施今天都很难做到。例如,科举的单间施测,进场搜身,誊录(为了避免辨认笔迹将所有答卷全部重新抄录),等等。但是,科举考试并没有带来人员素质的提高。为了真正达到选拔人才和维护公平的目的,需要重视考试本身的质量问题。

ZHC是标准化证书考试。ZHC通过预测、等值、题库建设、分数体系设计、主观评分控制等各个环节,对考试的质量进行控制。

 

 

 
 

 
相关信息