“国考”阅卷全程揭密:“申论”答卷至少8人评判

  • 佚名 (中国组织人事报)
  • 创建于 2011-12-13
  • 691


    如何对“行测”答题卡进行评分—— 先扫描,后赋分,严防工作人员篡改答题信息 

    行政职业能力测验答题卡扫描工作的主要目的就是把考生的答题信息准确无误地转化成数据库信息,便于评分软件系统进行自动化评分,确保考试分数科学、准确。但是,如何确保在扫描过程中没有工作人员篡改答题卡呢?穿过有公安民警值守的答题卡存放库房,便是行政职业能力测验答题卡扫描机房,门外,同样是两名民警值守,同时,摄像头对机房进行24小时监控。 

    机房里,高速扫描仪器快速运转,扫描时不断发出“咔咔”的声音。工作人员两人一组,一人将分发到的答题卡送入扫描仪,一人对扫描后在电脑上形成的数据信息进行比对。在考试中,什么情况都可能发生。有时是考生因为马虎将准考证号涂错,有时是考生有目的地把自己的准考证号涂成他人的准考证号,还有时是答题卡被抽出或者遗漏,这些异常信息,都会在负责比对人员的这台电脑上显示出来。 

    “我们没有任何修改答题卡信息的机会。”一位扫描人员说:“这个机房,严禁扫描人员携带2B铅笔进入,每次进来民警都要检查。我们手里只有用于答题卡袋编号及异常情况记录的红笔。而且,所有扫描人员都在一个房间里操作,两个人一组,无论做什么互相都可以监督。” 

    “在整个扫描过程中,工作人员都接触不到可能影响考生竞争力的信息。”人力资源和社会保障部人事考试中心相关负责人介绍,在扫描阶段,“行测”的标准答案始终处于密封保管状态,工作人员接触不到、也看不到。扫描后,考生的个人信息与答题信息实现了即时分离,软件系统自动锁定答题信息并将其屏蔽,工作人员看不到,也改不了。 

    但是如果有信息需要人工修改怎么办?该负责人说,为保证成绩公布时所有信息准确无误,有些信息如姓名中的同音字错误等,需要人工修改。但是所有修改过的信息都要列出清单,电脑修改操作的过程也会自动形成工作日志,供有关监督部门审核。 

    “行测”的评分是在所有答题卡扫描工作完成之后进行的,由指定的专人负责。最终,在封闭、公平公正的环境中,评卷人员和技术人员一起设置好参考答案、条形码信息、试卷种类之间的对应关系后,由评分软件系统自动处理完成。

    如何防止人情分、照顾分—— 一份“申论”答卷至少8人评判 

    12月5日,设置在河北的一处阅卷点在经过“申论”试评工作之后,进入正式评审阶段。此时,阅卷老师面前计算机上显示的答题卡图像,已经完全屏蔽了考生的姓名、准考证号等个人信息。 

    从2011年中央机关公务员考试开始,副省级以上城市和地市级以下城市“申论”考试开始采用两套不同的试卷。这样,每套试卷4道题,全国8个阅卷点,每个阅卷点只负责一道试题的评阅。也就是说每个老师在阅卷期间只评阅一道题。 

    哪个考生的答卷由哪个阅卷员评分,也是由软件系统随机派发的。阅卷时,实行双评以上误差控制法,即每道题都会派发给两名阅卷员,两人分别独立进行打分。如果两人打分的结果差异处在事先设定的误差范围内,那么平均分就是考生在这道题上的最后得分;但是,如果打分差异超出了误差范围,就会有第三个阅卷员再打分。如果三人打分的结果都超出了范围,就会由阅卷核心专家对这道答题进行裁定。这样,一份“申论”答卷至少要由8个人评判,最终得分要4个阅卷点的成绩相加才能得出。 

    “每个阅卷点的阅卷员人数在120人至250人之间,阅卷员能够评到熟悉考生答卷的概率非常低。即便是阅卷员想故意给考生打高分,也会超出误差控制范围,打分结果也不会被评分软件系统采纳。” 

    阅卷员的评分质量也进行了实时监控。阅卷管理人员会经常查看每位阅卷员的评分结果统计曲线,判断阅卷员是否把好中差的答卷有效地区分开来。有时,评分软件系统会随时把一定数量的标杆卷、阅卷员已经评过的答卷让阅卷员重新评分,以此检测阅卷员对执行参考答案的掌握是否始终如一、评分尺度的把控是否前后一致、评分工作状态是否稳定。如果发现有明显的评分质量问题,阅卷员就需要重新培训、重新评分,如果还不能改正,就可能被取消阅卷员资格。 

    如何确定“申论”评分标准—— 形成标杆卷库、设置试评环节、严格培训阅卷员 

    “申论”是笔试中的主观性试题,由考生用文字作答,阅卷也需要人工完成,人为的因素更大。那么,“申论”每道题的评分标准是怎样确定的呢? 

    与外界想象不同,“申论”每道题的评分标准并不是在考试前就已经完全确定下来的,而是在考试后,通过综合试题设计的基本设想和考生答题的整体状况最终确定的。 

    命题相关负责人介绍,为了合理制定阅卷的执行参考答案,在考试结束后,命题核心专家和阅卷核心专家一起,会在全国随机抽取一定数量的考生答卷,研究考生答题的整体状况和好中差答卷的各种表现,以“申论”命题过程中形成的参考答案为基础,修订完善各答题要点或能力要素的表述及其相应的分值,这就是执行参考答案。同时,核心专家也要亲自评阅一定数量的试卷,形成几百份好、中、差的样卷及相应的分数,这就是标杆卷库。中央机关公务员考试阅卷专门设置了一个阅卷点负责这项工作。 

    标准答案有了,如何让阅卷员充分掌握答案的采分点呢? 

    该负责人介绍,在网络正式评分工作开始之前,考试主管部门会对阅卷员进行严格的参考答案培训,并明确培训合格标准。“答题卡阅卷核心专家要向阅卷员详细介绍执行参考答案的具体内涵和分值分布,阅卷员了解后,要先试着对标杆卷库中的样卷进行评分,当他们的评分结果与核心专家的评分结果基本一致时,才算真正掌握了执行参考答案。” 

    “公务员考试的阅卷员都是大学里从事中文或管理专业教学的老师。”在“申论”答题卡扫描机房,该负责人说:“答题卡在扫描期间,我们会抽取5万份已经转换为图片的答卷传送给全国8个阅卷点,让所有阅卷员先进行试评,组织实施过程与正评完全一样。这样可以提前发现正评过程中可能出现的各种异议或问题,核心专家和管理人员会根据情况进一步调整处理的原则、程序及评分尺度。” 

    如何查验违纪违规答题卡—— 多重技术手段专门甄别作弊试卷 

    阅卷过程中,如何及时发现和甄别作弊答题卡?考试主管单位负责人说,“我们有一道‘防火墙’,专门用于甄别作弊试卷。” 

    在“行测”答题卡扫描机房,记者看到每个答题卡卷袋里都装着一份考场记录单,上面有考务人员和监考人员对考场情况所做的记录。这些记录如果有异常,阅卷领导小组会逐一进行分析,整理出各种疑似违纪违规行为的信息,并与考点进行核实、确认。 

    对隐蔽性较强,考试现场不易发现的作弊行为,包括各种高科技手段作弊怎么办? 

    从2009年度中央机关招考阅卷时起,阅卷主管部门就专门成立了雷同试卷检测小组,运用四种国际公认的科学方法同时进行甄别,整理出只有通过作弊才能形成的异常试卷。 

    该负责人介绍,2009年度检测小组投入7人、8台电脑(其中一台为高性能服务器),历时7天7夜不间断测算,共检测出作弊试卷600多份。当时社会上有一定的争议,后来通过各种渠道验证、核实,无一冤枉。2010年度这类异常试卷下降到了200多份,2011年度又进一步下降到90多份。从目前检测的情况看,2012年度还会下降。这说明通过考后技术分析手段打击隐蔽性违纪违规行为是比较有效的。 

    对此,国家行政学院教授宋世明解释,用4种方法检测得出同一甄别结果的误差率,小于10的17次方分之一。换句话说,即使乘以今年的考生总人数,也大大小于1。国际上其他国家考试,通常只采用其中一种方法的检测结果判定是否属雷同,我国采用多重条件联合判定,更科学也更负责。

 

 

责任编辑:佚名

相关链接