来源|黑板洞察
导语
今日起,全国多个省份高考成绩相继出炉,各地高考阅卷工作也基本接近尾声。据北京教育考试院副院长李鸿江介绍,北京 2022 年高考阅卷将于 6 月 24 日结束,会严格按照《国家教育考试网上评卷管理规范》要求,加强阅卷工作规范管理和质量监控。作为一场影响千万人命运的大考,高考在阅卷环节更需严谨认真,容不得半点草率马虎。那么,经过近半个世纪的演变,高考阅卷如今发展到怎样的阶段,背后有哪些技术变革作为支撑,未来前进发展的方向又是哪里呢?
01
从红笔到鼠标
高考阅卷简史
自从 1977 年底国家正式恢复高考以来,这项关乎人生命运的制度已经走过了 45 个年头,背后的阅卷环节也在不断发生变迁。这四十五年间,高考阅卷历经了从单纯依靠人力手工批阅到使用计算机简单介入,再到利用人工智能高效辅助的过程。阅卷教师手中掌握考生“生杀大权”的工具也一点点由“红笔”变为了“鼠标”。
1. 阅卷“1.0时代”——人工撑起一片天
1977 年,全国恢复了中断十年的高考制度。彼时的高考,保密意识和阅卷制度都尚不完善,考试结束后,试卷经过基础信息遮挡、简单装订就被装进密封袋,送到阅卷组。等到开始阅卷的时候,再发放到阅卷教师手中。
在阅卷时,阅卷教师拿到答题纸后,直接在上面进行批阅核分。并没有我们现在熟知的“双批”“三批”乃至“四批”的要求。且试卷一般只交由一位阅卷教师手工批阅核分,就决定了考生的命运。据那一时期的阅卷人员回忆,当时阅卷能否做到公平公正,基本全凭自己的责任感和良心。
一直到 20 世纪 90 年代之前,我国高考阅卷的各个环节包括试卷的运输、装订、分发、批阅、复核等,基本都交由人工全权负责完成。但随着时代的变革、技术的创新,人工阅卷模式很快迎来了挑战。由于程序上的繁琐,效率低下成为了其硬伤。再加上当时高考命题多使用主观开放性题型,间接放大了阅卷教师批阅时主观思维的影响,产生误差的情况在所难免,结果易遭人质疑诟病。因此,建立一个更高效、更标准的高考阅卷制度迫在眉睫。
2. 阅卷2.0时代——光标阅读机助力客观题批阅
将阅卷教师从繁重工作中解放出来的曙光,出现在 1985 年。这一年,国家出台了一系列高考政策和试验方案,其中,推进标准化考试就是一项重大举措;次年,广东、山东、辽宁、广西四省联合试验高考标准化考试;到了 1988 年,全国已有 16 个省份参加高考标准化试验。
时间来到 1989 年,经过此前多地试点探索后,国家教委颁发了《普通高等学校招生全国统一考试标准化实施规划》,规定从 1991 年起所有高考科目实行标准化考试,即将高考试卷被分成客观题和主观题两部分,前者将答案写在特制的答题卡上,后者则继续在试卷上作答。
高考命题的日趋标准化,使得计算机在阅卷环节有了施展拳脚的机会。1988 年,山东大学和重庆大学联合研制的国产光标阅读机推出,并应用于当年高考阅卷领域。其能通过光学扫描和石墨感应技术,识别答题卡上的客观题答案,自动给考生批阅核分。此后的十年时光中,光标阅读机迅速普及开来,广泛应用于高考等各类标准化考试当中。
毫无疑问,光标阅读机的出现,有效为阅卷教师分担了压力,减少了无谓的消耗。但值得注意的是,这一时期,虽然客观题可以借助计算机实现“人卷分离”批阅,但主观题部分依然需要阅卷教师在纸上进行批阅,仍不可避免人为因素掺杂其中。
3. 阅卷3.0时代——高速扫描仪实现无纸化阅卷
前文提到,光标阅读机虽存在优势,却只能处理客观题,主观题依然十分有赖于人工。且由于考生数量的逐年增加,读取速度也愈发疲软。于是,更先进的高速扫描仪便登上历史舞台。
其工作原理是先对试卷进行整张扫描,再由计算机对图像进行切割。其中,客观题直接由计算机评分,主观题则分成小份由系统发送给阅卷教师批阅。扫描后的试卷会以照片形式存档,试卷的分发、批阅、核分等各个环节均在网上完成,降低繁重运输成本的同时,也让阅卷教师无法直接接触考生试卷,实现无纸化、零接触阅卷。
1999 年,广西率先在高考英语科目上试点网上无纸化阅卷。第二年,又把试点范围从英语进一步扩大到语文。此外,云南、江西、辽宁等省份也开始推行,在保送生能力测试等考试中尝试网上无纸化阅卷。
到了 2013 年,全国各地都已实现高考网上无纸化阅卷,主客观题答题卡也合二为一,除部分科目外基本都由一张 A3 尺寸的纸张构成。这种由“高速扫描仪+网上阅卷软件”组成的阅卷模式,也被各地教育考试院一直沿用至今,成为当下主流。
02
人工智能辅助
阅卷迈入4.0时代
在教育领域,人工智能技术正在全面、深刻地影响着教育理念、教学模式和考试方式。随着图像文字转写识别、自然语言处理、深度学习和评分算法等核心技术的发展,使计算机运用人工智能技术完成诸如语文作文、英语作文、英语听说、数学证明等智能辅助阅卷已经成为可能。
[1] 人工智能阅卷实施主要流程步骤
当下,高考阅卷所用的智能阅卷技术,主要分为英语听说测试以及全学科的纸笔辅助阅卷两个大类。其中,英语听说阅卷相关的研发工作早在 2005 年就启动了。到了 2012 年,科大讯飞已研发构建了广东省高考英语听说考试和智能评测系统,并首次在广东高考中验证成功实用。该系统通过人工智能技术的应用,可实现自动化考试和评分,现已推广到全国 20 多个省市的中高考英语口语考试中使用。
2015 年,科大讯飞率先在安徽、湖南等地的多项作文考试中,利用人工智能辅助完成评分质检工作;2016 年,又对安徽、江苏两地高考考生的语文作文和英语作文进行了后台离线智能评分;到了 2017 年,阿里 AI 又在浙江外国语学院的一次考试中,利用人工智能辅助,准确指出学生在作文写作中出现的多词、缺词、错词等错误。
[2] 高考网上阅卷系统和人工智能辅助 评分系统融合示意图
经过多方努力探索,去年年初,教育部教育考试院已将智能评分技术纳入网评暂行标准。再把目光聚焦到刚刚结束不久的高考,据悉,科大讯飞今年将承担 119 个省市区的中高考扫描阅卷工作,同时还会在安徽、江苏、广西、天津、广东、上海等十余个省市范围内,进行高考智能阅卷的辅助评分应用。
某种意义上看,高考阅卷 4.0 时代或许只是 3.0 时代的延续,它并未打破既有的阅卷模式和体系,只是在以往“人工+计算机”的基础上更进一步,加大了计算机的介入比重。但长远而言,其产生的影响不容小觑。过往,计算机在主观题上往往捉襟见肘,现在却能运用先进的人工智能技术,在中英作文、几何证明等题型上崭露头角,帮助阅卷教师更快速准确地批阅。
根据对上述科目及题型的探索验证和经验积累,未来,人工智能完全有可能在更大范围内建立起科学的阅卷模型,实现对具有确定答案的填空题、改错题、文科类简答题以及包含公式和解题过程的数学、物理、化学、生物等特定题型的智能批阅,将智能阅卷成果向纵深扩展。并且,伴随更多企业参与到教育考试及阅卷工作中来,势必将对现有网上阅卷技术服务商提出更多更高的要求,给行业更多发展想象的空间。
03
“人机协作”是必然
但也要拎清其中利害
其实,自人工智能技术诞生以来,关于计算机会不会完全取代人工的探讨就一直未曾停息,高考阅卷领域同样如此。科大讯飞考试与语言学习产品线副总经理竺博认为,未来在学业水平考试、自学考试及社会化考试等相对低利害的考试中,人工智能阅卷替代一评或部分替代人力是发展方向,人机协作的智能阅卷组织管理模式,也将成为未来考试阅卷智能化应用的潮流。
[3] 人机协作阅卷的智能评分流程
他表示,“人机协作”阅卷模式的技术特点可以总结归纳为 3 点:一是高融合性。将智能评分参与一评独立部署,通过增加数据接口,扩充“阅卷辅助平台”应用功能,保持与网上阅卷系统之间的密切联系。在网上阅卷系统中增加验标集专家评分功能模块,使智能评分参与一评成为替代一评的标准流程,既保证人工正式阅卷流程的顺畅,又确保各系统独立运行和相互之间的数据安全性。
二是高可用性。“网上阅卷系统”支持随时在“人一评”+“机一评”+“人二评”模式和“人工双评”模式之间的切换,智能评分系统支持在“机一评”模式和“智能评分辅助网评质量监控”模式之间的切换,能够切实降低智能评分参与一评的风险,确保阅卷进度和质量。
三是可追溯性。单独部署的“验标集专家评分系统”、用于人工阅卷的“网上阅卷系统”和“智能评分系统”3 个系统之间数据独立运行、独立存储,通过“阅卷辅助平台”进行数据交换,完成在线实时对接,并形成操作日志,关键节点均可实现可追溯、可审计、可恢复的设计目标。
人工智能辅助阅卷发展方向及核心能力
与此同时,竺博强调,人工智能阅卷不会完全取代人工,尤其在高考这种高利害性的考试中,其扮演的是工具、帮手的角色,是为了更好地服务阅卷工作,而非为了把人比下去。他表示,计算机智能阅卷更准确的表达应该为数字化考试。这点上看,教育考试领域中,以人工智能为代表的新型基础设施建设刚刚处于起步阶段,有着广阔的应用前景和上升空间。
通过业内人士观点不难看出,随着人工智能技术、5G 高速网络、数据中心、数字孪生等一批新型基础设施建设的规划与落地,教育考试业务中的信息化与数字化也将进入新阶段。未来,对行业各大厂商而言,“抓手”可能会由做好信息技术的单点应用,发展为新基建与教育考试业务各环节的全面协同;由信息技术满足部分考试业务需求,转变为新基建赋能教育考试业务;由单一的技术补缺,转变为助力教育考试业务变革升级。
结语
高考作为举国关注的大考,不仅是对广大高三学子的一次检验,更是对背后阅卷各个环节的一场考核。经过近半个世纪的演变,从“攥红笔”到“握鼠标”,从“翻试卷”到“看屏幕”,我们有幸领略技术在高考阅卷上的推力,也很欣慰成为这个特殊时代的见证者。但无论技术怎样发展变革,我们应始终秉承“人本位”的理念,让技术服务于人,而非束缚于人。