卓尔高考网

揭秘辽宁高考AI反作弊系统170小时检测10万小时考场视频,辽宁省高考AI检测作弊

人工智能在高考中能起到什么作用?近日,辽宁省在全国率先做出尝试:利用人工智能辅助分析考场监控视频,检测作弊等疑似违规行为。

辽宁省招办相关负责人向南都记者强调,应用人工智能的主要目标不是抓作弊,而是起到震慑作用,让侥幸的考生不敢、不能、不想作弊,营造更加公正公平的考试环境。

让人工智能解决高考视频评判中的“痛点”

7月7日傍晚五点,交卷铃响,辽宁省2020年高考第一天结束。

3个小时后,辽宁省招办近十名技术人员忙碌起来:当天的监考视频已全部加密传输至云端数据库,考场违规检测工作开始。

办公室里没有人说话,只能听到电脑主机的嗡嗡声。每个技术人员都守着一台电脑,全神贯注地盯着电脑屏幕上一个个排列整齐的程序窗口——。它们不敲击键盘或鼠标,但一行行代码以肉眼几乎看不见的速度闪过程序窗口。

揭秘辽宁高考AI反作弊系统170小时检测10万小时考场视频,辽宁省高考AI检测作弊

人工智能检测系统运行界面。

这些代码的背后,是辽宁省今年首次引入高考的“考场违规智能分析系统”。

通过判断监考视频来查处考场上的违法行为,是每年高考期间各省市的一项常规工作。但多年来,辽宁省招生办也发现了一些“痛点”:需要100多名专业人员投入大量人力;时间长,100多人要看7-10天,高考正式结束才能开工;工作比较枯燥,每个监考视频时长都在3个小时以上。评委一直盯着倍速视频,容易疲劳。法官有视觉限制,注意力和识别能力不足。

人工智能正好可以弥补人类的不足:具有自我学习能力,数据处理速度快,可以724小时全自动运行。

辽宁省招办数据处副处长刘健介绍,今年辽宁共设考场7585个,生成监考视频3.3万个,总视频时长近11万小时。人工智能系统配备80台智能分析服务器,每小时可分析320个完整考场视频,完成全部检测仅需170小时。

据了解,这170个小时还包括获取和存储视频文件所用的时间。据此,如果保守换算系统运行时间,80台智能分析服务器同时工作,平均检测一段检查视频的时间约为18秒。

“今年研究人员的任务轻松多了,因为之前的人工智能系统已经筛选出了大量的视频。各级考试工作人员只需对系统检测出的涉嫌违规行为进一步识别判断即可。”刘健表示,在防控新冠肺炎疫情的特殊形势下,人工智能的应用也避免了聚集大量科研人员带来的潜在风险。

需要注意的是,系统检测到的异常行为只能称为“疑似违规”。石,研发中心的负责人;沈阳航空航天大学教授、沈阳途威科技有限公司创始人D team告诉南都记者,考试违规的认定是一个复杂而谨慎的过程。系统给出的参考结果还要经过多轮人工验证,最后由各级考官判定是否违规。

运营不到一小时发现疑似违法视频。

杜南记者了解到,这个系统的组成相当复杂,不仅仅是设计一个好的算法模型那么简单。它包括六个模块:视频文件预处理、任务智能调度、视频分析、视频播放、业务管理和统计分析。前两个作案工具

两位候选人没想到的是,他们的一举一动都被人工智能“全景”了下来。法官只要登录业务管理模块,就能对涉嫌的违规行为一目了然。

高效便捷是科研人员的普遍感受。“去年评审的时候,我们分到一堆原创视频。每个视频的时长从3小时到3.5小时不等,每个视频都要从头看到尾。每个考场大约有30名考生。想想视频里的人有多渺小!时间不少,累也不少。”一位过去一年参与高考的研究人员表示,有了人工智能系统,回看视频总量一下子减少到原来的1/20,研判工作更有针对性,“工作效率太高了”。

据辽宁省招办称,今年发现的许多疑似违规行为中,有一些被考官判定为真实违规行为。经过实际测试,该系统能够有效识别偷窥、偷窥、回看、递纸条等常规抄袭行为,在人工难以判断的高科技作弊行为检测中取得了良好的效果。

从特征提取到数据处理的研发过程经历了很多挑战。

涉嫌违规是如何发现的?算法负责人、沈阳航空航天大学副教授、沈阳图维科技有限公司核心成员刘翠微解释说,团队通过研究大量考试视频和心理资料,发现违规的学生会有一些心理波动,进而表现出异常行为。“通过分析图片中候选人的动态和静态特征,人工智能系统可以捕捉到一些异常行为。”她说。

解释似乎很简单,但真正的R & amp过程是艰巨而漫长的。早在2017年,辽宁省招办就有意使用人工智能。由于技术水平的限制,未能实现3354。相关工作人员联系了很多公司,包括一些大的互联网公司,得到的回答都是“做不到”。直到2018年,沈阳航空航天大学团队才接受了这个“挑战”。

让人工智能实践”

火眼金睛”,难在哪儿?刘翠微告诉南都记者,违规行为的特征表示和提取,是第一大难题。

用人脸识别作为对比,或许能更好地说明考场行为分析的困难所在:每个人的人脸特征是确定的,机器只要拍到清晰的人脸图片,就可以完成特征提取和后台比对。

但在考场上,不同考生之间的差异性很大,违规行为的特征是不确定的。即便同样是打小抄,100个学生可能也会有100种不同的表现。这就要求研发人员明确违规行为的特征,让系统能够作出有效区分。

考生精细动作的可辨识性,则是另一重难题。由于现实条件限制,考场内不可能安装多个摄像头,只能靠教室前端的一个摄像头来俯拍全景,不同的考生之间可能出现遮挡。一个教室大约有30位考生,即便考场视频已达到高清级别,画面中的每位考生还是很小,被拍下来的身体姿态、动作也局限于特定的角度。

揭秘辽宁高考AI反作弊系统170小时检测10万小时考场视频,辽宁省高考AI检测作弊

高考监控摄像头拍摄画面。

“一个想作弊的考生会有很强的主观隐蔽性,不可能把他的行为公然展现出来。他的动作都是细微的动作,变化幅度非常小,反映到图像当中可能就是几十个像素甚至几个像素。”刘翠微说,此前的一些人工智能系统可以检测幅度较大的快速运动,比如打架斗殴、异常奔跑等。但室内环境下的多人精细行为分析,仍然面临较大挑战。

构建高质量训练模型,也是研发团队要解决的一个重要问题。技术人员组织专门队伍对大量考试视频进行标注,包括视频中人的位置、身体部位、考生的动作、是否违规,等等。

此外,相比于人脸识别中的图像比对,视频分析的难度更大,背后的数据处理工作完全是不同的量级:一般视频的播放帧速率是每秒24帧,也就是24张图像。一场两个小时的考试,就会生成超过17万张图像。

要在这些图像的连续运动中发现考生特征的变化,同时让系统分析的结果具有“可解释性”,可谓是难上加难,国内外没有多少经验可以借鉴。刘翠微回忆,研发工作曾多次陷入瓶颈,因为视频的数据量太大,他们有时候让系统运行一个测试,都要花上一两天之久。

最终,研发团队在完成核心技术攻关的基础上,赋予了系统一系列易管理、易操作的特性:任务流程自动化,系统可对分析结果自动筛选,一键生成工单发送给研判人员;管理人员可以实时监测所有任务的执行情况;视频模块可以自动截取证据视频片段,减轻复核工作量;可根据用户的不同需求,按照市、区、考点和科目等多维度进行数据统计和输出。

也正是由于多项工作属于“勇闯无人区”,研发团队目前已申请了11项发明专利,同时主持了一项辽宁省地方技术标准的制定。为了让相关应用得到更好地发展,团队还孵化了沈阳图为科技有限公司,专攻视频领域的行为识别。

人工智能没有KPI 主要目的是起到震慑作用

从2018年研发启动到如今的应用落地,两年多的时间过去了。石祥滨坦言,当初接下工作的时候就知道挑战很大,但还是没想到花了这么久。

由于系统的创新性较强,很多市面上现有的软件和设备无法满足需求,团队还开发了一系列配套的软硬件。例如,这次辽宁省招考办使用的80台视频分析服务器,就是团队研发的软硬件协同一体机,更适合用来实现视频识别。

在两年多的时间里,系统曾在辽宁省的普通高考、高中学业水平考试、研究生入学考试、自学考试和成人高考等考试中进行试点实验,确认了实际效果之后,辽宁省招考办才决定在今年的普通高考中正式应用。

为了部署80台视频分析服务器、让系统的马力能开到最大来满足高考的需求,辽宁省招考办还特意改造了机房,将服务器机柜底部的地板换成了通风地板,确保供电、温度等方面没有问题。

揭秘辽宁高考AI反作弊系统170小时检测10万小时考场视频,辽宁省高考AI检测作弊

80台视频分析服务器一起运行。

不过,从7月7日开始,石祥滨还是每天都要去一趟辽宁省招考办检查情况。技术人员们也实行了“两班倒”,确保系统可以24小时不间断无故障运行。

“这么复杂的一个系统,只要有一个环节出问题,就会影响后面的工作。但高考是不允许出错的,我们要对考生负责。”石祥滨坦言,压力很大,每天看到系统正常运行才能安心。目前来看,系统成功经受住了考验。

值得注意的是,刘健告诉南都记者,智能系统并没有设定“抓多少个违规行为”的“KPI指标”。“不是说抓到的违规考生越多就越好,更多地是要起到震慑的作用,让考生清楚知道作弊必被抓,实现考生不敢、不能、不想作弊的目标,营造更加公正、公平的考试环境。”刘健说。

近年来,人工智能的效用屡屡被党和政府提及。去年底召开的党的十九届四中全会就曾提出,“更加重视运用人工智能、互联网、大数据等现代信息技术手段提升治理能力和治理现代化水平”。今年的政府工作报告中也提到,加强新型基础设施建设,发展新一代信息网络。辽宁省招考办表示,未来希望将人工智能技术应用于招生考试工作的更多环节,如识别试卷保密室工作人员、智能评卷等,实现招考工作中的治理能力提升。

采写:南都记者冯群星 潘颖欣

您可能还会对下面的文章感兴趣: