“拉萨发现首例新冠肺炎确诊病例,急寻从武汉武昌到西宁,从西宁到拉萨的Z264次、Z265次同车厢旅客。”
“4个航班发现确诊患者,急寻同行旅客”
“紧急扩散!广元急寻以下车次乘客”
……
打开搜索引擎输入“急寻”,可以看到下拉联想词基本都是和寻找患者同行人相关内容。可见,防控疫情的战场,不仅仅在于医疗一线的救死扶伤,更需要做好人群流动信息,洞察疫情扩散情况,控制好传播途径,进而抑制疫情的过快扩散,保护更多人的健康和生命安全。
这一切,离不开强大的大数据分析技术。
疫情就是命令 大年三十成立项目组 驰援某政府客户
“我们这里有大量的疫情相关数据,但是却摸不清头绪,无从下手,急需要模分析模型。”
春节期间,奇安信大数据与态势感知公司陆续收到了某部委及全国多个省市的下属机关的紧急需求。该部委作为此次疫情防控的重要支撑单位,为了更高效推进工作,第一时间向奇安信集团发出数据分析技术的请求,希望利用大数据技术分析辖区内的疫情扩散情况,为精准防控提供数据支撑。
疫情就是命令!奇安信连夜成立态势感知应急项目组,陆续召集了22人擅长大数据分析的精兵强将,按照就近原则,连夜奔赴前线,给客户提供驻场贴身服务。
“因为过年车很难打,加上很多地方开始交通管制,到客户现场也很不容易,甚至有位同事在下雪天徒步走了2个多小时。”项目负责人李虎回顾道,“比交通问题更大的困难,这次客户提出的需求是全新的,需要高度定制化的开发和服务,而且复杂度远远超出想象。”
大家都知道,奇安信本身是一家安全公司,在感知网络安全态势方面无出其右,可这次感知疫情态势,尽管二者之间有相通的地方,却也是大姑娘上花轿——头一遭。
面对全新的需求,时间紧且任务重。在首批项目组到达一线的第二天,李虎果断决定又专门成立了40多人二线团队,涵盖产品、售前、研发、数据、测试等多条业务线,全力保障前线同事们的后勤。
数据一条条看,模型一个个建,bug一个个改
果不其然,项目初期并非一帆风顺。试想,疫情发生以后有几百万人从武汉流向全国各地,有坐火车的、有坐飞机的还有自驾的,这些都有可能是潜在的传染源。他们什么时间到过哪些地方、接触过那些人,面对如此庞杂、海量的数据,一线的分析师需要从中抽丝剥茧,并且放到系统里面进行建模分析,这个难度是可想而知的。
李虎回忆,一线同事初到现场之时,由于数据比较少,质量也很一般,很难直接开战模型训练和结果验证工作。为了解决这些难题,一线同事不厌其烦,反复研究了疫情数据的特点,人工一条条的进行数据筛选和补全,工作量巨大,每天都是半夜12点后才离开客户现场;在建模过程中,与用户保持密切沟通,确定每个模型所需的数据资源、关键特征、衡量标准等,并基于这些数据展开模型训练和分析工作,确保模型能够迅速投入实战。
随着数据量的剧增,数据的各字段信息也相对完整,数据本身的问题基本得以解决,但数据分析的难度陡然上升。况且疫情发展到这样一个地步,已经出现了二代甚至三代传播,数据分析的难度就更大了。为确保模型输出的数据结果快速而又准确,研发同事连夜设计出了能够自动化数据处理的脚本文件,大大提高了现场大规模数据的处理和分析效率。
后台的工作一样辛苦。同事们的电话声彻夜不休,用来聊天打字的手都已经僵住了,为的就是准确、快速响应一线需求。研发同事们的键盘敲击声铿锵有力,为此他们还要时不时回过头,生怕吵醒身后熟睡的孩子,偶尔捋捋仅剩的一小撮头发。就这样,一行行代码在电脑屏幕上滚动着。
为了避免忙中出错,研发组毫不敢放松,一边开发,一边加大了对bug的检测力度。果然,从中揪出了20多个bug。为了尽快解决bug,按时交付系统并上线运行,老马拎起一大袋子方便面就坐在了电脑前,结果是bug解决了,系统按时交付上线了,自己也因泡面吃得太多上火了。
20个模型、超1000万条数据 “疫情态势图”助力精准决策
据不完全统计,在前线、后方两线同事的紧密配合下,依托奇安信大数据智能建模平台,项目组共搭建了近20个数据分析模型,处理了超过1000万条数据,并且通过可视化大屏,绘制出了一张精准的“疫情态势图”,为当地公安机关研判疫情态势、排查密切接触人员、控制传播途径,提供了精准的决策支撑。
“如果这些定制化需求搁在平时,且要在短时间完成巨大工作量,以及如此复杂的数据分析和模型开发,简直就是天方夜谭。”李虎感慨到。
此时此刻,抗击疫情的大数据分析及态势感知会战还在紧张的进行,每一位参与其中的同事都在竭尽全力。如果说在传统战争中,情报是决定胜负的要素的话,那么在这场信息化为特征的全民战“疫”中,数据就是情报,就是指挥决策的依据,是打赢这场阻击战的重中之重。而作为网络安全国家队,奇安信旗下态势感知团队依托自身强大的大数据分析和智能建模能力,全力为国家相关部门提供技术保障,尽早赢下这场“战疫”!