当前,随着返工大潮来临,上海疫情防控处于外防输入、内防扩散的关键阶段,大数据成为科学防控、精准防控的必然选择。上海作为超大规模城市,可充分发挥大数据在医疗救治、道口查控、社区防控、有序复工等方面的积极作用,让疫情防控背景下的城市治理更加细腻、更加科学。
近段时间以来,疫情防控的大数据应用层出不穷、功能各异,牵住疫情防控大数据的“牛鼻子”成为关键。疫情大数据具有显著的4V特征:数据量大(Volume)、多样性(Variety)、高速(Velocity)、低价值密度(Value)。各类基于大数据的产品应用,为千头万绪的疫情防控注入了“智慧”基因。中国电信推出“疫情防控排查系统”,提供定点医院、发热门诊、人员聚集区等重点区域的人流分析等功能;腾讯推出微应急平台健康码,提供复工人员登记、健康自查上报、疫情线索举报、口罩预约购买、医疗物资捐赠等多类服务;清华大学推出“新冠肺炎疫情AI话题分析平台”,提供疫情舆情监测服务。徐汇区政府推出“看家护院、邻里互助”疫情防控系统,提供口罩预约、返沪人员管理和沿街商铺管理功能。利用大数据支撑疫情防控的精准性、科学性、前瞻性,成为普遍共识。
疫情大数据是综合作战,要“快、准、稳”。全面打赢大数据战“疫”,要跨越数据、应用、安全的三大“鸿沟”。
一、以“联邦数据”思维,跨越多源数据的共享“鸿沟”
疫情防控涉及医疗、政府、电信、航空、铁路、互联网等多源、多维数据,数据来源各不相同,数据质量参差不齐。迫切需要机制创新,跨越疫情数据资源之间的共享“鸿沟”。首先,政府统筹全局的“汇聚数据”。联邦数据是各数据源主体按照疫情防控的数据需求,通过脱敏处理和加工计算,向政府提供符合疫情防控的数据结果,避免提供原始数据造成用户隐私问题和二次加工困扰。其次,政府自力更生的“生产数据”。针对外部数据在疫情防控领域的不足,自主采集相关数据。比如在高铁、机场、地铁、园区、写字楼、社区等人流密集区域设置AI测温仪器,快速精准的采集规模性人群体温数据。从而,通过内外兼修的“外部汇聚数据”和“内部生产数据”,构建权威、全面的疫情防控大数据资源池。将一线疫情防控人员从重复统计、文山会海中解放出来,以大数据克服官僚主义、形式主义。
二、以“降维打击”方法,跨域主题应用的效率“鸿沟”
面对各级政府和医疗、交通、金融等部门的多样化、专业化的疫情防控需求,迫切需要快速响应机制,跨越疫情防控需求与数据资源供给之间的效率“鸿沟”。首先,快速响应,明确疫情防控的应用主题。疫情研究可以“慢慢来”,但是疫情防控“等不得”。要根据疫情防控的战略诉求和具体要求,聚焦重点,快速确定疫情监测、趋势预测、防控部署、医疗资源、舆情管理、民生保障、返城复工等大数据应用主题,引领疫情大数据应用方向。其次,广泛征集,凝聚全社会大数据应用智慧。疫情防控情况下,没有旁观者。大数据相关企业立足自身优势资源,结合疫情防控主题,快速形成疫情防控大数据产品。比如通过百度迁徙的用户迁移数据分析,发现江苏、安徽、浙江、河南、江西五省人口迁入上海约占70%,快速判断返工大潮的疫情传播风险。通过快速响应和广泛征集,形成重点突出、系统全面的大数据创新应用格局,实现科学防控、精准防控。避免“一刀切”的防控措施,过度影响“复工复产”,破坏中国经济平稳运行。
三、以“最小范围”原则,跨越用户隐私的安全“鸿沟”
疫情防控与外滩事件的大数据应用有着显著差别,既要掌握人员流动的群体数据,又要追踪重点人员的个体数据。迫切需要风险平衡机制,跨越疫情防控与用户隐私之间的安全“鸿沟”。首先,坚持“最小化原则”,尽量少采集用户个人数据。原则上仅限于采集确诊者、疑似者、密切接触者等高危人群的生活轨迹和接触人员,为疫情溯源和预防传播提供宝贵数据,并做好公众知情与用户隐私的平衡。比如,上海市政府主动公开了确诊病例的活动地点,以数据透明减少社会公众由于不知情造成的恐慌,但是并未公开确诊病例的个人信息。其次,尊重用户“数据主权”,鼓励用户主动提供疫情所需数据。随着大规模的返城复工,便于企业、社区等疫情防控和摸排,电信、移动、联通三大电信运营商已提供“疫情防控查询”服务,可以辅助证明人员的活动轨迹。通过追踪行动轨迹、建立个体关系图谱等,精准定位疫情传播路径,防控疫情扩散方面有着重要作用。
精准防控,“数”战“数”决,必将打赢大数据战“疫”!