新冠肺炎疫情防控实践中的大数据体系建设思考

2020年元旦前后突然爆发的新冠肺炎疫情是新中国成立以来在我国发生的传播速度最快、感染范围最广、防控难度最大的一次重大突发公共卫生事件。经过两个多月的艰苦努力,目前疫情防控形势积极向好的态势正在拓展,但是形势依然严峻复杂,防控正处在最吃劲的关键阶段。习近平总书记亲自部署、亲自指挥了这场前所未有的疫情防控战,他明确提出:要充分运用大数据分析等方法支撑疫情防控工作。他所给出的这个命题,需要我们在不断实践的过程中,重新认识和思考大数据在重大突发公共卫生事件的作用。


新冠肺炎疫情防控实践中的大数据体系建设思考

笔者通过访谈、调研奋战在疫情防控一线的大数据工作团队,调查研究了武汉、北京、上海、广州等地区运用大数据开展疫情防控的相关实战工作情况,对大数据在公共卫生事件中的作用发挥进行了总结和思考。

一、新冠肺炎疫情的复杂性对大数据工作提出巨大挑战

目前正在进行的这场新冠肺炎疫情防控工作是一场多地区、多部门参与的狙击战、整体战,是一场全民动员的人民战争,大数据的使用渗透在防疫工作的各个环节,同时,大数据工作也面临着前所未有的现实挑战,具体体现在以下四个方面:

(一)疫情数据数量巨大。此次疫情爆发的速度远远超出人们的想象。以疫情爆发最为凶猛的湖北省为例,从1月22日确诊270人开始,确诊人数以每天新增两千人左右的速度,迅速蹿升到2月15日的48175人,是1月22日的160倍!从全国来说,1月25日确诊人数超过千人,而到3月3日确诊人数达到80151人。疫情爆发所产生数据量和为防控疫情而需要的数据量都是巨大的。

(二)疫情数据类型复杂。在疫情最为严重的武汉市,1300万人口里有500万人口在封城前流出。不论是封城前外流的人群,还是医院里拥挤的确诊和疑似病例,还是隔离在家中的更为庞大的密切接触人群,以及因为复工复产而在城市间流动的人口,这一个个真实的生命个体就像一片片飘散的数据拼图,急需要专业技术人员复原出最真实的原貌。复杂的疫情带来的是复杂的数据。

(三)数据服务需求多样。疫情防控期间,全国人民在政府的统一指导下,进行了严格的防控调查登记。各级政府、社会组织、企业等不同治理主体都在围绕医疗救治、社区防控、防疫物资、生活保障等各个方面开展联防联控工作。大范围的防疫工作对大数据服务提出的需求是多样而复杂的。

(四)数据体系基础薄弱。一是基础数据统筹准备不足。各地疫情爆发初期,大量疫情第一手数据分散在各级医疗防疫机构的不同系统和大量临时手工表格之上,来源重复,质量不高。二是基础分析手段匮乏。“已经外流、本地确诊、本地疑似、密切接触”四类人员都是谁?都在哪?都接触过谁?……不论是疫情防控的总体态势把握,还是对个体的发现查找,都缺乏必要的分析手段。三是各地在处置突发公共卫生事件方面的数据运营基本是空白。即便一些地区加强了临时的技术支撑应对,但由于缺乏系统性的规划,片段化的技术应用难以发挥出大数据的应有效能。

二、大数据在新冠疫情防控过程中的作用发挥

“控而治之”是此次疫情处置应对的总要求。与日常疾病不同,新冠疫情的第一属性是重大突发公共卫生事件,这就要求在应对上除了“防治”,更要“防控”。从“治”到“控”一字之变,就把城市医疗卫生工作的重心从以社会服务为主,推向了社会管理甚至治理的方向。城市一旦“漏控”就会暴露在“失治”的风险之中,所以建强用好疫情防控大数据系统势在必行。必须着力形成“汇集—分析—研判—推送—核查—反馈”的数据应用闭环,强化大数据在疫情防控中的场景应用,才能提高防控的精准性、有效性。在这次防疫过程中,公安部门因为在“人口、交通、行业场所和网络通讯”等基础工作管理方面的数据优势,首当其冲投入到了防疫数据体系的建设中。北京海致网聚信息技术有限公司等一些专业大数据公司在这场大数据分析战中也发挥了积极的作用,先后在武汉、上海、北京、江西等十几个省市进行了大数据服务支持。他们将前期在公安、金融、交通等多个领域已经形成的大数据技术优势和业务标准,运用到此次疫情防控工作中,迅速发挥作用。主要体现在以下三个方面:

首先,数据收集速度提升。应急处置工作中数据分析的对象群体越大,单一数据源的可信度就越低,对交叉验证的数据种类、数量的需求也就越大。疫情中心的武汉市依托公安大数据平台,迅速建成了跨平台、跨系统、跨数据库的疫情防控大数据系统,运作初见成效,在数据信息闭环建设上迈出了坚实步伐。这一系统实现了以下几方面功能:一是数据的快速接入。目前武汉市疫情防控分析平台接入了卫健、公安、交通、电信、市政等多个部门的系统数据144类100多亿条,同时,针对各基层工作点每日上报数据建立了专门的数据汇聚通道,实现了数据即时采集、即时接入。二是数据的快速清洗。大数据平台内置了数据漏填、错报和重复报送等一系列数据自动检查校验功能,以机器取代人力针对各部门接入的数据开展数据质量管理,极大的提高了数据分析的真实性、完整性和及时性。三是数据的快速加工。为了便于分析,一方面建立了防疫所需的人口、房屋、地址、场所、物品等基础数据库;另一方面建立了重点关注人员的身份特征、行为特征、关系特征等主题数据库。通过从数据到知识的加工转化,使数据迅速具备业务属性,方便分析的迅速准确。

其次,数据分析广度拓展。大数据分析的主要工作原理是基于业务数据针对业务问题将业务逻辑转化为数学模型,从而使得机器可以按照要求持续不断地输出业务决策所需的分析结果,因此,大数据技术十分强调基于数据建模和机器计算的重要性。数据建模支撑业务决策是数据驱动业务的本质所在。广东省在此次防疫的建模分析工程中,从三个方面突出“一切业务模型化”:一是紧盯态势全貌,通过建模工具快速搭建出关注人员、交通封控、隔离监管、医疗收治、舆情分析、治安警情、返程复工等一系列维度的态势类统计模型,输出相关统计图表、专题报告等,服务于本地防疫的趋势把控、决策制定和落地督察。二是紧盯区域共享。在各地市自主建模的基础上,分析共性,在全省平台的模型超市中展示和共享。这一经验互补的方法对迅速丰富防控措施、避免系统重复建设、完善防控机制起到了重要作用。三是紧盯个体关注。搭建了人员落位、人员监测、人员收治等针对个体的对象类摸排模型,能够提供覆盖地市、区县、街镇和社区村居四级的疫情防控分析服务,直接向一线工作人员提供准确的数据,支撑实战。

第三,数据运行精度彰显。以大数据技术支撑业务工作实体运行,从而实现数据驱动运营,是各地开展大数据建设的核心目的。数据运营是一个闭环过程,通过数据的汇集、分析和应用指导一线工作,再加强点对点、不间断、滚动式动态管理和数据及时更新,形成信息回路,进而促进数据更加准确、更具实效。上海、北京、江西等地都进行了有益的尝试。一是技术体系的精密化搭建。上海市在疫情爆发初始,充分利用原有的公共安全大数据平台,通过灵活调度现有的数据流、计算流、业务流等配置工具,迅速、精密地搭建起了一套疫情防控分析技术服务体系,实现了零系统搭建和零成本投入。二是数据指令的精准化到达。北京市朝阳区着力打通数据链的最后一公里,形成数据闭环。通过移动终端向一线人员推送指令的同时,灵活配置对应的业务反馈内容,使前方工作情况也能够第一时间返回防疫指挥部,形成了“即时分析、即时推送、即时处置、即时反馈”的闭环数据流程。三是动态数据的精细化把控。南昌市充分发挥个人健康码在社区住户、企业单位、场站馆所、检查站点四大阵地的采集作用,督促市民开展规范登记,开展不间断数据滚动摸排,通过网络监测随时掌握防控形势。

三、关于加强大数据在突发公共卫生事件应急处置的几点思考

现在武汉保卫战还在继续,北京海致等专业大数据公司协同政府部门所构建的大数据应用体系在本次疫情防控过程中发挥了积极作用,也让我们深刻认识到进一步创新公共卫生安全事件的数据治理模式势在必行。立足长远,我们认为以下几方面工作亟待推进:

一是建立标准化的数据采集机制。任何突发事件的本质特征是不可预知性,因此建立有针对性的、规范的、灵活的数据采集机制是下一步需要解决的重要问题。应加快推进在互联网、物联网、政务网和移动通讯网等多平台建立公共卫生安全应急数据采集标准,以立法的形式对相关大数据产品、服务、系统建设等设立强制标准,形成应急数据的采集保障机制。

二是建立多元化的数据共享机制。加快城市公共卫生安全数据体系的建设,不应把重点放在大一统的数据体系建设上,而应该按照“临时共享、按需接入”的原则,建立相关部门、单位的数据资源登记备案制度,做到数据、接口、服务、应用四个清楚,出台数据征调接入流程、接口技术标准和共享授权应用的配套标准,形成数据的共享保障机制。

三是建立专业化的数据应急体系。在建设基础系统平台之外,针对突发事件处置,要脱离过去项目建设型的应急系统建设思路,转为选择产品化程度高、通用化能力强、部署投用快、业务支撑活、运行体系全的大数据通用数据平台产品,整合关键装备、核心软件和运营平台等多种要素,从根本上提升应对响应的效率和能力。

四是建立实战化的数据运行规范。应制定针对实战的数据技术应急运行规范,除了明确相关要素的评选、备案、采购、核查等机制以外,应重点推动相关要素的运行维护、应急演练、战时征调等一系列运行工作规范的制定,确保人尽其责、物尽其用、能尽其显。

五是建立系统化的数据生态体系。鼓励相关科研院所、科技企业主动承担起公共安全应急社会责任,参考美国“9.11”后扶持Palantir等一批高科技企业的做法,综合运用好政府的投资、税收和政策支持,引导一批新型大数据公司和人工智能公司够脱颖而出,形成专业化人才、产品、技术梯队,提供系统的公共安全应急处置技术保障。

(本文转自人民日报客户端,属人民论坛原创内容,作者为上海体育学院创新创业学院副院长)

相关资讯