疫情期间,防控大数据产品都有着怎样的逻辑?

2024-05-08 23:48

本文主要是介绍疫情期间,防控大数据产品都有着怎样的逻辑?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、疫情期间有哪些痛点?

新型冠状病毒肺炎此次的疫情导致的全国各地、企业、居民住宅区进入并维持紧急的状态。

①相关政府机构、企业单位及居委会等如何在各交通工具关卡识别流动人员是否去过疫情高发地、如武汉?

②各居民如何降低碰到确诊及疑似病例后中招的风险?

③各居民如何在中招后快速找到能够确诊的医院?

④各居民如何及时了解疫情实时情况,保持敏感度?

⑤各小区如何获取小区居民现状信息及物资发放预约?

围绕这5大痛点,疫情期间相对有技术实力及数据实力的企业机构也在快速响应,产生了能够不同程度解决以上问题的系列产品。

本文主要从针对同样痛点的产品系列中精选出部分优质产品,在分享这些独特的产品同时,也对背后的产品实现逻辑及数据逻辑做出相应的解析。

二、疫情期间针对各种痛点,有哪些成熟的产品

猎人看了比较多的产品,其实严格来说就分3种:

  • 第一种是纯粹的用户信息主动登记,管理员后台人工审核识别是否有异常,然后再进行下一步排查;
  • 第二种是通过爬虫手段,监控网络、公众号、各官方网站公布的疫情相关的数据,例如确诊人数、疑似病例,这些确认及疑似曾经的行为轨迹,时间节点等,整合成产品;
  • 第三种相对依靠数据,没有全国性或覆盖大部分用户群体的数据量,是做不出来的,例如腾讯、百度等互联网巨头(基于GPS数据)、例如运营商(基于基站数据)、例如数据宝(基于高速及铁路数据)。通过核心的数据类型针对性作出的能够识别或筛选是否有过疫情地出没或疫情确认人员接触概率的产品。

2.1 居民信息采集登记类产品

2.2.1 居民登记管理(小区住户、返城、返工等)

以下是居民登记的基本页面,只展示部分截图。此类页面主要给各住宅区的居民主动填写个人信息,其实主要目的是为了让居民主动上报近期出行轨迹,例如有无去过疫情地等。主要解决的是各居委会流动人口疫情期间的活动轨迹线上录入。

(想法是好的,此类产品也是相对容易开发出来的,技术含量不高,因此可以在小程序或公众号可以看到各种公司开发的登记产品入口。但上报的数据信息,除了个人姓名身份证信息有接口可以识别外,主动上报的出行轨迹无法判断真伪。)

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.2.2 物资预约及发放管理

疫情期间最稀缺的大众必须物资非口罩莫属,因此无论出远门的还是出门买菜的短途需求,都必须要戴口罩。只要是不在家里蹲的,没口罩除了会增大被感染几率,还纷纷会被管控工作人员教育。

也因为口罩稀缺的正常途径无法购买,所以有危机意识的人们,特别是要经常出门的复工人员都非常主动寻找线上口罩预约登记购买的产品入口,当然各居委会也是积极使用这类工具积极参与口罩计划经济计划。

同时物资预约前往往需要先详细登记你的居民信息。如果是线下的就随便登记个住所信息及个人身份信息即可。

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

居民信息采集登记类产品,现在还有很多形态,例如在出高铁站时或者在高速卡口上,都有二维码需要乘客或车主主动录入信息及轨迹用于同行快速排查。如何实现真实性判断,其实需要拥有用户及车主全国轨迹大数据的机构支持。

另外居民登记类产品如果是主要给各小区使用,如果小区不提供区内人员的身份信息实现线上的匹对,那大部分情况需要居民带着租赁合同及身份证信息去到相关定点做线下审核匹对。

2.2 爬虫为主的收集汇总实时更新类产品

2.2.1 新型冠状病毒肺炎确诊患者同行程查询工具

你或你身边熟悉的人只要出过门,不管远近,都会担心去过的地方或乘坐的交通工具上是否有潜在感染的危险。因此出门前及出门后的群体都希望有这样的工具可以查询同行程查询工具孕育而出。

只要有一定的爬虫技术能力的公司都可以实现,只要能实时获取各官方媒体公布的确诊用户轨迹信息,然后整合配对挖掘分析形成一张列表即可。

产品特点:1:1查询,对使用者来说属于周期性非高频产品。

除了自己有车的,及坐私家车出行的群体外,坐飞机、火车、地图、长途大巴、公交车、出租车、轮船的群体,及户外活动时的一些场所,都有可能近距离接触过疫情确诊或潜伏期的患者。但大众需要有这样的一个工具可以根据交通工具的时间、车次、车厢、班次等信息查询是否有确诊患者同行的工具,有的话可以及时去医院检查确认。其实也是可以起到一定的互相监督的作用。

而这样的产品内的数据均搜集自各官方公众号/微博/网站发布的信息,其实就是通过爬虫手段收集相关涉及监控关键词的文章内容,然后在文章中抽取相应的字段,例如发布日期、车次(班次)、发车及到达场地、工具类型、车厢情况(座位号、车牌号等)、出发时间、结束时间等。形成表格,并设置好索引查询逻辑及体现逻辑即可。

数据的准确性一般是通过只采集官方的媒体文章,然后数据最新发布日期需要对首发文章进行一定的识别。

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.2.2 腾讯疫情实时追踪

2.2.2.1 腾讯疫情地图

产品特点:1:1查询,对使用者来说属于周期性非高频但每天早晚空闲都会上去看看的,周期性TO C的流量入口产品。

腾讯凭借其强大的技术力量,推出的疫情实时追踪产品集合了多个相对容易实现同时是大众关心疫情数据,满足大众实时获取疫情数据,进展,谣言,治疗及通过公开确诊患者的轨迹提醒周报群体勿随意走动的同事,及时发现轨迹重合的,加强对感染的评估。

疫情期间,每天起床第一件事情,大众最关心的莫过于昨天确诊新增数量、治愈人数及死亡人数。

数据来源:全部数据来源于国家卫健委、各省市卫健委、各省市区政府及港澳台官方渠道。

实时数据方面,腾讯新闻的统计方法如下:

  1. 国家卫健委公布数据时,全国总数与国家卫健委保持一致。
  2. 各省卫健委陆续公布数据,如果各省数据总和已经超过之前国家卫健委总数,则直接使用各省数据总和作为全国总数。(“疑似病例”仅使用国家卫健委每天公布的共有疑似病例总数,而不做新增累计)
  3. “较上日”是指每两天间的新增数值,由当前的全国总数减去国家卫健委前一天公布的数据得到。这个值会随着全国总数的变动而实时变化。
  4. 疑似病例的“较上日”数据由两日全国疑似病例总数相减得到。由于疑似病例既会新增,也会随着确诊和排除而减少,该差值会小于国家卫健委公布的“新增疑似病例数”。
  5. 各省卫健委公布数据的发布时间和统计时间段各不相同,故而会在部分时段出现国家总数不等于分省数据之和。

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.2.2.2 腾讯疫情最新进展

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.2.2.3 腾讯疫情辟谣信息

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.2.2.4 腾讯疫情医疗救治医院查询

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.2.2.5 腾讯确诊患者活动轨迹速查

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.2.3 疫情小区分布

上面提到的确诊患者的活动轨迹速查,下面的疫情地图的呈现方式就相对更加直观,可以知道当前位置附件确诊用户的情况。可以给到忍不住出去浪的群体实时提醒:附近有危险,出门请三思。

这种地图类产品,也只有百度、腾讯、高德等有自己地图产品的公司才做的出来,其他公司做了类似的查询接口背后都是基于这几家的能力或直接是页面嵌入而已。

2.2.3.1 高德疫情地图

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.2.3.2 腾讯疫情地图

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.3 全国特殊大数据定制化产品

以下的产品如果开发公司没有特色的数据或数据来源,是没法实现的。而这些已实现的产品都是现在政府非常感兴趣及可以发挥比较大作用的。政府领导们现在最关注的的是流动人员通过主要交通工具的迁徙情况,用于决策参考。

流动人员的真实性迁徙轨迹,特别是疫情地近期出没情况,需要有真实数据可以体现,防止流动人员谎报。

2.3.1 腾讯流动人口迁徙图(按交通工具区分)

迁徙图其实百度也有,但百度的是全国开发迁徙情况,不区分交通工具的。而腾讯的是可以区分汽车、货车、飞机交通工具的迁徙情况,相对来说更有参考价值。因为人口迁徙主要的交通工具就这3块。

那腾讯如何区分迁徙人员是通过汽车还是货车还是飞机的呢?

其实仅从GPS的两点的定位经纬度及两点间耗费的时间,其实就比较容易区分了。铁路有自己的铁路轨迹,铁路站点有自己的经纬度,速度也与汽车的速度有区别。

而飞机仅从一部手机的飞行模式的关闭及开启时的GPS打点位置及开关时间一计算也就出来了啦。其他的细节这里就不讨论了。

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.3.2 运营商大数据:通过用户手机号授权判断是否有与疫情确认人员接触

如果说全中国覆盖人数数据位置信息最广的除了3大运营商,其他的互联网巨头可能也比不上。

但由于用户数据合规查询及隐私问题、三大运营商的体制问题,可用于疫情期间用户自己查询自证没去过疫情地的产品入口也就2月上旬才勉强上线,联通是最快实现的,移动随后(但全国数据没完全连贯),电信据说还没完全实现,还在努力。

这个工具可以给到用户遇到需要自证“清白”时,通过手机号验证码授权模式就查询进去有无到过严重疫情地区了。但严重地区具体指除了湖北省,使用界面也具体说明。这个产品当然也有缺点,如果用的是非常用手机号,或者新办的卡,那可能就无法确认是否真的没去过疫情地,出现遗漏。

除了通过这个页面查询外,3大运营商也可以直接通过短信授权查询近期出行轨迹。

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.3.3 密接人员查询

这个产品主要是中国电子科技集团技术开发的,给群众自己查询是否有可能是密切接触者。

这里的密切接触者定义:密切接触者指14天内与病毒确诊或高度疑似病例直接居住或生活在一起的成员,包括办公室同事、学校师生、同一交通工具的乘客等。

本平台重点查询的密切接触者是:最近14天内,与新冠肺炎确诊或疑似病例同乘火车、飞机位于其前后三排(共七排)以及同乘大巴的相关人员。【也就是以14天潜伏期为查询周期,14天内没接触过确诊患者的相对就是安全的。但无法识别非乘坐交通工具前的接触,这样前后三排其实也有可能遗漏部分接触过确诊患者的乘客】

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

看产品对密切接触者的定义可以看出,这个产品是接入了铁路、飞机及客运大巴的乘客身份证数据进行关联查询,但可能数据并不是全覆盖。相对来说比较准确。同时这个产品为了防止被滥用,限制用户只能每天查询三次的机会。

2.3.4 基于高速大数据

上面的产品既有通过用户身份证信息查询的,也有通过手机号查询与疫情相关的识别产品,但其实都不适用于批量的、快速的筛查场景。

数据宝基于高速大数据开发的卡口车主疫情地排查产品,在疫情期间可以给卡口工作人员快速输入车主车牌号或者通过OCR快速识别的方式,查询各地通过卡口的车辆最近是否去过湖北等疫情高发地。对于去过疫情地的车辆则用红色块提示,没去过的用绿色块提示。

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

2.3.5 基于铁路大数据

上面其实也有基于铁路大数据的用户疫情情况识别产品,但产品逻辑不太一样,密接人员查询是将有确诊班次的乘客前后三排的乘客的识别出来。而运营商的产品需要注册才行,产品流程相对较长,只合适乘客或居民查询。

但数据宝基于铁路大数据的疫情查询产品,不单可以给相关工作人员(车站工作人员、小区居委会等)快速输入居民身份证号查询居民最近是否去过湖北等疫情高发地。

对于去过疫情地的则用红色块提示,没去过的用绿色块提示。同时也可以在电脑管理后台批量提供居民身份信息,查询哪些是有去过疫情地的,可以安排人员上门询问排查,加强识别,缩小范围。

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

运营商+高速+铁路+客运+GPS的疫情防控大数据产品

三、体会

这次的疫情的影响是突然且巨大的,在这个疫情期间展露头角的各种产品都是为了让大众快速了解情况,降低恐慌,及时找到需要及可以提供医护条件的医院线索,同时也给予各地政府在信息采集、人员管控、疫情排查等方面一定的支持。

而这些产品的背后,体现了各机构对疫情不同场景的需求理解及自身技术能力及大数据资源的有机整合的综合能力。这些都需要快速的响应能力、长时间的技术积累及对大数据在不同场景特别是新场景新需求的理解及应用能力。

从部分产品的背后的数据及功能实现,也体现出各部委数据的开放在社会型协同互助是非常有效的。

这篇关于疫情期间,防控大数据产品都有着怎样的逻辑?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/971790

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

pandas数据过滤

Pandas 数据过滤方法 Pandas 提供了多种方法来过滤数据,可以根据不同的条件进行筛选。以下是一些常见的 Pandas 数据过滤方法,结合实例进行讲解,希望能帮你快速理解。 1. 基于条件筛选行 可以使用布尔索引来根据条件过滤行。 import pandas as pd# 创建示例数据data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dav

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者