媒体报道 | 百分点科技杜晓梦:数据科学的下一片“战场”

本文主要是介绍媒体报道 | 百分点科技杜晓梦:数据科学的下一片“战场”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

编者按:如今在科技领域,越来越多的女性从业者成为行业中坚力量,“她智慧”不同视⻆的思维方式,以及她们对事物的敏感度和包容性,使得这些女性领导者在企业管理过程中具有敏锐的洞察力、缜密的思辨力和透彻而深入的分析能力。

2021年,数字商业时代联合中国网开展了2021年度专题策划:科技创新中的“她观点”,以女性的视角专业解读科技创新源动力,百分点科技首席数据科学家杜晓梦受邀接受采访,以独特的视角解读了何为数据科学,它的下一片“战场”在哪里?

每秒超过1.7兆的新信息,这是现阶段数据时代为经济社会变革而提供的基础环境,伴随技术进步,人类使用智能探头、智能手机、可穿戴设备、车载设备等感测设备频率加深,导致了数据快速增长,无疑,人类近十年创造的数据比整个人类历史上创造的数据远要更为庞大。

大量的数据催生了数据分析师这个职业,然而随着社会经济对于数字手段的依赖加深,以及5G、云计算平台等新技术的加持,单纯的数据分析已无法满足经济产业对庞大数据的运用追求。所以近些年,一个名为数据科学的概念被提出,并孕育出一个新的职业,数据科学家。
在这里插入图片描述
何为数据科学?百分点科技首席数据科学家杜晓梦解释道,它是对数据进行多种方式处理的技术和流程的组合,它通过使用科学的方法、算法、流程、模型及系统来有效地提取和分析信息,以辅助决策者用来做出最优的的指令决策,为特定领域的业务带来价值。

当融合了统计学、数学、运筹学、机器学习等领域知识的数据科学运用到产业经济中时,似乎赋予了各类产业新的生命力。在数据时代,数据科学并非一时兴起,而是要开启一场革命,毫无疑问,这场革命会波及到各个产业的每项业务,伴随数据量急剧增加,有效分析数据以获得有用的商业信息已经在电商、快消、金融等行业初见成效。可以预期,不日之后,即使是初创企业,也会采用各种形式的数据分析促进业务增长。

在杜晓梦看来,现阶段数据科学已经赋予了金融、零售、地产等行业新的动能,这也是她带领的百分点数据科学实验室此前专注的业务范围,但伴随数据科学开始垂直下探,力求解决更为复杂的问题时,它的下一片“战场”在哪里?杜晓梦及她带领的实验室似乎给出了答案——数字政府。

| 数据科学的新机遇

伴随数字经济时代的到来,相比各类型单一产业而言,政府这个最为传统、保守并极为复杂的机构正在面临变革,如何做好服务型政府,如何运用数字手段让服务和治理更智能,是各级领导机构面临的实际问题。
在这里插入图片描述
就技术、理论支撑而言,政府目前可以通过采集行业企业数据,合理规划工业布局以优化产业结构;可以采集社会信息、完善社会保障体系,来增加就业率;也可以采集民生民意数据、规划执政中心,以便提高居民幸福指数。这是政府在数据时代的机遇,但同时,政府在数据采集和使用上面临诸多难题,例如,数据分散化较为严重,数据丢失严重;数据多用于统计使用,数据保存较为单一;重视结果,不重视数据筛选过程;数据质量参差不齐,共享困难等。

如何解决这些难题,是数据科学新的机遇。

| 助力政府数字升级

据悉,围绕数字政府项目,百分点数据科学实验室在杜晓梦的带领下,正在开展新的业务研究,例如应急安全生产风险预测及生态环境监测分析等便是新的方向。

在杜晓梦看来,数字政府确为一个复杂行业。她拿应急管理举例,在深圳需要做应急安全监测的企业有60多万家之多,在网格化管理的当下,基层监管者需要逐一去排查企业风险,这就导致每个管理员都疲于奔命,即便投入大量人力物力,60多万家企业也无法完全监测,只能重点监测约10万+企业,政府相关机构无法准确预测何时将人力放到哪些行业、哪些街道及哪些企业上,这时有一套安全生产领域的预测决策分析系统就显得格外重要。
在这里插入图片描述
据了解,百分点数据科学实验室团队基于企业安全生产历史数据、概况、风险指数、风险设备、企业法律文书及区域事故发生类型等各类型指标,结合企业隐患自查、政府排查等结果数据,融合数据进行建模分析,从而为政府提供监管决策辅助。例如通过收集企业危险设备的数量布局,结合行业特性和企业类型,预测企业生产事故风险,为政府提供风险区域名单,实行精准监测。

据杜晓梦介绍,通过数据科学分析后的数据模式可以明确知悉城市区域哪些街道、哪些行业是高风险性质的,整个风险隐患集中在哪。同时,数据科学要把风险进一步拆解,分为人、机、料、法、环五个方向,具体了解事故发生原因究竟是出在人为操作不当还是设备自身问题亦或是方法问题或环境因素所导致,通过具体问题具体分析,找到引发事故的高频因素,找到解决问题的重要抓手。

在各类数据分析后,各级政府就可以将重点应急资源投放在重点区域及企业之上,从治理角度上看,经过数据科学分析的数字应急管理项目,能够很细节知晓哪些区域甚至街道执法力度不足、企业自查力度不够等等,通过逐渐完善的安全生产预测决策分析系统,就可以科学、智能的指导下一步工作。
在这里插入图片描述
不过,在杜晓梦看来,在现阶段的应急安全数字化建设上,依旧存在数据漏采等问题,她表示,未来需普遍使用传感器、摄像头、智能监测设备等更为标准化的手段采集安全数据,才能得出更为客观及有效的结论。短频快的实时数据收集要比大规模、低频的数据更有价值。

其实,助力安全生产仅仅是数据科学在数字政府项目中核心作用之一。在政府行政体制改革、公共服务领域和日常管理中,政府已把大数据作为基础性战略资源逐步加以发展和运用,并开始充分落实创新发展的理念。毫无疑问,在社会治理、加强民生服务推进公共服务精准化运作、保障水、电、煤、网等民生服务上,数据科学还大有可为。显而易见,数据科学正在为依法执政提供有效数据支撑,从而达到改善政府服务质量、提高了政府决策水平、提高政务透明度等目的。

可以预见,在未来十年,数据科学为数字政府乃至数字城市做出的贡献会有跃迁式提升,如何用好数据科学这门学科,打好数字政府建设这一仗,便需要更多数据科学家探索前行。

百分点数据科学实验室成立于2015年,以“大数据科学+”为核心理念,致力于机器学习、深度学习及复杂统计理论方法的研究与创新,结合百分点科技集团业务优势,围绕应急风险预测、产业分析、区域经济分析、环境监测、消费者洞察、供应链优化、设备故障监测等业务场景,构建数据科学算法模型,落地智能决策应用、开展产学研合作、培养数据科学人才等。以AI和BI为重要支撑,数据科学实验室已服务数字城市、应急管理、生态环境、公共安全、零售、媒体出版、制造、汽车、金融等众多行业客户,帮助客户降本增效和科学决策。

注:文章转载自「 数字商业时代DigitalTimes」

这篇关于媒体报道 | 百分点科技杜晓梦:数据科学的下一片“战场”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/298483

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

关于数据埋点,你需要了解这些基本知识

产品汪每天都在和数据打交道,你知道数据来自哪里吗? 移动app端内的用户行为数据大多来自埋点,了解一些埋点知识,能和数据分析师、技术侃大山,参与到前期的数据采集,更重要是让最终的埋点数据能为我所用,否则可怜巴巴等上几个月是常有的事。   埋点类型 根据埋点方式,可以区分为: 手动埋点半自动埋点全自动埋点 秉承“任何事物都有两面性”的道理:自动程度高的,能解决通用统计,便于统一化管理,但个性化定

使用SecondaryNameNode恢复NameNode的数据

1)需求: NameNode进程挂了并且存储的数据也丢失了,如何恢复NameNode 此种方式恢复的数据可能存在小部分数据的丢失。 2)故障模拟 (1)kill -9 NameNode进程 [lytfly@hadoop102 current]$ kill -9 19886 (2)删除NameNode存储的数据(/opt/module/hadoop-3.1.4/data/tmp/dfs/na

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

Hadoop集群数据均衡之磁盘间数据均衡

生产环境,由于硬盘空间不足,往往需要增加一块硬盘。刚加载的硬盘没有数据时,可以执行磁盘数据均衡命令。(Hadoop3.x新特性) plan后面带的节点的名字必须是已经存在的,并且是需要均衡的节点。 如果节点不存在,会报如下错误: 如果节点只有一个硬盘的话,不会创建均衡计划: (1)生成均衡计划 hdfs diskbalancer -plan hadoop102 (2)执行均衡计划 hd

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

pandas数据过滤

Pandas 数据过滤方法 Pandas 提供了多种方法来过滤数据,可以根据不同的条件进行筛选。以下是一些常见的 Pandas 数据过滤方法,结合实例进行讲解,希望能帮你快速理解。 1. 基于条件筛选行 可以使用布尔索引来根据条件过滤行。 import pandas as pd# 创建示例数据data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dav

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者