媒体报道 | 百分点科技杜晓梦:数据科学的下一片“战场”

本文主要是介绍媒体报道 | 百分点科技杜晓梦:数据科学的下一片“战场”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

编者按:如今在科技领域,越来越多的女性从业者成为行业中坚力量,“她智慧”不同视⻆的思维方式,以及她们对事物的敏感度和包容性,使得这些女性领导者在企业管理过程中具有敏锐的洞察力、缜密的思辨力和透彻而深入的分析能力。

2021年,数字商业时代联合中国网开展了2021年度专题策划:科技创新中的“她观点”,以女性的视角专业解读科技创新源动力,百分点科技首席数据科学家杜晓梦受邀接受采访,以独特的视角解读了何为数据科学,它的下一片“战场”在哪里?

每秒超过1.7兆的新信息,这是现阶段数据时代为经济社会变革而提供的基础环境,伴随技术进步,人类使用智能探头、智能手机、可穿戴设备、车载设备等感测设备频率加深,导致了数据快速增长,无疑,人类近十年创造的数据比整个人类历史上创造的数据远要更为庞大。

大量的数据催生了数据分析师这个职业,然而随着社会经济对于数字手段的依赖加深,以及5G、云计算平台等新技术的加持,单纯的数据分析已无法满足经济产业对庞大数据的运用追求。所以近些年,一个名为数据科学的概念被提出,并孕育出一个新的职业,数据科学家。
在这里插入图片描述
何为数据科学?百分点科技首席数据科学家杜晓梦解释道,它是对数据进行多种方式处理的技术和流程的组合,它通过使用科学的方法、算法、流程、模型及系统来有效地提取和分析信息,以辅助决策者用来做出最优的的指令决策,为特定领域的业务带来价值。

当融合了统计学、数学、运筹学、机器学习等领域知识的数据科学运用到产业经济中时,似乎赋予了各类产业新的生命力。在数据时代,数据科学并非一时兴起,而是要开启一场革命,毫无疑问,这场革命会波及到各个产业的每项业务,伴随数据量急剧增加,有效分析数据以获得有用的商业信息已经在电商、快消、金融等行业初见成效。可以预期,不日之后,即使是初创企业,也会采用各种形式的数据分析促进业务增长。

在杜晓梦看来,现阶段数据科学已经赋予了金融、零售、地产等行业新的动能,这也是她带领的百分点数据科学实验室此前专注的业务范围,但伴随数据科学开始垂直下探,力求解决更为复杂的问题时,它的下一片“战场”在哪里?杜晓梦及她带领的实验室似乎给出了答案——数字政府。

| 数据科学的新机遇

伴随数字经济时代的到来,相比各类型单一产业而言,政府这个最为传统、保守并极为复杂的机构正在面临变革,如何做好服务型政府,如何运用数字手段让服务和治理更智能,是各级领导机构面临的实际问题。
在这里插入图片描述
就技术、理论支撑而言,政府目前可以通过采集行业企业数据,合理规划工业布局以优化产业结构;可以采集社会信息、完善社会保障体系,来增加就业率;也可以采集民生民意数据、规划执政中心,以便提高居民幸福指数。这是政府在数据时代的机遇,但同时,政府在数据采集和使用上面临诸多难题,例如,数据分散化较为严重,数据丢失严重;数据多用于统计使用,数据保存较为单一;重视结果,不重视数据筛选过程;数据质量参差不齐,共享困难等。

如何解决这些难题,是数据科学新的机遇。

| 助力政府数字升级

据悉,围绕数字政府项目,百分点数据科学实验室在杜晓梦的带领下,正在开展新的业务研究,例如应急安全生产风险预测及生态环境监测分析等便是新的方向。

在杜晓梦看来,数字政府确为一个复杂行业。她拿应急管理举例,在深圳需要做应急安全监测的企业有60多万家之多,在网格化管理的当下,基层监管者需要逐一去排查企业风险,这就导致每个管理员都疲于奔命,即便投入大量人力物力,60多万家企业也无法完全监测,只能重点监测约10万+企业,政府相关机构无法准确预测何时将人力放到哪些行业、哪些街道及哪些企业上,这时有一套安全生产领域的预测决策分析系统就显得格外重要。
在这里插入图片描述
据了解,百分点数据科学实验室团队基于企业安全生产历史数据、概况、风险指数、风险设备、企业法律文书及区域事故发生类型等各类型指标,结合企业隐患自查、政府排查等结果数据,融合数据进行建模分析,从而为政府提供监管决策辅助。例如通过收集企业危险设备的数量布局,结合行业特性和企业类型,预测企业生产事故风险,为政府提供风险区域名单,实行精准监测。

据杜晓梦介绍,通过数据科学分析后的数据模式可以明确知悉城市区域哪些街道、哪些行业是高风险性质的,整个风险隐患集中在哪。同时,数据科学要把风险进一步拆解,分为人、机、料、法、环五个方向,具体了解事故发生原因究竟是出在人为操作不当还是设备自身问题亦或是方法问题或环境因素所导致,通过具体问题具体分析,找到引发事故的高频因素,找到解决问题的重要抓手。

在各类数据分析后,各级政府就可以将重点应急资源投放在重点区域及企业之上,从治理角度上看,经过数据科学分析的数字应急管理项目,能够很细节知晓哪些区域甚至街道执法力度不足、企业自查力度不够等等,通过逐渐完善的安全生产预测决策分析系统,就可以科学、智能的指导下一步工作。
在这里插入图片描述
不过,在杜晓梦看来,在现阶段的应急安全数字化建设上,依旧存在数据漏采等问题,她表示,未来需普遍使用传感器、摄像头、智能监测设备等更为标准化的手段采集安全数据,才能得出更为客观及有效的结论。短频快的实时数据收集要比大规模、低频的数据更有价值。

其实,助力安全生产仅仅是数据科学在数字政府项目中核心作用之一。在政府行政体制改革、公共服务领域和日常管理中,政府已把大数据作为基础性战略资源逐步加以发展和运用,并开始充分落实创新发展的理念。毫无疑问,在社会治理、加强民生服务推进公共服务精准化运作、保障水、电、煤、网等民生服务上,数据科学还大有可为。显而易见,数据科学正在为依法执政提供有效数据支撑,从而达到改善政府服务质量、提高了政府决策水平、提高政务透明度等目的。

可以预见,在未来十年,数据科学为数字政府乃至数字城市做出的贡献会有跃迁式提升,如何用好数据科学这门学科,打好数字政府建设这一仗,便需要更多数据科学家探索前行。

百分点数据科学实验室成立于2015年,以“大数据科学+”为核心理念,致力于机器学习、深度学习及复杂统计理论方法的研究与创新,结合百分点科技集团业务优势,围绕应急风险预测、产业分析、区域经济分析、环境监测、消费者洞察、供应链优化、设备故障监测等业务场景,构建数据科学算法模型,落地智能决策应用、开展产学研合作、培养数据科学人才等。以AI和BI为重要支撑,数据科学实验室已服务数字城市、应急管理、生态环境、公共安全、零售、媒体出版、制造、汽车、金融等众多行业客户,帮助客户降本增效和科学决策。

注:文章转载自「 数字商业时代DigitalTimes」

这篇关于媒体报道 | 百分点科技杜晓梦:数据科学的下一片“战场”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/298483

相关文章

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解

Oracle存储过程里操作BLOB的字节数据的办法

《Oracle存储过程里操作BLOB的字节数据的办法》该篇文章介绍了如何在Oracle存储过程中操作BLOB的字节数据,作者研究了如何获取BLOB的字节长度、如何使用DBMS_LOB包进行BLOB操作... 目录一、缘由二、办法2.1 基本操作2.2 DBMS_LOB包2.3 字节级操作与RAW数据类型2.