媒体报道 | 百分点科技杜晓梦:数据科学的下一片“战场”

本文主要是介绍媒体报道 | 百分点科技杜晓梦:数据科学的下一片“战场”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

编者按:如今在科技领域,越来越多的女性从业者成为行业中坚力量,“她智慧”不同视⻆的思维方式,以及她们对事物的敏感度和包容性,使得这些女性领导者在企业管理过程中具有敏锐的洞察力、缜密的思辨力和透彻而深入的分析能力。

2021年,数字商业时代联合中国网开展了2021年度专题策划:科技创新中的“她观点”,以女性的视角专业解读科技创新源动力,百分点科技首席数据科学家杜晓梦受邀接受采访,以独特的视角解读了何为数据科学,它的下一片“战场”在哪里?

每秒超过1.7兆的新信息,这是现阶段数据时代为经济社会变革而提供的基础环境,伴随技术进步,人类使用智能探头、智能手机、可穿戴设备、车载设备等感测设备频率加深,导致了数据快速增长,无疑,人类近十年创造的数据比整个人类历史上创造的数据远要更为庞大。

大量的数据催生了数据分析师这个职业,然而随着社会经济对于数字手段的依赖加深,以及5G、云计算平台等新技术的加持,单纯的数据分析已无法满足经济产业对庞大数据的运用追求。所以近些年,一个名为数据科学的概念被提出,并孕育出一个新的职业,数据科学家。
在这里插入图片描述
何为数据科学?百分点科技首席数据科学家杜晓梦解释道,它是对数据进行多种方式处理的技术和流程的组合,它通过使用科学的方法、算法、流程、模型及系统来有效地提取和分析信息,以辅助决策者用来做出最优的的指令决策,为特定领域的业务带来价值。

当融合了统计学、数学、运筹学、机器学习等领域知识的数据科学运用到产业经济中时,似乎赋予了各类产业新的生命力。在数据时代,数据科学并非一时兴起,而是要开启一场革命,毫无疑问,这场革命会波及到各个产业的每项业务,伴随数据量急剧增加,有效分析数据以获得有用的商业信息已经在电商、快消、金融等行业初见成效。可以预期,不日之后,即使是初创企业,也会采用各种形式的数据分析促进业务增长。

在杜晓梦看来,现阶段数据科学已经赋予了金融、零售、地产等行业新的动能,这也是她带领的百分点数据科学实验室此前专注的业务范围,但伴随数据科学开始垂直下探,力求解决更为复杂的问题时,它的下一片“战场”在哪里?杜晓梦及她带领的实验室似乎给出了答案——数字政府。

| 数据科学的新机遇

伴随数字经济时代的到来,相比各类型单一产业而言,政府这个最为传统、保守并极为复杂的机构正在面临变革,如何做好服务型政府,如何运用数字手段让服务和治理更智能,是各级领导机构面临的实际问题。
在这里插入图片描述
就技术、理论支撑而言,政府目前可以通过采集行业企业数据,合理规划工业布局以优化产业结构;可以采集社会信息、完善社会保障体系,来增加就业率;也可以采集民生民意数据、规划执政中心,以便提高居民幸福指数。这是政府在数据时代的机遇,但同时,政府在数据采集和使用上面临诸多难题,例如,数据分散化较为严重,数据丢失严重;数据多用于统计使用,数据保存较为单一;重视结果,不重视数据筛选过程;数据质量参差不齐,共享困难等。

如何解决这些难题,是数据科学新的机遇。

| 助力政府数字升级

据悉,围绕数字政府项目,百分点数据科学实验室在杜晓梦的带领下,正在开展新的业务研究,例如应急安全生产风险预测及生态环境监测分析等便是新的方向。

在杜晓梦看来,数字政府确为一个复杂行业。她拿应急管理举例,在深圳需要做应急安全监测的企业有60多万家之多,在网格化管理的当下,基层监管者需要逐一去排查企业风险,这就导致每个管理员都疲于奔命,即便投入大量人力物力,60多万家企业也无法完全监测,只能重点监测约10万+企业,政府相关机构无法准确预测何时将人力放到哪些行业、哪些街道及哪些企业上,这时有一套安全生产领域的预测决策分析系统就显得格外重要。
在这里插入图片描述
据了解,百分点数据科学实验室团队基于企业安全生产历史数据、概况、风险指数、风险设备、企业法律文书及区域事故发生类型等各类型指标,结合企业隐患自查、政府排查等结果数据,融合数据进行建模分析,从而为政府提供监管决策辅助。例如通过收集企业危险设备的数量布局,结合行业特性和企业类型,预测企业生产事故风险,为政府提供风险区域名单,实行精准监测。

据杜晓梦介绍,通过数据科学分析后的数据模式可以明确知悉城市区域哪些街道、哪些行业是高风险性质的,整个风险隐患集中在哪。同时,数据科学要把风险进一步拆解,分为人、机、料、法、环五个方向,具体了解事故发生原因究竟是出在人为操作不当还是设备自身问题亦或是方法问题或环境因素所导致,通过具体问题具体分析,找到引发事故的高频因素,找到解决问题的重要抓手。

在各类数据分析后,各级政府就可以将重点应急资源投放在重点区域及企业之上,从治理角度上看,经过数据科学分析的数字应急管理项目,能够很细节知晓哪些区域甚至街道执法力度不足、企业自查力度不够等等,通过逐渐完善的安全生产预测决策分析系统,就可以科学、智能的指导下一步工作。
在这里插入图片描述
不过,在杜晓梦看来,在现阶段的应急安全数字化建设上,依旧存在数据漏采等问题,她表示,未来需普遍使用传感器、摄像头、智能监测设备等更为标准化的手段采集安全数据,才能得出更为客观及有效的结论。短频快的实时数据收集要比大规模、低频的数据更有价值。

其实,助力安全生产仅仅是数据科学在数字政府项目中核心作用之一。在政府行政体制改革、公共服务领域和日常管理中,政府已把大数据作为基础性战略资源逐步加以发展和运用,并开始充分落实创新发展的理念。毫无疑问,在社会治理、加强民生服务推进公共服务精准化运作、保障水、电、煤、网等民生服务上,数据科学还大有可为。显而易见,数据科学正在为依法执政提供有效数据支撑,从而达到改善政府服务质量、提高了政府决策水平、提高政务透明度等目的。

可以预见,在未来十年,数据科学为数字政府乃至数字城市做出的贡献会有跃迁式提升,如何用好数据科学这门学科,打好数字政府建设这一仗,便需要更多数据科学家探索前行。

百分点数据科学实验室成立于2015年,以“大数据科学+”为核心理念,致力于机器学习、深度学习及复杂统计理论方法的研究与创新,结合百分点科技集团业务优势,围绕应急风险预测、产业分析、区域经济分析、环境监测、消费者洞察、供应链优化、设备故障监测等业务场景,构建数据科学算法模型,落地智能决策应用、开展产学研合作、培养数据科学人才等。以AI和BI为重要支撑,数据科学实验室已服务数字城市、应急管理、生态环境、公共安全、零售、媒体出版、制造、汽车、金融等众多行业客户,帮助客户降本增效和科学决策。

注:文章转载自「 数字商业时代DigitalTimes」

这篇关于媒体报道 | 百分点科技杜晓梦:数据科学的下一片“战场”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/298483

相关文章

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

Linux使用dd命令来复制和转换数据的操作方法

《Linux使用dd命令来复制和转换数据的操作方法》Linux中的dd命令是一个功能强大的数据复制和转换实用程序,它以较低级别运行,通常用于创建可启动的USB驱动器、克隆磁盘和生成随机数据等任务,本文... 目录简介功能和能力语法常用选项示例用法基础用法创建可启动www.chinasem.cn的 USB 驱动

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Python实现将实体类列表数据导出到Excel文件

《Python实现将实体类列表数据导出到Excel文件》在数据处理和报告生成中,将实体类的列表数据导出到Excel文件是一项常见任务,Python提供了多种库来实现这一目标,下面就来跟随小编一起学习一... 目录一、环境准备二、定义实体类三、创建实体类列表四、将实体类列表转换为DataFrame五、导出Da

Python实现数据清洗的18种方法

《Python实现数据清洗的18种方法》本文主要介绍了Python实现数据清洗的18种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录1. 去除字符串两边空格2. 转换数据类型3. 大小写转换4. 移除列表中的重复元素5. 快速统

Python数据处理之导入导出Excel数据方式

《Python数据处理之导入导出Excel数据方式》Python是Excel数据处理的绝佳工具,通过Pandas和Openpyxl等库可以实现数据的导入、导出和自动化处理,从基础的数据读取和清洗到复杂... 目录python导入导出Excel数据开启数据之旅:为什么Python是Excel数据处理的最佳拍档

在Pandas中进行数据重命名的方法示例

《在Pandas中进行数据重命名的方法示例》Pandas作为Python中最流行的数据处理库,提供了强大的数据操作功能,其中数据重命名是常见且基础的操作之一,本文将通过简洁明了的讲解和丰富的代码示例,... 目录一、引言二、Pandas rename方法简介三、列名重命名3.1 使用字典进行列名重命名3.编