成为数据专家,你只差一个Quick Insights的距离

2024-02-02 14:58

本文主要是介绍成为数据专家,你只差一个Quick Insights的距离,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

成为数据专家,你只差一个Quick Insights的距离
微软亚洲研究院
2015年12月22日
 

身处如今的大数据时代,你真的知道如何处理数据和分析数据吗?或许那些被你忽视的数据背后就暗藏着重要的商业灵感。并非人人都是数据专家,有时候你需要一些专业的软件来帮你处理数据。那么如何能快速、准确地从数据中提取最有价值的部分从而进行有效的分析呢?只会简单统计图肯定是不够的,你还需要Power BI平台最新推出的“快速洞察”(Quick Insights)功能,利用可视化的数据呈现方法以及专家级的数据洞察能力,实现快速、专业的数据分析。

Power BI是微软推出的在线服务,通过powerbi.com能够让你用最直观的方法对数据进行处理,例如查找和呈现数据、在线共享数据、团队协同合作,等等。目前,Power BI平台最新推出的“快速洞察”(Quick Insights)功能够帮助你快速找到数据背后的秘密。想要使用这个新的工具,你只需选择“Quick Insights”,并将它应用在一个已经上传到Power BI的数据集上,系统将会在大约几秒钟内从数据中搜索出你可能感兴趣的信息,如数据之间的相关性、数据内的异常点、时序数据的趋势以及周期性变化规律等等,并进行可视化呈现。当用户面对陌生的数据集不知从哪里入手进行分析时,这些自动搜索出的信息可以为用户提供有效的切入点。对于用户熟悉的数据集,Quick Insights也有可能提供超出预期的分析结果。

更好的数据分析从Quick Insights开始!

BI即商业智能(Business Intelligence, BI)。过去在商业智能领域,用户和数据分析工具之间的交互往往是单向的。具体表现为,用户用命令或者通过图形化界面告诉系统需要进行查询或者生成图表。这样系统只是被动地接受指令,对数据进行处理然后返回结果。相比之下,Quick Insights提供了双向的交互模型。当用户上传数据之后,它的算法能够主动对这些数据进行分析,将分析结果以insights的形式进行组织和排序,并将排名在前的insights提供给用户。不仅如此,Quick Insights会选择适合的数据展示方式来呈现这些insights,并配合文字说明以方便用户理解。

目前,Quick Insights提供了七种类型的insights。借助这些不同种类的insights,用户能够快速地在数据中找到关键信息。以汽车销售数据为例,倘若你上传了一份跨越多年的汽车销售记录数据,或者是一份应用软件的下载记录数据,那么如何在如此庞杂的数据中筛选出最有价值的信息呢?Quick Insights可以从以下方面提供帮助。

主因素分析:在特定维度下,分析找出对于结果影响最大的某个因素。例如汽车销售量的大部分是由一线销售贡献的。

类别优势或劣势分析:鉴别出单一维度下,相对优势或劣势突出的元素类型。例如,在消费者获取购车折扣的联系人中,一线销售和市场经理这两项,相比于其他项有明显的领先优势。

时间序列特殊点:对于时间序列数据,分析出具有异常数据的时间点。例如2012年1月到7月的某几天,消费者对于天气相关的应用软件的下载量异常的高。

时间序列的趋势:分析数据随时间变化趋势。如南美地区的折扣在逐年增加等等。

时间序列的周期性:分析数据的周期性变化趋势。如产品预算随时间呈现明显的周期性增长。

稳定的比例关系分析:找出一系列变量中有稳定比例关系的自变量与因变量。例如在汽车销售的成本核算上,一线销售所占比例基本不变。

数据关联分析:找出多个变量之间的相关性。例如折扣力度和销售量之间的正比例关系。

未来,Quick Insights还将推出时序数据的变化分析以及均匀分布分析等更多的专业分析模型供用户使用。“Power BI的新功能——Quick Insights,让你只通过点击鼠标,就能对数据使用多种分析算法并找到潜在规律,” Power BI的项目主管Patrick Baumgartner解释说。

知其一,也知其二

Quick Insights的诞生来源于两个团队的共同努力,分别是微软亚洲研究院的软件分析组(Software Analytics Group)和总部的Power BI产品团队。微软亚洲研究院软件分析组多年来在数据分析以及可视化等方面的研究和积累为Quick Insights的研发奠定了牢固的基础。

“微软亚洲研究院软件分析组的研究工作可以分为应用领域和基础研究领域,”该组的首席研究员张冬梅博士介绍道。从应用领域来说,软件分析组以软件为研究对象,主要采用数据驱动的方式解决三个方面的问题,一是软件系统的质量(Quality),如可靠性、性能、以及安全性等;二是用户体验(Experience),如用户界面、用户使用方式、以及用户黏度等等;最后是软件开发效率(Productivity)。为了解决这些应用领域中的问题,我们需要在一些基础研究领域内有相应的技术支撑,包括大规模数据存储与计算、各种数据分析算法、以及信息可视化。

张冬梅博士说:“日常工作中,我们在基础研究领域中的技术会为应用领域的研究目标提供支持;同时,我们在应用领域中遇到的挑战也为我们在基础领域的研究提供问题和灵感。事实上包括‘Quick Insights’在内,我们有很多研究课题与项目设想是基于这种‘应用领域与基础领域’相互作用的工作状态。”

在张冬梅博士和她的团队内部, Quick Insights有一个内部代号,即“IN4”项目。“IN4”的名称取自interactive(互动)、intuitive(直观)、instant(瞬时)和insights(洞察)这四个单词。这四个单词描述了Quick Insights的产品特性,更包含了微软亚洲研究院软件分析组对于这项技术的期待与追求。团队成员们希望“IN4”能让未来的数据分析过程更具互动性、更加直观、更实时快速,最后也更具智能化的洞察性。

成功的基石伴随着合作的共赢

2015年3月在微软技术节(TechFest)上,“IN4”项目首次在公司内发布。就在这场微软技术节上,“IN4”项目和Power BI首次相遇,并一拍即合。随后的几个月中,两个跨国团队密切合作,攻克了许多技术难关,迅速开发出Quick Insights的原型,随后不断完善。Power BI团队十分激动地在邮件中写道:“非常感谢微软亚洲研究院团队的支持。如果没有你们的技术,我们在智能数据分析方面的产品开发将会难以开展。正因为有了你们的帮助,我们才能如此迅速和高效地把这项让人惊喜的技术应用到Power BI中。”

今年12月,Quick Insights正式上线。在短短不到9个月的时间里,我们见证了一项技术研究向产品的转化,时间之快,在众多技术转化的合作案例中也不常见。谈及为何能在这么短的时间内从合作想法的萌芽到产品功能的发布,冬梅博士感慨这离不开两个团队的共同努力:“虽然两个团队距离遥远,甚至都没有太多面对面交流的机会,但两个团队的合作非常默契。有了想法、技术再加之以践行,合作共赢,才最终让我们的灵感‘振翅高飞’!“相信在未来,两个团队将会继续携手并进,在Power BI的平台上为用户带来更多更智能的数据分析服务。

这篇关于成为数据专家,你只差一个Quick Insights的距离的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/671082

相关文章

Python获取中国节假日数据记录入JSON文件

《Python获取中国节假日数据记录入JSON文件》项目系统内置的日历应用为了提升用户体验,特别设置了在调休日期显示“休”的UI图标功能,那么问题是这些调休数据从哪里来呢?我尝试一种更为智能的方法:P... 目录节假日数据获取存入jsON文件节假日数据读取封装完整代码项目系统内置的日历应用为了提升用户体验,

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解

Oracle存储过程里操作BLOB的字节数据的办法

《Oracle存储过程里操作BLOB的字节数据的办法》该篇文章介绍了如何在Oracle存储过程中操作BLOB的字节数据,作者研究了如何获取BLOB的字节长度、如何使用DBMS_LOB包进行BLOB操作... 目录一、缘由二、办法2.1 基本操作2.2 DBMS_LOB包2.3 字节级操作与RAW数据类型2.