成为数据专家,你只差一个Quick Insights的距离

2024-02-02 14:58

本文主要是介绍成为数据专家,你只差一个Quick Insights的距离,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

成为数据专家,你只差一个Quick Insights的距离
微软亚洲研究院
2015年12月22日
 

身处如今的大数据时代,你真的知道如何处理数据和分析数据吗?或许那些被你忽视的数据背后就暗藏着重要的商业灵感。并非人人都是数据专家,有时候你需要一些专业的软件来帮你处理数据。那么如何能快速、准确地从数据中提取最有价值的部分从而进行有效的分析呢?只会简单统计图肯定是不够的,你还需要Power BI平台最新推出的“快速洞察”(Quick Insights)功能,利用可视化的数据呈现方法以及专家级的数据洞察能力,实现快速、专业的数据分析。

Power BI是微软推出的在线服务,通过powerbi.com能够让你用最直观的方法对数据进行处理,例如查找和呈现数据、在线共享数据、团队协同合作,等等。目前,Power BI平台最新推出的“快速洞察”(Quick Insights)功能够帮助你快速找到数据背后的秘密。想要使用这个新的工具,你只需选择“Quick Insights”,并将它应用在一个已经上传到Power BI的数据集上,系统将会在大约几秒钟内从数据中搜索出你可能感兴趣的信息,如数据之间的相关性、数据内的异常点、时序数据的趋势以及周期性变化规律等等,并进行可视化呈现。当用户面对陌生的数据集不知从哪里入手进行分析时,这些自动搜索出的信息可以为用户提供有效的切入点。对于用户熟悉的数据集,Quick Insights也有可能提供超出预期的分析结果。

更好的数据分析从Quick Insights开始!

BI即商业智能(Business Intelligence, BI)。过去在商业智能领域,用户和数据分析工具之间的交互往往是单向的。具体表现为,用户用命令或者通过图形化界面告诉系统需要进行查询或者生成图表。这样系统只是被动地接受指令,对数据进行处理然后返回结果。相比之下,Quick Insights提供了双向的交互模型。当用户上传数据之后,它的算法能够主动对这些数据进行分析,将分析结果以insights的形式进行组织和排序,并将排名在前的insights提供给用户。不仅如此,Quick Insights会选择适合的数据展示方式来呈现这些insights,并配合文字说明以方便用户理解。

目前,Quick Insights提供了七种类型的insights。借助这些不同种类的insights,用户能够快速地在数据中找到关键信息。以汽车销售数据为例,倘若你上传了一份跨越多年的汽车销售记录数据,或者是一份应用软件的下载记录数据,那么如何在如此庞杂的数据中筛选出最有价值的信息呢?Quick Insights可以从以下方面提供帮助。

主因素分析:在特定维度下,分析找出对于结果影响最大的某个因素。例如汽车销售量的大部分是由一线销售贡献的。

类别优势或劣势分析:鉴别出单一维度下,相对优势或劣势突出的元素类型。例如,在消费者获取购车折扣的联系人中,一线销售和市场经理这两项,相比于其他项有明显的领先优势。

时间序列特殊点:对于时间序列数据,分析出具有异常数据的时间点。例如2012年1月到7月的某几天,消费者对于天气相关的应用软件的下载量异常的高。

时间序列的趋势:分析数据随时间变化趋势。如南美地区的折扣在逐年增加等等。

时间序列的周期性:分析数据的周期性变化趋势。如产品预算随时间呈现明显的周期性增长。

稳定的比例关系分析:找出一系列变量中有稳定比例关系的自变量与因变量。例如在汽车销售的成本核算上,一线销售所占比例基本不变。

数据关联分析:找出多个变量之间的相关性。例如折扣力度和销售量之间的正比例关系。

未来,Quick Insights还将推出时序数据的变化分析以及均匀分布分析等更多的专业分析模型供用户使用。“Power BI的新功能——Quick Insights,让你只通过点击鼠标,就能对数据使用多种分析算法并找到潜在规律,” Power BI的项目主管Patrick Baumgartner解释说。

知其一,也知其二

Quick Insights的诞生来源于两个团队的共同努力,分别是微软亚洲研究院的软件分析组(Software Analytics Group)和总部的Power BI产品团队。微软亚洲研究院软件分析组多年来在数据分析以及可视化等方面的研究和积累为Quick Insights的研发奠定了牢固的基础。

“微软亚洲研究院软件分析组的研究工作可以分为应用领域和基础研究领域,”该组的首席研究员张冬梅博士介绍道。从应用领域来说,软件分析组以软件为研究对象,主要采用数据驱动的方式解决三个方面的问题,一是软件系统的质量(Quality),如可靠性、性能、以及安全性等;二是用户体验(Experience),如用户界面、用户使用方式、以及用户黏度等等;最后是软件开发效率(Productivity)。为了解决这些应用领域中的问题,我们需要在一些基础研究领域内有相应的技术支撑,包括大规模数据存储与计算、各种数据分析算法、以及信息可视化。

张冬梅博士说:“日常工作中,我们在基础研究领域中的技术会为应用领域的研究目标提供支持;同时,我们在应用领域中遇到的挑战也为我们在基础领域的研究提供问题和灵感。事实上包括‘Quick Insights’在内,我们有很多研究课题与项目设想是基于这种‘应用领域与基础领域’相互作用的工作状态。”

在张冬梅博士和她的团队内部, Quick Insights有一个内部代号,即“IN4”项目。“IN4”的名称取自interactive(互动)、intuitive(直观)、instant(瞬时)和insights(洞察)这四个单词。这四个单词描述了Quick Insights的产品特性,更包含了微软亚洲研究院软件分析组对于这项技术的期待与追求。团队成员们希望“IN4”能让未来的数据分析过程更具互动性、更加直观、更实时快速,最后也更具智能化的洞察性。

成功的基石伴随着合作的共赢

2015年3月在微软技术节(TechFest)上,“IN4”项目首次在公司内发布。就在这场微软技术节上,“IN4”项目和Power BI首次相遇,并一拍即合。随后的几个月中,两个跨国团队密切合作,攻克了许多技术难关,迅速开发出Quick Insights的原型,随后不断完善。Power BI团队十分激动地在邮件中写道:“非常感谢微软亚洲研究院团队的支持。如果没有你们的技术,我们在智能数据分析方面的产品开发将会难以开展。正因为有了你们的帮助,我们才能如此迅速和高效地把这项让人惊喜的技术应用到Power BI中。”

今年12月,Quick Insights正式上线。在短短不到9个月的时间里,我们见证了一项技术研究向产品的转化,时间之快,在众多技术转化的合作案例中也不常见。谈及为何能在这么短的时间内从合作想法的萌芽到产品功能的发布,冬梅博士感慨这离不开两个团队的共同努力:“虽然两个团队距离遥远,甚至都没有太多面对面交流的机会,但两个团队的合作非常默契。有了想法、技术再加之以践行,合作共赢,才最终让我们的灵感‘振翅高飞’!“相信在未来,两个团队将会继续携手并进,在Power BI的平台上为用户带来更多更智能的数据分析服务。

这篇关于成为数据专家,你只差一个Quick Insights的距离的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/671082

相关文章

详谈redis跟数据库的数据同步问题

《详谈redis跟数据库的数据同步问题》文章讨论了在Redis和数据库数据一致性问题上的解决方案,主要比较了先更新Redis缓存再更新数据库和先更新数据库再更新Redis缓存两种方案,文章指出,删除R... 目录一、Redis 数据库数据一致性的解决方案1.1、更新Redis缓存、删除Redis缓存的区别二

Redis事务与数据持久化方式

《Redis事务与数据持久化方式》该文档主要介绍了Redis事务和持久化机制,事务通过将多个命令打包执行,而持久化则通过快照(RDB)和追加式文件(AOF)两种方式将内存数据保存到磁盘,以防止数据丢失... 目录一、Redis 事务1.1 事务本质1.2 数据库事务与redis事务1.2.1 数据库事务1.

Oracle Expdp按条件导出指定表数据的方法实例

《OracleExpdp按条件导出指定表数据的方法实例》:本文主要介绍Oracle的expdp数据泵方式导出特定机构和时间范围的数据,并通过parfile文件进行条件限制和配置,文中通过代码介绍... 目录1.场景描述 2.方案分析3.实验验证 3.1 parfile文件3.2 expdp命令导出4.总结

更改docker默认数据目录的方法步骤

《更改docker默认数据目录的方法步骤》本文主要介绍了更改docker默认数据目录的方法步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1.查看docker是否存在并停止该服务2.挂载镜像并安装rsync便于备份3.取消挂载备份和迁

不删数据还能合并磁盘? 让电脑C盘D盘合并并保留数据的技巧

《不删数据还能合并磁盘?让电脑C盘D盘合并并保留数据的技巧》在Windows操作系统中,合并C盘和D盘是一个相对复杂的任务,尤其是当你不希望删除其中的数据时,幸运的是,有几种方法可以实现这一目标且在... 在电脑生产时,制造商常为C盘分配较小的磁盘空间,以确保软件在运行过程中不会出现磁盘空间不足的问题。但在

Java如何接收并解析HL7协议数据

《Java如何接收并解析HL7协议数据》文章主要介绍了HL7协议及其在医疗行业中的应用,详细描述了如何配置环境、接收和解析数据,以及与前端进行交互的实现方法,文章还分享了使用7Edit工具进行调试的经... 目录一、前言二、正文1、环境配置2、数据接收:HL7Monitor3、数据解析:HL7Busines

Mybatis拦截器如何实现数据权限过滤

《Mybatis拦截器如何实现数据权限过滤》本文介绍了MyBatis拦截器的使用,通过实现Interceptor接口对SQL进行处理,实现数据权限过滤功能,通过在本地线程变量中存储数据权限相关信息,并... 目录背景基础知识MyBATis 拦截器介绍代码实战总结背景现在的项目负责人去年年底离职,导致前期规

Redis KEYS查询大批量数据替代方案

《RedisKEYS查询大批量数据替代方案》在使用Redis时,KEYS命令虽然简单直接,但其全表扫描的特性在处理大规模数据时会导致性能问题,甚至可能阻塞Redis服务,本文将介绍SCAN命令、有序... 目录前言KEYS命令问题背景替代方案1.使用 SCAN 命令2. 使用有序集合(Sorted Set)

SpringBoot整合Canal+RabbitMQ监听数据变更详解

《SpringBoot整合Canal+RabbitMQ监听数据变更详解》在现代分布式系统中,实时获取数据库的变更信息是一个常见的需求,本文将介绍SpringBoot如何通过整合Canal和Rabbit... 目录需求步骤环境搭建整合SpringBoot与Canal实现客户端Canal整合RabbitMQSp

MyBatis框架实现一个简单的数据查询操作

《MyBatis框架实现一个简单的数据查询操作》本文介绍了MyBatis框架下进行数据查询操作的详细步骤,括创建实体类、编写SQL标签、配置Mapper、开启驼峰命名映射以及执行SQL语句等,感兴趣的... 基于在前面几章我们已经学习了对MyBATis进行环境配置,并利用SqlSessionFactory核