分享|Strata“梅开二度”:未来属于知道如何使用数据的人

2023-10-14 19:30

本文主要是介绍分享|Strata“梅开二度”:未来属于知道如何使用数据的人,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Strata会议讲师PPT已经陆续上线,点击阅读原文可以看到更多信息。


本文转自“中国云报”公众号。


7月13-15日,全球最顶级的大数据会议Strata Data Conference在京举办。


Strata大会由O'Reilly Media和Cloudera联合举办,被《福布斯》杂志誉为“大数据运动的里程碑”。2016年Strata大会首次从硅谷走进北京,今年再次登陆中国。会议聚焦于数据、机器学习及分析数据如何改变商业和社会本身,吸引了大数据、人工智能领域最具影响力的产业决策者、数据科学家与架构师等参会。


AI是核心话题


本次Strata大数据议题涵盖了完整的数据生态系统,其中包括:



·AI应用——如何实现人工智能在现实生活中的应用

·数据科学&高级分析——如何将大数据生态系统中的各个部分与产品结合

·数据工程和架构——从最新的机器学习到文化改革等角度对数据从业人员的深入研究

·企业应用——大型机构是如何利用大数据、数据科学、机器学习和分析决策的

·物联网&实时计算——收集、分析和理解相关事物产生的数据




本次会议邀请到了国内外在人工智能、深度学习、机器学习等领域具有前沿领先技术的公司以及在这些领域进行着深入探索和研究的专家学者,他们作了精彩的主题演讲并和与会者分享了当前最受关注的技术和话题。其中有来自:


·百度深度学习实验室主任林元庆博士:DuFace:大规模人脸识别;

·滴滴出行研究院副院长叶杰平:大数据在滴滴出行的应用;

·腾讯AI Lab强化学习中心总监刘晗:发生在腾讯AI实验室里的大数据研究

·美国Acorns首席数据科学家种骥科博士:揭秘互联网金融中的AI: 一个使命,两个循环,和六个机会

·Horizon Robotics的联合创始人Ming Yang:用于深度学习的异步计算、

·CrowdFlower的创始人Lukas Biewald:现实世界里的深度学习



除此之外,会议还邀请到了近百位嘉宾进行了议题和教学辅导课的深度分享。三天的大会,无论是企业的管理者,还是数据分析者,他们在Strata的快速社交、行业桌会、赞助商展区中相识、交流,畅谈AI以及数据中的最新、最高端的技术。倾吐彼此收获经验知识的同时,也是在促进全球数据的进步。


参加会议的既有Intel、Dell这样的老牌IT公司,也有一些迅猛崛起的初创公司,例如Kyligence——基于Apache Kylin的智能分析平台及产品; Analytics——专注于分析预测与行业应用的大数据公司; 明略数据——大数据整体解决方案提供商; 天云大数据——在Hadoop生态组件基础上,提供了独立研发的企业级组件产品BDRT; TalkingData——提供全面的产品统计分析服务、精准的移动行业数据解析; Hortonworks——基于Hadoop提供大数据服务的公司等。


驱动数据革命


作为全球计算力创新的引领者,英特尔在数据分析与人工智能领域深耕已久,希望借助性能强劲、安全可靠、且能满足细分应用市场多样化需求的计算、存储和网络基础设施平台,以端到端的全栈实力使企业用户能获得最好的数据洞察力,进而加速实现技术的民主化并释放更多创新可能。作为英特尔产品组合中的重要部分,近日全新发布的英特尔至强可扩展处理器不仅实现了性能、可靠性和可管理性方面的全面提升,也为企业提供了丰富的平台功能创新。在深度学习领域,相比3年前未经优化的服务器系统,英特尔至强可扩展处理器结合可加快交付人工智能服务的软件优化,可实现113倍性能提升。


去年年底,为了降低企业用户使用深度学习进行数据分析和构建人工智能应用的门槛,英特尔还开源了基于 Apache Spark 的分布式深度学习框架BigDL,为整个数据分析和机器学习过程提供比现有框架更加统一和集成化的体验,进一步帮助用户减少端到端的学习延迟,实现总体拥有成本的降低。

Cloudera联合创始人兼首席技术官Amr Awadallah

英特尔公司软件与服务事业部副总裁、系统技术和优化部门大数据技术总监马子雅


“能够更好满足用户需求的解决方案才会得到更好的应用。”Cloudera联合创始人兼首席技术官Amr Awadallah表示:“作为数据管理软件与服务提供商,在数据分析解决方案的构建中,我们一直与英特尔有着紧密的合作。希望借助双方在硬件创新、软件优化、行业洞察等多个方面的整合优势,持续地为企业数据分析、人工智能等提供性能最好、最稳定安全的应用环境。”


Cloudera与英特尔合作推出的数据分析解决方案已经在金融、电信、交通等不同行业获得成功部署,印证了双方在数据分析领域的强劲实力。英特尔公司软件与服务事业部副总裁兼系统技术和优化部门大数据技术总监马子雅表示:“未来,我们还将持续创新、着力构建广泛的生态环境,与Cloudera等生态合作伙伴建立更深入的合作关系,共同推动多元应用的开发,从而帮助企业实现业务上的变革和创新,驱动未来数据分析与人工智能的进一步发展。”


智能更进一步


在本次Strata上,Kyligence公司发布了其企业级大数据智能分析产品Kyligence Analytics Platform (KAP)最新版旗舰产品——KAP2.4。


作为Apache Kylin的企业级产品,KAP为用户提供了更快的性能、更好的设计工具、更多的企业级特性等。本次发布标志着KAP产品的进一步成熟,且完善了KAP作为Hadoop上的数据仓库等能力。


KAP2.4推出KyStudio建模中心,以交互式的、直观的、可拖拽式的建模体验,为用户提供零门槛上手的大数据建模体验,帮助分析师将对业务的认知无偏差地转化为数据模型。此外,拓宽用户分析场景也是KAP2.4版本的一大亮点。尽管大数据分析的影响力已在各行各业渗透,但满足各行各业不同的业务分析场景需求,始终是一大难点。


KAP2.4在推进预计算建模场景下超高性能查询体验的前提下,通过无缝集成Spark等开源大数据引擎,通过查询下压,在完全支持各种SQL on Hadoop的同时,充分利用Kylin的预计算能力提升了性能和效率,缩短了从源表导入到自助查询的时间间隔,全面支持分析师自主地探索数据的业务价值。具体到商业应用中,无论是要求高并发查询性能的生产场景,还是数据探索灵活性需求的业务探索场景,均能得到满足。

“除了对数据建模及用户分析场景进行优化,KAP2.4还通过全面增强智能建模功能提升企业建模效率。“韩卿谈道,KAP2.4全面提升了建模的智能性——为用户提供更丰富的语义层,赋予用户预定义复杂业务逻辑的能力;内置数据模型检的工具,护航建模,避免数据分布问题带来的模型重构;内置一键优化工具,协助用户设计出最优性价比的数据模型,有效降低建模的学习曲线;根据查询所需维度数,精确减少立方体构建计算量,有效缩短构建时间。


KAP2.4是目前最新的Apache Kylin企业版,具有最好的性能和易用性,同时经过了Kyligence严格的性能、兼容性等各方面的测试,与最新版本的Apache Kylin完全兼容,并已经对各大主流Hadoop发行版做了认证测试。


未来属于那些知道如何使用数据的人。未来始于Strata大会。2017年北京Strata大数据会议聚集了大数据领域最有影响力的产业决策者、战略专家、架构师、开发人员,共同探索数据科学的最前沿问题、案例研究以及最佳的实践经验。



背景 | 关于O'Reilly Media

在近40年来,O'Reilly Media一如既往地提供技术与商业培训、行业知识和前瞻洞察力去帮助企业跨越难关、迈向成功。通过公司独有的专家和改革创新者网络,在O'Reilly大会和Safari培训学习平台中,让创新型人才分享他们的专业知识和实践经验。作为一个SaaS的学习平台,Safari为数以百万计跨越企业、消费者和大学频道的用户提供了最前瞻的专业议题和全面的技术与商业学习解决方案。而Safari在线平台则提供多种学习模式,包括交互式教程、在线培训、书籍阅读、录像视频教学和公司案例研究。自2010年起O'Reilly就已在北京举办Velocity Conference。




这篇关于分享|Strata“梅开二度”:未来属于知道如何使用数据的人的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/212658

相关文章

Mysql中RelayLog中继日志的使用

《Mysql中RelayLog中继日志的使用》MySQLRelayLog中继日志是主从复制架构中的核心组件,负责将从主库获取的Binlog事件暂存并应用到从库,本文就来详细的介绍一下RelayLog中... 目录一、什么是 Relay Log(中继日志)二、Relay Log 的工作流程三、Relay Lo

使用Redis实现会话管理的示例代码

《使用Redis实现会话管理的示例代码》文章介绍了如何使用Redis实现会话管理,包括会话的创建、读取、更新和删除操作,通过设置会话超时时间并重置,可以确保会话在用户持续活动期间不会过期,此外,展示了... 目录1. 会话管理的基本概念2. 使用Redis实现会话管理2.1 引入依赖2.2 会话管理基本操作

Springboot请求和响应相关注解及使用场景分析

《Springboot请求和响应相关注解及使用场景分析》本文介绍了SpringBoot中用于处理HTTP请求和构建HTTP响应的常用注解,包括@RequestMapping、@RequestParam... 目录1. 请求处理注解@RequestMapping@GetMapping, @PostMappin

springboot3.x使用@NacosValue无法获取配置信息的解决过程

《springboot3.x使用@NacosValue无法获取配置信息的解决过程》在SpringBoot3.x中升级Nacos依赖后,使用@NacosValue无法动态获取配置,通过引入SpringC... 目录一、python问题描述二、解决方案总结一、问题描述springboot从2android.x

SpringBoot整合AOP及使用案例实战

《SpringBoot整合AOP及使用案例实战》本文详细介绍了SpringAOP中的切入点表达式,重点讲解了execution表达式的语法和用法,通过案例实战,展示了AOP的基本使用、结合自定义注解以... 目录一、 引入依赖二、切入点表达式详解三、案例实战1. AOP基本使用2. AOP结合自定义注解3.

Python中Request的安装以及简单的使用方法图文教程

《Python中Request的安装以及简单的使用方法图文教程》python里的request库经常被用于进行网络爬虫,想要学习网络爬虫的同学必须得安装request这个第三方库,:本文主要介绍P... 目录1.Requests 安装cmd 窗口安装为pycharm安装在pycharm设置中为项目安装req

使用Python将PDF表格自动提取并写入Word文档表格

《使用Python将PDF表格自动提取并写入Word文档表格》在实际办公与数据处理场景中,PDF文件里的表格往往无法直接复制到Word中,本文将介绍如何使用Python从PDF文件中提取表格数据,并将... 目录引言1. 加载 PDF 文件并准备 Word 文档2. 提取 PDF 表格并创建 Word 表格

使用Python实现局域网远程监控电脑屏幕的方法

《使用Python实现局域网远程监控电脑屏幕的方法》文章介绍了两种使用Python在局域网内实现远程监控电脑屏幕的方法,方法一使用mss和socket,方法二使用PyAutoGUI和Flask,每种方... 目录方法一:使用mss和socket实现屏幕共享服务端(被监控端)客户端(监控端)方法二:使用PyA

Python使用Matplotlib和Seaborn绘制常用图表的技巧

《Python使用Matplotlib和Seaborn绘制常用图表的技巧》Python作为数据科学领域的明星语言,拥有强大且丰富的可视化库,其中最著名的莫过于Matplotlib和Seaborn,本篇... 目录1. 引言:数据可视化的力量2. 前置知识与环境准备2.1. 必备知识2.2. 安装所需库2.3

MySQL数据目录迁移的完整过程

《MySQL数据目录迁移的完整过程》文章详细介绍了将MySQL数据目录迁移到新硬盘的整个过程,包括新硬盘挂载、创建新的数据目录、迁移数据(推荐使用两遍rsync方案)、修改MySQL配置文件和重启验证... 目录1,新硬盘挂载(如果有的话)2,创建新的 mysql 数据目录3,迁移 MySQL 数据(推荐两