分享|Strata“梅开二度”:未来属于知道如何使用数据的人

2023-10-14 19:30

本文主要是介绍分享|Strata“梅开二度”:未来属于知道如何使用数据的人,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Strata会议讲师PPT已经陆续上线,点击阅读原文可以看到更多信息。


本文转自“中国云报”公众号。


7月13-15日,全球最顶级的大数据会议Strata Data Conference在京举办。


Strata大会由O'Reilly Media和Cloudera联合举办,被《福布斯》杂志誉为“大数据运动的里程碑”。2016年Strata大会首次从硅谷走进北京,今年再次登陆中国。会议聚焦于数据、机器学习及分析数据如何改变商业和社会本身,吸引了大数据、人工智能领域最具影响力的产业决策者、数据科学家与架构师等参会。


AI是核心话题


本次Strata大数据议题涵盖了完整的数据生态系统,其中包括:



·AI应用——如何实现人工智能在现实生活中的应用

·数据科学&高级分析——如何将大数据生态系统中的各个部分与产品结合

·数据工程和架构——从最新的机器学习到文化改革等角度对数据从业人员的深入研究

·企业应用——大型机构是如何利用大数据、数据科学、机器学习和分析决策的

·物联网&实时计算——收集、分析和理解相关事物产生的数据




本次会议邀请到了国内外在人工智能、深度学习、机器学习等领域具有前沿领先技术的公司以及在这些领域进行着深入探索和研究的专家学者,他们作了精彩的主题演讲并和与会者分享了当前最受关注的技术和话题。其中有来自:


·百度深度学习实验室主任林元庆博士:DuFace:大规模人脸识别;

·滴滴出行研究院副院长叶杰平:大数据在滴滴出行的应用;

·腾讯AI Lab强化学习中心总监刘晗:发生在腾讯AI实验室里的大数据研究

·美国Acorns首席数据科学家种骥科博士:揭秘互联网金融中的AI: 一个使命,两个循环,和六个机会

·Horizon Robotics的联合创始人Ming Yang:用于深度学习的异步计算、

·CrowdFlower的创始人Lukas Biewald:现实世界里的深度学习



除此之外,会议还邀请到了近百位嘉宾进行了议题和教学辅导课的深度分享。三天的大会,无论是企业的管理者,还是数据分析者,他们在Strata的快速社交、行业桌会、赞助商展区中相识、交流,畅谈AI以及数据中的最新、最高端的技术。倾吐彼此收获经验知识的同时,也是在促进全球数据的进步。


参加会议的既有Intel、Dell这样的老牌IT公司,也有一些迅猛崛起的初创公司,例如Kyligence——基于Apache Kylin的智能分析平台及产品; Analytics——专注于分析预测与行业应用的大数据公司; 明略数据——大数据整体解决方案提供商; 天云大数据——在Hadoop生态组件基础上,提供了独立研发的企业级组件产品BDRT; TalkingData——提供全面的产品统计分析服务、精准的移动行业数据解析; Hortonworks——基于Hadoop提供大数据服务的公司等。


驱动数据革命


作为全球计算力创新的引领者,英特尔在数据分析与人工智能领域深耕已久,希望借助性能强劲、安全可靠、且能满足细分应用市场多样化需求的计算、存储和网络基础设施平台,以端到端的全栈实力使企业用户能获得最好的数据洞察力,进而加速实现技术的民主化并释放更多创新可能。作为英特尔产品组合中的重要部分,近日全新发布的英特尔至强可扩展处理器不仅实现了性能、可靠性和可管理性方面的全面提升,也为企业提供了丰富的平台功能创新。在深度学习领域,相比3年前未经优化的服务器系统,英特尔至强可扩展处理器结合可加快交付人工智能服务的软件优化,可实现113倍性能提升。


去年年底,为了降低企业用户使用深度学习进行数据分析和构建人工智能应用的门槛,英特尔还开源了基于 Apache Spark 的分布式深度学习框架BigDL,为整个数据分析和机器学习过程提供比现有框架更加统一和集成化的体验,进一步帮助用户减少端到端的学习延迟,实现总体拥有成本的降低。

Cloudera联合创始人兼首席技术官Amr Awadallah

英特尔公司软件与服务事业部副总裁、系统技术和优化部门大数据技术总监马子雅


“能够更好满足用户需求的解决方案才会得到更好的应用。”Cloudera联合创始人兼首席技术官Amr Awadallah表示:“作为数据管理软件与服务提供商,在数据分析解决方案的构建中,我们一直与英特尔有着紧密的合作。希望借助双方在硬件创新、软件优化、行业洞察等多个方面的整合优势,持续地为企业数据分析、人工智能等提供性能最好、最稳定安全的应用环境。”


Cloudera与英特尔合作推出的数据分析解决方案已经在金融、电信、交通等不同行业获得成功部署,印证了双方在数据分析领域的强劲实力。英特尔公司软件与服务事业部副总裁兼系统技术和优化部门大数据技术总监马子雅表示:“未来,我们还将持续创新、着力构建广泛的生态环境,与Cloudera等生态合作伙伴建立更深入的合作关系,共同推动多元应用的开发,从而帮助企业实现业务上的变革和创新,驱动未来数据分析与人工智能的进一步发展。”


智能更进一步


在本次Strata上,Kyligence公司发布了其企业级大数据智能分析产品Kyligence Analytics Platform (KAP)最新版旗舰产品——KAP2.4。


作为Apache Kylin的企业级产品,KAP为用户提供了更快的性能、更好的设计工具、更多的企业级特性等。本次发布标志着KAP产品的进一步成熟,且完善了KAP作为Hadoop上的数据仓库等能力。


KAP2.4推出KyStudio建模中心,以交互式的、直观的、可拖拽式的建模体验,为用户提供零门槛上手的大数据建模体验,帮助分析师将对业务的认知无偏差地转化为数据模型。此外,拓宽用户分析场景也是KAP2.4版本的一大亮点。尽管大数据分析的影响力已在各行各业渗透,但满足各行各业不同的业务分析场景需求,始终是一大难点。


KAP2.4在推进预计算建模场景下超高性能查询体验的前提下,通过无缝集成Spark等开源大数据引擎,通过查询下压,在完全支持各种SQL on Hadoop的同时,充分利用Kylin的预计算能力提升了性能和效率,缩短了从源表导入到自助查询的时间间隔,全面支持分析师自主地探索数据的业务价值。具体到商业应用中,无论是要求高并发查询性能的生产场景,还是数据探索灵活性需求的业务探索场景,均能得到满足。

“除了对数据建模及用户分析场景进行优化,KAP2.4还通过全面增强智能建模功能提升企业建模效率。“韩卿谈道,KAP2.4全面提升了建模的智能性——为用户提供更丰富的语义层,赋予用户预定义复杂业务逻辑的能力;内置数据模型检的工具,护航建模,避免数据分布问题带来的模型重构;内置一键优化工具,协助用户设计出最优性价比的数据模型,有效降低建模的学习曲线;根据查询所需维度数,精确减少立方体构建计算量,有效缩短构建时间。


KAP2.4是目前最新的Apache Kylin企业版,具有最好的性能和易用性,同时经过了Kyligence严格的性能、兼容性等各方面的测试,与最新版本的Apache Kylin完全兼容,并已经对各大主流Hadoop发行版做了认证测试。


未来属于那些知道如何使用数据的人。未来始于Strata大会。2017年北京Strata大数据会议聚集了大数据领域最有影响力的产业决策者、战略专家、架构师、开发人员,共同探索数据科学的最前沿问题、案例研究以及最佳的实践经验。



背景 | 关于O'Reilly Media

在近40年来,O'Reilly Media一如既往地提供技术与商业培训、行业知识和前瞻洞察力去帮助企业跨越难关、迈向成功。通过公司独有的专家和改革创新者网络,在O'Reilly大会和Safari培训学习平台中,让创新型人才分享他们的专业知识和实践经验。作为一个SaaS的学习平台,Safari为数以百万计跨越企业、消费者和大学频道的用户提供了最前瞻的专业议题和全面的技术与商业学习解决方案。而Safari在线平台则提供多种学习模式,包括交互式教程、在线培训、书籍阅读、录像视频教学和公司案例研究。自2010年起O'Reilly就已在北京举办Velocity Conference。




这篇关于分享|Strata“梅开二度”:未来属于知道如何使用数据的人的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/212658

相关文章

使用DeepSeek API 结合VSCode提升开发效率

《使用DeepSeekAPI结合VSCode提升开发效率》:本文主要介绍DeepSeekAPI与VisualStudioCode(VSCode)结合使用,以提升软件开发效率,具有一定的参考价值... 目录引言准备工作安装必要的 VSCode 扩展配置 DeepSeek API1. 创建 API 请求文件2.

使用TomCat,service输出台出现乱码的解决

《使用TomCat,service输出台出现乱码的解决》本文介绍了解决Tomcat服务输出台中文乱码问题的两种方法,第一种方法是修改`logging.properties`文件中的`prefix`和`... 目录使用TomCat,service输出台出现乱码问题1解决方案问题2解决方案总结使用TomCat,

解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题

《解决IDEA使用springBoot创建项目,lombok标注实体类后编译无报错,但是运行时报错问题》文章详细描述了在使用lombok的@Data注解标注实体类时遇到编译无误但运行时报错的问题,分析... 目录问题分析问题解决方案步骤一步骤二步骤三总结问题使用lombok注解@Data标注实体类,编译时

Java中注解与元数据示例详解

《Java中注解与元数据示例详解》Java注解和元数据是编程中重要的概念,用于描述程序元素的属性和用途,:本文主要介绍Java中注解与元数据的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参... 目录一、引言二、元数据的概念2.1 定义2.2 作用三、Java 注解的基础3.1 注解的定义3.2 内

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据

Java中使用Java Mail实现邮件服务功能示例

《Java中使用JavaMail实现邮件服务功能示例》:本文主要介绍Java中使用JavaMail实现邮件服务功能的相关资料,文章还提供了一个发送邮件的示例代码,包括创建参数类、邮件类和执行结... 目录前言一、历史背景二编程、pom依赖三、API说明(一)Session (会话)(二)Message编程客

C++中使用vector存储并遍历数据的基本步骤

《C++中使用vector存储并遍历数据的基本步骤》C++标准模板库(STL)提供了多种容器类型,包括顺序容器、关联容器、无序关联容器和容器适配器,每种容器都有其特定的用途和特性,:本文主要介绍C... 目录(1)容器及简要描述‌php顺序容器‌‌关联容器‌‌无序关联容器‌(基于哈希表):‌容器适配器‌:(

C#提取PDF表单数据的实现流程

《C#提取PDF表单数据的实现流程》PDF表单是一种常见的数据收集工具,广泛应用于调查问卷、业务合同等场景,凭借出色的跨平台兼容性和标准化特点,PDF表单在各行各业中得到了广泛应用,本文将探讨如何使用... 目录引言使用工具C# 提取多个PDF表单域的数据C# 提取特定PDF表单域的数据引言PDF表单是一

使用Python实现高效的端口扫描器

《使用Python实现高效的端口扫描器》在网络安全领域,端口扫描是一项基本而重要的技能,通过端口扫描,可以发现目标主机上开放的服务和端口,这对于安全评估、渗透测试等有着不可忽视的作用,本文将介绍如何使... 目录1. 端口扫描的基本原理2. 使用python实现端口扫描2.1 安装必要的库2.2 编写端口扫

使用Python实现操作mongodb详解

《使用Python实现操作mongodb详解》这篇文章主要为大家详细介绍了使用Python实现操作mongodb的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、示例二、常用指令三、遇到的问题一、示例from pymongo import MongoClientf