企业数字化转型进入深海区:生成式AI时代下如何制定数据战略

本文主要是介绍企业数字化转型进入深海区:生成式AI时代下如何制定数据战略,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

云计算适用于任何人,任何企业,云计算的分支——人工智能(AI)正发展的迅疾如火,炙手可热。特别是ChatGPT已经挑战各行各业对于AI的认知。

作为全球云计算领域的年度风向标活动,12月12日,亚马逊云科技2023 re:Invent中国行落地北京。大会上,干货满满,包括亚马逊云科技数据的战略构想、如何加速构建生成式AI、芯片创新、企业级生成式AI应用等等,全球领先的云厂商亚马逊云科技对当下的AI行业进行了全方位把脉。

具体看来,在此次亚马逊云科技2023 re:Invent中国北京活动展上,围绕底层基础设施、生成式人工智能(AI)、数据战略,亚马逊云科技推出了一系列新服务及功能。包括重塑未来工作方式的新型生成式AI助手Amazon Q、Amazon Bedrock更多的模型选择和全新强大功能、Amazon SageMaker助力规模化开发应用模型的五大新功能等,帮助企业更轻松、安全地构建和应用生成式AI。为了给生成式AI提供强大的数据支持,亚马逊云科技进一步丰富向量数据库选择,推出让跨数据存储的数据访问与分析更快速、更便捷的Zero-ETL集成特性。此外,针对机器学习(ML)训练和生成式AI应用等广泛的工作负载,亚马逊云科技推出新一代自研芯片Amazon Graviton4和Amazon Trainium2。

因为数据战略是整个AI的纲,纲举才能目张。于是,我们决定将「数据战略」,作为观察今年亚马逊云科技re:Invent中国行的切入点。

 

一、生成式AI时代下的关键词:重构

亚马逊云科技re:Invent中国行大会上,亚马逊云科技高管和众多业内大咖在演讲中多次提及了两个关键词:生成式AI时代和重构。

数据已然成为新的生产要素。纵观整个云计算发展史,数据全要素生产率在PC时代是飞速增长,在互联网普及后(2005-2022)呈现增长缓慢态势,而生成式AI时代,数据全要素生产率将重新加速上升。由此,生成式AI也是人工智能从1.0时代进入2.0时代的重要标志。

随着AI相关新应用、新业态的出现,人工智能产业对算力的需求正在迎来巨量化、多元化的发展趋势, 云计算产业所需要的服务也越来越复杂、差异化、多元化。生成式AI 应运而生。

所谓生成式AI ,即企业的大数据云计算门槛被 AI 基础设施大大降低,企业可利用开箱即用的生成式 AI 服务来提升创新效率,更快地构建出实用化、多元化的应用。比如,在制造业中,生成式 AI 可以通过提取历史数据实时诊断设备故障,并建议维护操作。

眼下,生成式AI呈现席卷之势,从智能汽车、智能家居到智能穿戴,在各大领域“全面开花”,生成式AI时代正在到来。毕竟,生成式AI均是对传统微观经济学的挑战。生成式AI意味着产品的个性、定制化生产边际成本接近于0,在生成式大模型接入后,各类智能设备将迎来真正的差异化时代。

不过,生成式AI是一个系统性工程,需要一场耐力长跑,而亚马逊云科技正在勾勒出生成式AI时代长跑的路线图,并积极努力做好赢得这场耐力长跑的准备。

曾经贝索斯在2008年致亚马逊公司股东的信中所做解释大意如下:如果我们能很好了解顾客需求,并深信这种需求是有长期价值。那么,我们的一贯做法是——耐心探索,直至找到解决方案。

具体而言,生成式AI时代下如何制定数据战略?亚马逊云科技2023 re:Invent中国行给出了答案:重构。包括重构基础设施、计算,重构存储、重构企业级生成式AI,还有生态重构、用户需求重构等。此前,在亚马逊云科技CEO Adam Selipsky的演讲中,重构也是成为一大关键词。

数据战略中,持续推动大模型相关技术是关键。但国内在早期拥有大模型能力的公司是极少数,而且国内大模型仍缺乏数据量,做不到高层级的架构。更困难的是,大模型是算力巨兽,依赖高端GPU芯片,一个大模型需数万块GPU,以此推算,是至少几十亿元的投入。这些困境恰是云计算领导者亚马逊云科技的优势,其能全盘承接,并打造出AI发展的新范式。

AI无处不在的时代已经开启。生成式AI堪称通往未来时代的报晓鸟,最终生成式AI将助力成千上万的企业打破数据孤岛,重构AI,重塑数据价值,释放企业的数据潜力。

二、企业数字化转型进入深海区后的数据战略部署

生成式AI时代下,亚马逊云科技制定数据战略的终极目的是助力企业实现数字化转型,提高企业生成式AI创新速度。

几年前,企业数字化转型还是一道选择题,如今俨然成为一道必答题。当下经济下行,企业数字化转型进入深海区,企业在创新的过程中面临了新的机遇和新的挑战,开始加速向广度和深度进发。比如,对企业而言,AI产业前期投入大而后期应用难一直被行业所诟病。当下,降本增效对企业就显得尤为迫切和重要。

这也恰是亚马逊云科技生成式AI时代下数据战略部署的要义所在。一方面差异化产品在生成式AI时代将不再具有竞争壁垒,但差异化数据将可能具有很高价值。

另一方面,生成式AI时代,云计算与经济效应的“飞轮”高度耦合。云计算关键在于弹性、可伸缩、可拓展性带来的成本优化,而生成式AI关键就在于效能提高到某个阈值之后的应用价值急速上升,从而真正赋能众多企业,满足企业主们对于经济效应的最高阶需求。而且,在企业的数字化转型中,没有一种AI模式能适合所有的企业。技术、生态、发展环境都在迅速变化,2023年与原来传统AI服务模式有巨大变化,企业需要随之做出自身数据战略的调整。

一句话,亚马逊云科技通过制定数据战略来实现数据的价值。一个好的数据战略框架可以帮助公司克服重重障碍,并定义更多数据驱动的道路。数据战略是所有数据实践的基础。它不仅仅解决数据问题,它是一个长期的指导性计划,定义了解决数据挑战和支持业务目标所需的人员、流程和技术,包括数据架构与技术、数据分析、数据治理、数据战略路线图、数据成熟度评估、数据变革等等。

在当前的AI爆炸发展的情况下,亚马逊云科技的数据战略是明确且清晰的。接下来,不管AI产业如何演进,出现什么样的创新业态与应用, 只要按照数据战略稳步推进,未来的发展必将可期。

具体而言,数据战略是基于技术为前提。具体到如何通过技术帮助企业客户更高效的使用训练模型,提升效率。亚马逊云科技大中华区战略业务发展部总经理顾凡将其总结为“三横三纵”。

“三横,”即亚马逊云科技重构生成式AI技术的三个层级:最底层是用于训练和推理的「基础设施层」,这里包括一些亚马逊云科技的自研芯片;中间层是微调大模型或基础模型需求的「工具层」;最上层是「生成式AI应用层」。

“三纵”,则是生成式AI的核心原则。其一,负责任的AI,需要有超级丰富且全面的相对应的服务,为客户的所有场景强大的数据存储和分析服务落地;其二,让客户以最低的代价把数据融合起来,真正做到实用性和低成本;其三,如何保护客户私有数据,保证数据的可控性,在鼓励客户把数据用起来数据的同时,数据私密性不能被模型所吸收。可以说,“三横三纵”是当下亚马逊云科技构建生成式AI的关键所在。

有了数据战略和“三横三纵”,亚马逊云科技采用逆向工作法,从客户需求出发。再加上生态、芯片核心能力、企业级生成式AI应用,就能构建一种AI新范式,尽可能匹配这个AI时代下的更多客户的更多需求,解决以前企业无法解决的问题。比如如何做精准预测,如何从大量数据里搜集,如何从这些数据里面去发掘逻辑,真正做到决策支持。

亚马逊云科技分析数据解决方案组合包括云数据仓库服务Amazon Redshift、交互式查询服务Amazon Athena、数据集成服务Amazon Glue和快速构建数据湖的服务Amazon Lake Formation。亚马逊云科技在其所有产品中广泛使用的六个重要的云计算服务属性:安全性、可用性 、可扩展性、性能效率、成本效率和可持续性。

就在上周,亚马逊云科技还推出了数据库和应用领域的三项 Serverless 创新应用,使客户能够更快、更轻松地扩展其数据基础设施,以支持苛刻的业务用例。目前,全球超过150万客户正在使用亚马逊云科技的数据库、分析和机器学习服务。

总之,生成式AI时代正席卷而来,人工智能产业的发展大幕已经拉开。国内的企业们不妨以开放的心态拥抱数字化,用数字化来迎接新的机遇。只有这样,才能穿越周期,行之弥远,改变智能时代企业的发展命运。

这篇关于企业数字化转型进入深海区:生成式AI时代下如何制定数据战略的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/493808

相关文章

Java利用JSONPath操作JSON数据的技术指南

《Java利用JSONPath操作JSON数据的技术指南》JSONPath是一种强大的工具,用于查询和操作JSON数据,类似于SQL的语法,它为处理复杂的JSON数据结构提供了简单且高效... 目录1、简述2、什么是 jsONPath?3、Java 示例3.1 基本查询3.2 过滤查询3.3 递归搜索3.4

MySQL大表数据的分区与分库分表的实现

《MySQL大表数据的分区与分库分表的实现》数据库的分区和分库分表是两种常用的技术方案,本文主要介绍了MySQL大表数据的分区与分库分表的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录1. mysql大表数据的分区1.1 什么是分区?1.2 分区的类型1.3 分区的优点1.4 分

Mysql删除几亿条数据表中的部分数据的方法实现

《Mysql删除几亿条数据表中的部分数据的方法实现》在MySQL中删除一个大表中的数据时,需要特别注意操作的性能和对系统的影响,本文主要介绍了Mysql删除几亿条数据表中的部分数据的方法实现,具有一定... 目录1、需求2、方案1. 使用 DELETE 语句分批删除2. 使用 INPLACE ALTER T

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

Python实现将MySQL中所有表的数据都导出为CSV文件并压缩

《Python实现将MySQL中所有表的数据都导出为CSV文件并压缩》这篇文章主要为大家详细介绍了如何使用Python将MySQL数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到... python将mysql数据库中所有表的数据都导出为CSV文件到一个目录,并压缩为zip文件到另一个

SpringBoot整合jasypt实现重要数据加密

《SpringBoot整合jasypt实现重要数据加密》Jasypt是一个专注于简化Java加密操作的开源工具,:本文主要介绍详细介绍了如何使用jasypt实现重要数据加密,感兴趣的小伙伴可... 目录jasypt简介 jasypt的优点SpringBoot使用jasypt创建mapper接口配置文件加密

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解

Oracle存储过程里操作BLOB的字节数据的办法

《Oracle存储过程里操作BLOB的字节数据的办法》该篇文章介绍了如何在Oracle存储过程中操作BLOB的字节数据,作者研究了如何获取BLOB的字节长度、如何使用DBMS_LOB包进行BLOB操作... 目录一、缘由二、办法2.1 基本操作2.2 DBMS_LOB包2.3 字节级操作与RAW数据类型2.