东软集团刘积仁:进行大数据研究要有新思维

2023-12-26 15:40

本文主要是介绍东软集团刘积仁:进行大数据研究要有新思维,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

雷锋网 AI 科技评论按:2018 中国计算机大会(CNCC2018)于 10 月 25-27 日在杭州国际博览中心举办,会议由中国计算机学会(CCF)主办,杭州市萧山区人民政府、浙江大学承办,浙江工业大学、浙江工商大学、杭州电子科技大学协办。

今年的大会主题是「大数据推动数字经济(Big Data Drives the Digital Economy)」,CNCC 邀请到近 400 位国内外计算机领域知名专家、企业家到会演讲。大会首日,共有如下五位嘉宾带来特邀报告:

图灵奖获得者、美国计算机科学家 Robert E.Kahn

CCF 名誉理事长、中国工程院院士李国杰

北京大学经济学院教授孙祁祥

美国工程院院士、加州大学伯克利分校教授 Katherine Yelick

东软集团董事长兼首席执行官刘积仁

作为最后一位上台演讲的嘉宾,刘积仁博士开场即幽默地表示,他是从学术界「堕落」到商业。他此次的报告主题是《当数据遇到商业模式》。

在报告中,他从商业应用的视角分享了自己对技术与商业模式融合的思考与实践。

针对大数据的未来发展趋势,他提出如下五点:第一,个人与行业数据的融合;第二,技术与工具的平台化和普及; 第三,纯技术的商业空间更小;第四,大数据的行业应用更有价值;第五,数据+算法+领域知识+商业模式不可分割。

他表示,「技术研究人员需要学会新学术思维,真正从行业应用中洞察大数据的未来趋势。」以下为他的演讲内容,雷锋网(公众号:雷锋网) AI 科技评论做了不改变原意的编辑整理。

TB1q1qgkW6qK1RjSZFmXXX0PFXa.jpg

我的报告主题是《当数据遇到商业模式》,今天在场有很多教授、博士生,还有许多研究人员,我以前在大学担任教授,在学校里做了很多研究,后来「堕落」去了商界。在这些年的历程中,我认为学术研究和社会发展事实上是不可分割的,当进行学术选择时,如果选错了方向,会成为一生的悲哀。

要有新的研究思维

举个例子,说起大数据,大家会谈到存储、速度、算法、算力等,但如果我们不能理解大数据对社会的价值、社会的规则对大数据的约束、商业模式和数据之间的关系、数据的伦理以及获取数据的艺术,那你的研究一定是苍白的,因为你没有办法在丰富的世界里表现出价值。刚才李国杰院士谈到大数据的产值比较低,并不意味着进行这方面研究的人数少,因为我们被很多因素制约。

首先来分析技术的时运,在场进行学术研究的人,一定知道学术研究背后也有运气,人工智能、大数据、超级计算机、智能计算这些都不是新东西。我读研究生时,最火的研究方向是计算机网络、VR、人工智能,也有一部分人从事自然语言理解的研究。

我当年在美国国家标准技术研究院,我们认为未来的网络协议需要支持更安全、复杂、可靠的服务,我们做了很多标准,但一直到今天,TCP 仍然主导网络世界,此前的研究并没有用上。所以当我们进行学术研究时,一定要看到社会发展的趋势,看到未来可能承载你成就的平台,而不能顺着所有人的共识。当所有人都欢呼那个方向就是未来的时候,你最好不要做,因为太晚了。当别人对你想进行的研究持怀疑态度的时候,可能那就是你最好的机会。

在大数据的时代,我们首先要认识到时运来自于什么。大数据时代的研究和我们过去所进行的很多研究的根本不同点在于环境,数字社会支撑了大数据时代,现在计算成本、存储成本、通信成本都越来越便宜,平台越来越丰富,网络实体越来越丰富,我们获取数据的成本也越来越便宜。

但是为什么大数据的应用并不如预期?互联网是个人数据获取的主要渠道,数据是每位用户自发提供的。但是想要进行精准的计算,支持可靠的算法,不仅要有个人需求,还需要来自于组织的数据。

TB1mhiek7voK1RjSZFNXXcxMVXa.jpg

解决问题需要高质量的多源数据与领域知识的结合。谈到数据融合,真正的融合不仅仅在数据层面,有数据与数据的融合,数据与规则的融合,数据与伦理的融合,还有数据与商业模式的融合。数据只有和商业融合在一起,才能形成一种新的模式。我们要超越的不仅仅是对数据的认识,还有对其他行业的认识。

TB1I81ckVzqK1RjSZSgXXcpAVXa.jpg

另外,大数据研究的思维方式也在发生变化,在数据利用上,需要有跨越技术的思维。没有高质量的数据,就没有精准的应用技术。但高质量的数据从哪里来,它来源于对解决问题领域的知识的理解。另外,数据利用需要开放合作。

目前还看到一个问题,每个人都倾向于有自己的技术、算法,这样我们的论文就可以与别人不同,但事实上,我们正以更快的速度把算法和技术平台化、免费化。大数据和人工智能算法在未来,一定是充分免费的平台,在这个领域里,几乎没有独立创造商业价值的空间。原因很简单,大数据和人工智能只有在应用中才能得到完善,在解决方案中才能获得价值。

TB1I81ckVzqK1RjSZSgXXcpAVXa.jpg

在未来,不管是这个领域的学者,还是正在学习的学生,大数据领域的赢家一定来自思维,一种新学术思维。当你不能构造一种崭新思维的时候,就像我最开始所说,你的时运和这种技术无缘。

TB1atd8k9rqK1RjSZK9XXXyypXa.jpg

大数据有很大的商业空间。其一是个性化与精准的营销,在银行业有客户意见挖掘、高端客户流失预警,媒体行业有热点分析、个性化内容推荐,航空行业有常旅客识别、旅客画像;其二是组织高效运营与风险管控,在金融行业有防欺诈,航空业有防恶意占座、机票价格监测等。这都是各行各业在应用大数据的例子。

TB1dICdkYPpK1RjSZFFXXa5PpXa.jpg

在应用大数据的时候,有一个很重要的问题就是伦理问题。这里涉及到隐私、公平、安全、社会价值、开放。在这个领域,如果能够找到技术和伦理的结合点,一定是未来一个很重要的发展领域。数字社会已经覆盖了中国大部分的人口,一个没有文化的数字社会,没有伦理的数字社会,一定是一个不可持续发展的社会。

再看大数据的发展趋势。

首先是个人与行业数据的融合,没有这种融合就没有精准和可靠的应用。

二是技术和工具的平台化、普及化。这是一个大趋势。

三是纯技术的商业空间更小。

四是大数据的行业应用更有价值。

五是数据+算法+领域知识+商业模式不可分割。

现在大数据的价值远远没有被发挥出来,所有的算法、数据只有在应用的过程中才能变得更加成熟。

站在东软的角度对技术进行思考

TB1Jl5ckVzqK1RjSZSgXXcpAVXa.jpg

简单谈一下东软的实践,谈谈我们是怎么想,怎么看待数据的。东软在过去 27 年来致力于推动国民经济基础设施与重要民生领域的信息化水平不断提高,在众多行业拥有领先的市场占有率。下图是我们在中国拥有的数据,我们为 7 亿人提供社会保险服务与支持系统,我们的电力营销系统为 4 亿人支付电费提供服务。拥有这些数据有什么意义?如果不在社会的层面思考这些数据,是没有意义的。我们需要有不同的思考,是超越技术的思考。

TB1fgKbkYvpK1RjSZPiXXbmwXXa.jpg

以下是我们在健康、医疗领域的数据,医疗要求用复杂的生态系统来实现。当我们谈到大数据,就要谈到健康,谈到健康的时候就会谈到医院。医疗质量、公平、成本、安全,这是大数据在健康、卫生、医疗里要解决的根本问题。

我们首先要有这样的逻辑,在看到这些逻辑的时候,能否在里面找到技术发展的方向,当找到发展方向,我们会构造组织,构造人工智能应用的范围,然后用人工智能技术控制医疗费用支出等等。我们要构造互联网云医院,使得更多的医疗行为从大医院走向基层,我们要实现医疗的公平性,控制不断上涨的医疗费用,实现医疗的分层次服务,建立个人的动态健康与医疗档案,使医疗更加个性化和精准。

数据和 AI 让基层医院更强大,我们可以构建医联体,如下图:

TB1FeSdk5rpK1RjSZFhXXXSdXXa.jpg

超越技术变成从事技术研究的必须选择,如果我们不了解社会,不了解生态,不了解其他行业,我们怎么能谈数据?

TB1aaV_k9zqK1RjSZPxXXc4tVXa.jpg

为大家谈谈新信息技术观:    

信息技术成为日用品、消费品、生活方式。

信息技术失去了独立性,无所不在,与应用场景相伴。

技术进入平台化、普及、快速传播时代,也是平台、技术、工具免费的时代。

技术的使用者比技术拥有者更知道技术发展的方向。

技术拥有者从专注变成超越。

开放、融合、合作是技术路线的重要组织部分。

技术进步速度加快,不要对自己的技术过于自信,应用与普及是检测技术领先的重要标准。

大数据是新商业的支撑,而只有在开放、融合、创造的环境下,大数据才能拥有价值。传统的教育、科研方式与过去的模式不一样了,而约束它的不是别人,不是这个社会,正是我们自己,我们自己是否能适应这个时代的变化,适应新商业、新零售、新学术、新科研。

(完)

敬请关注雷锋网 AI 科技评论更多现场报告。

这篇关于东软集团刘积仁:进行大数据研究要有新思维的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/539981

相关文章

大语言模型(LLMs)能够进行推理和规划吗?

大语言模型(LLMs),基本上是经过强化训练的 n-gram 模型,它们在网络规模的语言语料库(实际上,可以说是我们文明的知识库)上进行了训练,展现出了一种超乎预期的语言行为,引发了我们的广泛关注。从训练和操作的角度来看,LLMs 可以被认为是一种巨大的、非真实的记忆库,相当于为我们所有人提供了一个外部的系统 1(见图 1)。然而,它们表面上的多功能性让许多研究者好奇,这些模型是否也能在通常需要系

【服务器运维】MySQL数据存储至数据盘

查看磁盘及分区 [root@MySQL tmp]# fdisk -lDisk /dev/sda: 21.5 GB, 21474836480 bytes255 heads, 63 sectors/track, 2610 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytesSector size (logical/physical)

Python应用开发——30天学习Streamlit Python包进行APP的构建(9)

st.area_chart 显示区域图。 这是围绕 st.altair_chart 的语法糖。主要区别在于该命令使用数据自身的列和指数来计算图表的 Altair 规格。因此,在许多 "只需绘制此图 "的情况下,该命令更易于使用,但可定制性较差。 如果 st.area_chart 无法正确猜测数据规格,请尝试使用 st.altair_chart 指定所需的图表。 Function signa

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述

气象站的种类和应用范围可以根据不同的分类标准进行详细的划分和描述。以下是从不同角度对气象站的种类和应用范围的介绍: 一、气象站的种类 根据用途和安装环境分类: 农业气象站:专为农业生产服务,监测土壤温度、湿度等参数,为农业生产提供科学依据。交通气象站:用于公路、铁路、机场等交通场所的气象监测,提供实时气象数据以支持交通运营和调度。林业气象站:监测林区风速、湿度、温度等气象要素,为林区保护和

数据时代的数字企业

1.写在前面 讨论数据治理在数字企业中的影响和必要性,并介绍数据治理的核心内容和实践方法。作者强调了数据质量、数据安全、数据隐私和数据合规等方面是数据治理的核心内容,并介绍了具体的实践措施和案例分析。企业需要重视这些方面以实现数字化转型和业务增长。 数字化转型行业小伙伴可以加入我的星球,初衷成为各位数字化转型参考库,星球内容每周更新 个人工作经验资料全部放在这里,包含数据治理、数据要

企业如何进行员工的网络安全意识培训?

企业网络安全意识培训的重要性         企业网络安全意识培训是提升员工网络安全素质的关键环节。随着网络技术的快速发展,企业面临的网络安全威胁日益增多,员工的网络安全意识和技能水平直接关系到企业的信息安全和业务连续性。因此,企业需要通过系统的网络安全意识培训,提高员工对网络安全的认识和防范能力,从而降低企业在面对潜在安全风险时的损失和影响。 企业网络安全意识培训的方法         企

如何在Java中处理JSON数据?

如何在Java中处理JSON数据? 大家好,我是免费搭建查券返利机器人省钱赚佣金就用微赚淘客系统3.0的小编,也是冬天不穿秋裤,天冷也要风度的程序猿!今天我们将探讨在Java中如何处理JSON数据。JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,在现代应用程序中被广泛使用。Java通过多种库和API提供了处理JSON的能力,我们将深入了解其用法和最佳

两个基因相关性CPTAC蛋白组数据

目录 蛋白数据下载 ①蛋白数据下载 1,TCGA-选择泛癌数据  2,TCGA-TCPA 3,CPTAC(非TCGA) ②蛋白相关性分析 1,数据整理 2,蛋白相关性分析 PCAS在线分析 蛋白数据下载 CPTAC蛋白组学数据库介绍及数据下载分析 – 王进的个人网站 (jingege.wang) ①蛋白数据下载 可以下载泛癌蛋白数据:UCSC Xena (xena

使用JWT进行安全通信

在现代Web应用中,安全通信是至关重要的。JSON Web Token(JWT)是一种流行的安全通信方式,它允许用户和服务器之间安全地传输信息。JWT是一种紧凑的、URL安全的表示方法,用于在两方之间传输信息。本文将详细介绍JWT的工作原理,并提供代码示例帮助新人理解和实现JWT。 什么是JWT? JWT是一种开放标准(RFC 7519),它定义了一种紧凑且自包含的方式,用于在各方之间以JSO