生成式AI与大语言模型,东软已经准备就绪

2023-11-25 07:01

本文主要是介绍生成式AI与大语言模型,东软已经准备就绪,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

伴随着ChatGPT的火爆全球,数以百计的大语言模型也争先恐后地加入了这一战局,掀起了一场轰轰烈烈的“百模大战”。毋庸置疑的是,继方兴未艾的人工智能普及大潮之后,生成式AI与大语言模型正在全球开启新一轮生产力革新的科技浪潮。

在这场生成式AI的大潮中,东软集团也正式宣布成立东软魔形科技研究院,持续探索人工智能技术的创新与应用,推动实施大语言模型系统工程战略,全面迎接大模型时代的机遇与挑战。

生成式AI为什么会以如此惊人的速度火爆全球?它会给技术人员带来怎样的变化?东软集团在生成式AI领域又有着怎样的布局?刚刚成立的东软魔形科技研究院又肩负着怎样的使命?近日在东软解决方案论坛2023上,东软集团高级副总裁兼首席技术官、首席信息官陈锡民博士对以上问题给出了详细的解答。

5408e3322dc1bbd6bcacb4cb67519c6e.jpeg

生成式AI为什么如此火爆

陈锡民向趣味科技表示,生成式AI与大语言模型之所以,是因为它们可以做好以前许多人工智能技术做不好的事情,譬如对自然语言的理解,对文章的要点归纳,除此之外,其强大的生成能力也可以极大地提高用户的工作效率,让人们可以把有限的时间精力投入到更具有价值的地方去。

1、渗透力强:与元宇宙等其他技术相比,生成式AI可以更加普遍地渗入到人们的日常生活当中。它不仅仅依赖于特定的设备或装备,而是能够通过各种方式和渠道影响人们的生活。这种普遍性使其更加容易被人们接受,并在社会中产生更加广泛的影响。

2、解决关键技术问题:大语言模型解决了过去人工智能应用中的关键难题,即思维能力和生成能力。过去的人工智能更多地是决策式AI,只能做一些判断和识别,譬如图像识别和语音识别,但是缺乏更深层次的理解和生成能力。而大语言模型的出现填补了这一空白,使得生成式AI能够通过语言交互更加深入地理解用户意图,并产生相应的输出。

3、类似人类大脑中枢:大语言模型的运作方式与人类大脑中枢的运作方式有着一定的相似之处。它可以接受语言输入,理解并产生输出,这种输出可以是文本,也可以是进一步分解的行为、动作和其他指令。这使得大语言模型不仅仅是一个简单的工具,而是一个能够理解、思考和指导各种动作的智能系统。

4、裂变效应与无限可能:结合思维链的方式和提示工程的能力,大语言模型的能力可以被无限放大和嵌套。譬如一个AI可以生成两个子AI,分别执行不同的任务,并能够继续产生更多的子AI。这种裂变效应带来了巨大的想象空间,因为这意味着AI可以自我复制、自我监督、自我协同,实现任务的并行处理和高效完成。

“总的来说,生成式AI与大语言模型,对社会和技术带来了非常巨大的潜在影响。它们不仅仅是一个工具或者一个系统,而且还是一个能够思考、理解、指导和裂变的智能体。这种技术带来的变革可能会超越我们的想象,并给未来的生活和工作方式带来全新的定义和可能性。”陈锡民表示。

991a71c9a8a4305cbf6f8b1d1661272e.jpeg

大语言模型给技术人员带来的变化

由于新兴的生成式AI与大语言模型,与以往的传统人工智能技术是如此的不同,所以它们的快速普及,也给既有技术人员的岗位分工带来了巨大的震荡。

陈锡民指出,过去在IT行业,代码是否写得漂亮、算法研究是否深入,这些是人们评价一位技术人员能力高低的主要标准。然而随着生成式AI技术的发展,特别是大语言模型的出现,对技术人员的要求已经不仅仅是编程和算法研究的能力,而更重要的是如何与人工智能打交道,如何理解和驾驭知识,并将其活化为对人工智能的指导和应用。

这种对技术人员角色和能力要求的变化,实际上是一种从技术细节驾驭到知识驾驭的转变。技术人员需要更加深入地理解业务、理解知识,才能更好地利用生成式AI与大语言模型等技术为业务赋能。这种转变对技术人员的能力提出了更高的要求,需要他们具备更广泛的知识、更深入的业务理解以及更强大的创新思维。

对于企业来说,如何培养和吸引这种新型的技术人才,也成为了一项非常重要的课题。一方面,企业可以通过培训和内部转岗等方式,帮助现有的技术人员适应这种转变;另一方面,企业也需要从外部引进具有新知识结构和技术能力的人才,以推动自身的技术发展,更好地满足客户的需求。

对于这种新生的变化,技术人员自身也需要积极适应和快速学习。不仅需要提高自己的业务知识和理解能力,也需要学习新的技术和工具,譬如提示工程、微调技术等,以更好地驾驭生成式AI与大语言模型等新兴技术。

“总的来说,生成式AI与大语言模型等技术的发展,正在深刻改变IT行业的技术人员岗位分工和能力要求。而对于技术人员来说,这既是一个挑战,也是一个机遇。只有积极适应这种变化,不断提高自己的能力,才能在新的时代中立足。”陈锡民说道。

东软在生成式AI领域的布局

陈锡民向趣味科技透露,东软在生成式AI领域的布局具有非常清晰的目标和方向,将主要聚焦于行业大模型的构建和应用。由于通用大模型的训练成本非常高,所以东软选择利用开源模型为基础,结合行业数据和行业知识,来训练具备实际应用价值的专业大模型。

目前,东软正在围绕医疗、政府、汽车等三大重要的业务板块,构建生成式AI解决方案。其中,医疗领域的医生助手和问诊助手是两个典型的应用场景。医生助手可以自动生成医嘱和病历,提高医生的工作质量和效率;而问诊助手则可以帮助患者更准确地挂号和描述病情,提高医疗服务的效率和质量。这些应用场景都具有较高的落地可行性和应用价值。

值得注意的是,东软在构建行业大模型时,不仅考虑算法和模型的性能,也非常注重与社会责任和法律责任的结合。陈博士指出:“人工智能只是起到辅助作用的工具,最终的法律责任可能仍然由人来承担,因此我们要对产品更加谨慎。”这种注重社会责任和法律责任的做法,也有助于保障人工智能技术的安全和可持续发展。

值得一提的是,东软最近还面向医疗领域推出了多款AI+医疗行业应用,包括添翼医疗领域大模型、飞标医学影像标注平台4.0、基于WEB的虚拟内窥镜等。这是东软凭借深厚的技术积累、海量的数据资源、丰富的行业应用场景,在AI+医疗行业的创新实践,加速推动了东软“AI+领域应用”的人工智能生态图谱战略布局。

“虽然生成式AI与语言大模型在自然语言理解方面已经有了很大的进步,尤其是百亿、千亿参数规模以上的通用语言大模型。但是在医疗、法律等严谨行业中的应用,我们仍然需要非常谨慎。因为这些行业涉及人的生命、财产等核心利益,一旦出现错误,后果可能会非常严重。这就需要我们通过一系列的系统工程,确保大模型的输出质量和价值观的正确性,从而真正实现人工智能技术的安全和可持续发展。”陈锡民表示。

9c7dd9ce8e13b8a8c80164352eb0460f.jpeg

东软魔形科技研究院的使命

谈到最新成立的东软魔形科技研究院时,陈锡民表示,该研究院的诞生是以“智能化软件生产”和“软件智能化服务”为核心目标,并将启动和实施东软“大语言模型系统工程(LLM Systems Engineering,LLM-SE)”战略,围绕“专业性、一致性、可解释性、安全性”等企业级应用的核心特性需求,打造东软LLM-SE通用开发平台,面向医疗、人社、医保、政务、金融、媒体、人力资源及智能汽车等所有业务领域,构建东软LLM-SE+领域应用,完成典型场景落地部署及大规模推广,为东软AI大模型驱动的业务转型提供全面支撑。同时研究院还将积极打造外部合作生态 ,建设东软AI算力中心、AIGC相关技术的应用研究,构建东软完整的人工智能生态体系。

陈锡民指出,东软魔形科技研究院的成立肩负着多个重要使命,并且与东软集团作为行业软件领军企业的战略定位紧密相关:

1、跟踪与消化先进技术:当前大语言模型技术正处于快速发展和演进阶段。东软魔形科技研究院的首要使命是持续跟踪这些先进技术,并进行消化学习,确保东软始终保持在技术前沿。

2、探索行业应用场景与技术方案:作为行业软件厂商,东软需要深入探索大语言模型在各个领域的应用场景和相应的技术方案。特别是在东软关注的医疗等重点领域,由于数据的敏感性和保守性,需要自主研发符合行业需求的大模型。

3、商业化导向的研究:东软魔形科技研究院不仅致力于技术研发,而且还要确保研究成果能够商业化。这就需要研究出的模型在质量上可控,并且在部署成本和运行成本上都要合理,这样才能真正满足客户需求并实现商业化价值。

4、联合各业务单元共同研发:东软魔形科技研究院的特色在于它与各纵向业务单元紧密合作。各行业领域的专家和技术骨干带着课题进入研究院,共享算力、环境等资源,结合通用大模型的认知能力,共同进行相关课题的研发。

5、发挥模型孵化器作用:东软魔形科技研究院还起到了模型孵化器的作用。它负责对未来行业大模型的训练、实践验证及商业化全流程。一旦模型孵化成功,即可进行商业化销售,为东软带来实际的经济效益。

“综上所述,东软魔形科技研究院的定位是一个集先进技术跟踪、行业应用探索、商业化导向研发和模型孵化于一体的综合研究机构,它为东软在未来生成式AI与大语言模型领域的发展,提供了坚实的技术基础和源源不断的创新动力。”陈锡民说道。

20dd99224abd6335fcce4d8323a82fe6.jpeg

ba168f84c7a5e99ca32e748d6f6cc0f9.jpeg

60c8f90d845a6e0d392975f73ebcc3df.jpeg

dc0418ee499adfa086843c4aec3c64f4.jpeg

这篇关于生成式AI与大语言模型,东软已经准备就绪的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/423329

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}