生成式AI与大语言模型,东软已经准备就绪

2023-11-25 07:01

本文主要是介绍生成式AI与大语言模型,东软已经准备就绪,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

伴随着ChatGPT的火爆全球,数以百计的大语言模型也争先恐后地加入了这一战局,掀起了一场轰轰烈烈的“百模大战”。毋庸置疑的是,继方兴未艾的人工智能普及大潮之后,生成式AI与大语言模型正在全球开启新一轮生产力革新的科技浪潮。

在这场生成式AI的大潮中,东软集团也正式宣布成立东软魔形科技研究院,持续探索人工智能技术的创新与应用,推动实施大语言模型系统工程战略,全面迎接大模型时代的机遇与挑战。

生成式AI为什么会以如此惊人的速度火爆全球?它会给技术人员带来怎样的变化?东软集团在生成式AI领域又有着怎样的布局?刚刚成立的东软魔形科技研究院又肩负着怎样的使命?近日在东软解决方案论坛2023上,东软集团高级副总裁兼首席技术官、首席信息官陈锡民博士对以上问题给出了详细的解答。

5408e3322dc1bbd6bcacb4cb67519c6e.jpeg

生成式AI为什么如此火爆

陈锡民向趣味科技表示,生成式AI与大语言模型之所以,是因为它们可以做好以前许多人工智能技术做不好的事情,譬如对自然语言的理解,对文章的要点归纳,除此之外,其强大的生成能力也可以极大地提高用户的工作效率,让人们可以把有限的时间精力投入到更具有价值的地方去。

1、渗透力强:与元宇宙等其他技术相比,生成式AI可以更加普遍地渗入到人们的日常生活当中。它不仅仅依赖于特定的设备或装备,而是能够通过各种方式和渠道影响人们的生活。这种普遍性使其更加容易被人们接受,并在社会中产生更加广泛的影响。

2、解决关键技术问题:大语言模型解决了过去人工智能应用中的关键难题,即思维能力和生成能力。过去的人工智能更多地是决策式AI,只能做一些判断和识别,譬如图像识别和语音识别,但是缺乏更深层次的理解和生成能力。而大语言模型的出现填补了这一空白,使得生成式AI能够通过语言交互更加深入地理解用户意图,并产生相应的输出。

3、类似人类大脑中枢:大语言模型的运作方式与人类大脑中枢的运作方式有着一定的相似之处。它可以接受语言输入,理解并产生输出,这种输出可以是文本,也可以是进一步分解的行为、动作和其他指令。这使得大语言模型不仅仅是一个简单的工具,而是一个能够理解、思考和指导各种动作的智能系统。

4、裂变效应与无限可能:结合思维链的方式和提示工程的能力,大语言模型的能力可以被无限放大和嵌套。譬如一个AI可以生成两个子AI,分别执行不同的任务,并能够继续产生更多的子AI。这种裂变效应带来了巨大的想象空间,因为这意味着AI可以自我复制、自我监督、自我协同,实现任务的并行处理和高效完成。

“总的来说,生成式AI与大语言模型,对社会和技术带来了非常巨大的潜在影响。它们不仅仅是一个工具或者一个系统,而且还是一个能够思考、理解、指导和裂变的智能体。这种技术带来的变革可能会超越我们的想象,并给未来的生活和工作方式带来全新的定义和可能性。”陈锡民表示。

991a71c9a8a4305cbf6f8b1d1661272e.jpeg

大语言模型给技术人员带来的变化

由于新兴的生成式AI与大语言模型,与以往的传统人工智能技术是如此的不同,所以它们的快速普及,也给既有技术人员的岗位分工带来了巨大的震荡。

陈锡民指出,过去在IT行业,代码是否写得漂亮、算法研究是否深入,这些是人们评价一位技术人员能力高低的主要标准。然而随着生成式AI技术的发展,特别是大语言模型的出现,对技术人员的要求已经不仅仅是编程和算法研究的能力,而更重要的是如何与人工智能打交道,如何理解和驾驭知识,并将其活化为对人工智能的指导和应用。

这种对技术人员角色和能力要求的变化,实际上是一种从技术细节驾驭到知识驾驭的转变。技术人员需要更加深入地理解业务、理解知识,才能更好地利用生成式AI与大语言模型等技术为业务赋能。这种转变对技术人员的能力提出了更高的要求,需要他们具备更广泛的知识、更深入的业务理解以及更强大的创新思维。

对于企业来说,如何培养和吸引这种新型的技术人才,也成为了一项非常重要的课题。一方面,企业可以通过培训和内部转岗等方式,帮助现有的技术人员适应这种转变;另一方面,企业也需要从外部引进具有新知识结构和技术能力的人才,以推动自身的技术发展,更好地满足客户的需求。

对于这种新生的变化,技术人员自身也需要积极适应和快速学习。不仅需要提高自己的业务知识和理解能力,也需要学习新的技术和工具,譬如提示工程、微调技术等,以更好地驾驭生成式AI与大语言模型等新兴技术。

“总的来说,生成式AI与大语言模型等技术的发展,正在深刻改变IT行业的技术人员岗位分工和能力要求。而对于技术人员来说,这既是一个挑战,也是一个机遇。只有积极适应这种变化,不断提高自己的能力,才能在新的时代中立足。”陈锡民说道。

东软在生成式AI领域的布局

陈锡民向趣味科技透露,东软在生成式AI领域的布局具有非常清晰的目标和方向,将主要聚焦于行业大模型的构建和应用。由于通用大模型的训练成本非常高,所以东软选择利用开源模型为基础,结合行业数据和行业知识,来训练具备实际应用价值的专业大模型。

目前,东软正在围绕医疗、政府、汽车等三大重要的业务板块,构建生成式AI解决方案。其中,医疗领域的医生助手和问诊助手是两个典型的应用场景。医生助手可以自动生成医嘱和病历,提高医生的工作质量和效率;而问诊助手则可以帮助患者更准确地挂号和描述病情,提高医疗服务的效率和质量。这些应用场景都具有较高的落地可行性和应用价值。

值得注意的是,东软在构建行业大模型时,不仅考虑算法和模型的性能,也非常注重与社会责任和法律责任的结合。陈博士指出:“人工智能只是起到辅助作用的工具,最终的法律责任可能仍然由人来承担,因此我们要对产品更加谨慎。”这种注重社会责任和法律责任的做法,也有助于保障人工智能技术的安全和可持续发展。

值得一提的是,东软最近还面向医疗领域推出了多款AI+医疗行业应用,包括添翼医疗领域大模型、飞标医学影像标注平台4.0、基于WEB的虚拟内窥镜等。这是东软凭借深厚的技术积累、海量的数据资源、丰富的行业应用场景,在AI+医疗行业的创新实践,加速推动了东软“AI+领域应用”的人工智能生态图谱战略布局。

“虽然生成式AI与语言大模型在自然语言理解方面已经有了很大的进步,尤其是百亿、千亿参数规模以上的通用语言大模型。但是在医疗、法律等严谨行业中的应用,我们仍然需要非常谨慎。因为这些行业涉及人的生命、财产等核心利益,一旦出现错误,后果可能会非常严重。这就需要我们通过一系列的系统工程,确保大模型的输出质量和价值观的正确性,从而真正实现人工智能技术的安全和可持续发展。”陈锡民表示。

9c7dd9ce8e13b8a8c80164352eb0460f.jpeg

东软魔形科技研究院的使命

谈到最新成立的东软魔形科技研究院时,陈锡民表示,该研究院的诞生是以“智能化软件生产”和“软件智能化服务”为核心目标,并将启动和实施东软“大语言模型系统工程(LLM Systems Engineering,LLM-SE)”战略,围绕“专业性、一致性、可解释性、安全性”等企业级应用的核心特性需求,打造东软LLM-SE通用开发平台,面向医疗、人社、医保、政务、金融、媒体、人力资源及智能汽车等所有业务领域,构建东软LLM-SE+领域应用,完成典型场景落地部署及大规模推广,为东软AI大模型驱动的业务转型提供全面支撑。同时研究院还将积极打造外部合作生态 ,建设东软AI算力中心、AIGC相关技术的应用研究,构建东软完整的人工智能生态体系。

陈锡民指出,东软魔形科技研究院的成立肩负着多个重要使命,并且与东软集团作为行业软件领军企业的战略定位紧密相关:

1、跟踪与消化先进技术:当前大语言模型技术正处于快速发展和演进阶段。东软魔形科技研究院的首要使命是持续跟踪这些先进技术,并进行消化学习,确保东软始终保持在技术前沿。

2、探索行业应用场景与技术方案:作为行业软件厂商,东软需要深入探索大语言模型在各个领域的应用场景和相应的技术方案。特别是在东软关注的医疗等重点领域,由于数据的敏感性和保守性,需要自主研发符合行业需求的大模型。

3、商业化导向的研究:东软魔形科技研究院不仅致力于技术研发,而且还要确保研究成果能够商业化。这就需要研究出的模型在质量上可控,并且在部署成本和运行成本上都要合理,这样才能真正满足客户需求并实现商业化价值。

4、联合各业务单元共同研发:东软魔形科技研究院的特色在于它与各纵向业务单元紧密合作。各行业领域的专家和技术骨干带着课题进入研究院,共享算力、环境等资源,结合通用大模型的认知能力,共同进行相关课题的研发。

5、发挥模型孵化器作用:东软魔形科技研究院还起到了模型孵化器的作用。它负责对未来行业大模型的训练、实践验证及商业化全流程。一旦模型孵化成功,即可进行商业化销售,为东软带来实际的经济效益。

“综上所述,东软魔形科技研究院的定位是一个集先进技术跟踪、行业应用探索、商业化导向研发和模型孵化于一体的综合研究机构,它为东软在未来生成式AI与大语言模型领域的发展,提供了坚实的技术基础和源源不断的创新动力。”陈锡民说道。

20dd99224abd6335fcce4d8323a82fe6.jpeg

ba168f84c7a5e99ca32e748d6f6cc0f9.jpeg

60c8f90d845a6e0d392975f73ebcc3df.jpeg

dc0418ee499adfa086843c4aec3c64f4.jpeg

这篇关于生成式AI与大语言模型,东软已经准备就绪的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/423329

相关文章

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

Go语言中三种容器类型的数据结构详解

《Go语言中三种容器类型的数据结构详解》在Go语言中,有三种主要的容器类型用于存储和操作集合数据:本文主要介绍三者的使用与区别,感兴趣的小伙伴可以跟随小编一起学习一下... 目录基本概念1. 数组(Array)2. 切片(Slice)3. 映射(Map)对比总结注意事项基本概念在 Go 语言中,有三种主要

C语言中自动与强制转换全解析

《C语言中自动与强制转换全解析》在编写C程序时,类型转换是确保数据正确性和一致性的关键环节,无论是隐式转换还是显式转换,都各有特点和应用场景,本文将详细探讨C语言中的类型转换机制,帮助您更好地理解并在... 目录类型转换的重要性自动类型转换(隐式转换)强制类型转换(显式转换)常见错误与注意事项总结与建议类型

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

如何在本地部署 DeepSeek Janus Pro 文生图大模型

《如何在本地部署DeepSeekJanusPro文生图大模型》DeepSeekJanusPro模型在本地成功部署,支持图片理解和文生图功能,通过Gradio界面进行交互,展示了其强大的多模态处... 目录什么是 Janus Pro1. 安装 conda2. 创建 python 虚拟环境3. 克隆 janus

本地私有化部署DeepSeek模型的详细教程

《本地私有化部署DeepSeek模型的详细教程》DeepSeek模型是一种强大的语言模型,本地私有化部署可以让用户在自己的环境中安全、高效地使用该模型,避免数据传输到外部带来的安全风险,同时也能根据自... 目录一、引言二、环境准备(一)硬件要求(二)软件要求(三)创建虚拟环境三、安装依赖库四、获取 Dee