起心动念 | 生成式 AI 开发实践系列的开端

2024-02-03 16:52

本文主要是介绍起心动念 | 生成式 AI 开发实践系列的开端,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

生成式 AI 和大模型的技术变革力量,正在逐渐影响着我们当下这个时代,全球各行各业都呈现百舸争流、万象更新的趋势。在 2023 年,我们通过各种面向开发者的活动,收集到了大量开发者关于基于生成式 AI 的开发内容需求和建议反馈。开发者们都期待我们在 2024 年推出更多关于生成式 AI 开发实践的系列内容。

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏,看到这里请一定不要匆匆划过,点这里让它成为你的技术宝库!

根据来自于过去一年的开发者的需求建议上的深度思考,我们确定了以下三个围绕生成式 AI 开发实践的内容系列,希望在 2024 年里,对开发者们在生成式 AI 应用领域的开发实践有所帮助:

  • 构建生成式 AI 应用开发实践系列

  • 开源大语言模型的优化实践系列

  • 亚马逊云科技上的生成式 AI 开发实践系列

构建生成式 AI 应用开发实践系列

在亚马逊云科技 re:Invent 2023 以及之后的 reCap 巡展中,细心的开发者们也许已经发现有一个很有趣的动手实验:

开发一款可部署的基于大语言模型的字谜游戏。

该款游戏使用了文生图模型为玩家提供一个未知的提示词,玩家需要根据模型生成的图像来猜测该提示词,来完成游戏。该动手实验完整地展示了如何在亚马逊云科技上完整构建生成式 AI 应用程序。

这款游戏的后端使用了三个大模型,包括:

  • 文本到图像的模型

  • 文本嵌入(Text Embedding)模型

  • 文本生成模型

整个游戏的主要拓扑结构图如下所示:

image.png

本系列计划用 3-5 篇博客的篇幅,完整阐述如何构建基于大模型的生成式 AI 应用实践,来帮助开发者们全面了解构建 生成式 AI 应用开发的完整流程,包括:构建前端程序、构建后端程序、以及代码面向生产环境的持续集成和持续部署(CI/CD)等方面内容:

  • 生成式 AI 应用设计概述

  • 文本到图像模型的设计

  • 嵌入模型的设计

  • 文本生成模型的设计

  • 生成式 AI 应用 CI/CD 实践

开源大语言模型的优化实践系列

该系列的策划起源自我们在 2023 年亚马逊云科技 re:Invent 上的演讲分享——使用 Amazon SageMaker 优化开源大语言模型的部署和微调。

  • 《使用 Amazon SageMaker 优化开源大语言模型的部署和微调》 演示文稿下载:https://d1.awsstatic.com/events/Summits/reinvent2023/BOA402\_Open-source-LLM-optimization-with-Amazon-SageMaker.pdf?trk=cndc-detail

在技术分享中,我们和世界各地的开发者们一起探讨了大语言模型的模型部署和微调优化领域,包括:模型编译、模型压缩、模型分布式训练、模型推理批处理等方面的行业最新论文和发展趋势,以及通过两个实际代码展示了 Amazon SageMaker 如何高效简化大语言模型的部署和微调流程。如下图所示:

image.png

分享结束后,很多开发者和我们沟通联系,希望我们可以把这个话题延展地更深入一些,因为和开源大模型优化相关的很多子领域,在过去一年行业进步迅速,很多优秀的论文和想法脱颖而出。因此,我规划了这一系列,通过 4-6 篇博客来分享我在开源大语言模型优化领域的心得和体会,话题包括:

  • 模型编译

  • 模型压缩

  • 模型分布式训练

  • 模型部署

  • 模型推理优化

在亚马逊云科技上的生成式 AI 开发实践系列

从 2023 年开始,在生成式 AI 领域涌现了很多优秀的书籍和在线课程。为帮助开发者可以系统了了解如何利用亚马逊云科技在云基础设施、数据存储、数据处理以及数据分析等诸多方面的优势,我们特别规划了这个系列的内容。

我们希望在 2024 年里通过 8-12 篇技术博客和大家逐步分享行业的最新进展和在亚马逊云科技上的开发实践,主要内容规划如下:

  • 生成式 AI 用例、基础知识、项目生命周期

  • 提示工程和上下文学习

  • 大型语言基础模型

  • 模型量化和模型的分布式训练

  • 模型微调和模型评估

  • 参数高效微调(PEFT)

  • 使用 RLHF 进行强化学习微调

  • 优化和部署 生成式 应用程序

  • 检索增强生成 (RAG) 和代理

  • 多模态基础模型概述

  • 使用 Stable Diffusion 模型进行用户可控的模型生成和微调

  • 使用 Amazon Bedrock 的生成式 AI 开发实践

敬请期待!

特别推荐

除了今年的内容分享预告,我也希望给开发者们推荐以下学习资源,与开发者共勉。

书籍《Generative AI on Amazon Web Services》

难度:初级/中级

该书的作者为来自亚马逊云科技的同事 Chris Fregly、Antje Barth 和 Shelbee Eigenbrode 等。 

书籍主要内容包括了:生成式 AI 的生命周期,包括用例定义、模型选择、模型微调、检索增强生成、通过人类反馈的强化学习以及模型量化、优化和部署等。如果开发者计划利用亚马逊云科技的诸多服务,在云端设计和开发生成式 AI 的应用的话,非常推荐此书。

书籍链接:https://www\.amazon.com/\_/dp/1098159225?trk=cndc-detail

在线课程《Generative AI with Large Language Models》

技术难度:中级

吴恩达创办的 DeepLearning.AI 一直在提供各种面向 AI 领域的精品课程。而在大语言模型领域,笔者非常推荐 DeepLearning.AI 与亚马逊云科技合作推出这门在线课程。

这门在线课程的主要内容是讲授生成式 AI 的工作原理,以及如何部署面向真实世界应用的生成式 AI 模型。这门课的对象主要是针对中等水平的生成式 AI 开发人员,所以需要有一定的编程基础并且对机器学习有一定的了解。此外,官方建议课程的学习时间是三周,也是一个比较长的学习周期。

在线课程链接:https://www\.coursera.org/learn/generative-ai-with-llms?trk=cndc-detail

在线课程《Hands-on Machine Learning with Amazon Web Services and NVIDIA》

技术难度:中级/高级

该在线课程是 DeepLearning.AI 与亚马逊云科技合作的又一重要课程,专为数据科学家和开发人员等 ML 实践者设计。课程要求注册课程的开发者,具有机器学习工作流程的基础知识。

在该课程中,开发者将了解如何让使用 Amazon SageMaker 和 NVIDIA GPU 加速的 Amazon EC2 实例构建、训练和部署可扩展机器学习模型的实践经验。

课程首先概述了 Amazon SageMaker 和 NVIDIA GPU。然后指导开发者通过运行由 GPU 驱动的 Amazon SageMaker 笔记本实例进行实践操作。学习内容包括:如何准备用于模型训练的数据集、构建模型、执行模型训练以及部署和优化 ML 模型等生成式 AI 模型训练的完整流程。

在线课程链接:https://www\.coursera.org/learn/machine-learning-aws-nvidia?trk=cndc-detail

最后,祝福各位开发者龙年新年快乐,阖家幸福,万事如意!

文章来源:起心动念 | 生成式 AI 开发实践系列的开端

这篇关于起心动念 | 生成式 AI 开发实践系列的开端的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/674796

相关文章

揭秘未来艺术:AI绘画工具全面介绍

📑前言 随着科技的飞速发展,人工智能(AI)已经逐渐渗透到我们生活的方方面面。在艺术创作领域,AI技术同样展现出了其独特的魅力。今天,我们就来一起探索这个神秘而引人入胜的领域,深入了解AI绘画工具的奥秘及其为艺术创作带来的革命性变革。 一、AI绘画工具的崛起 1.1 颠覆传统绘画模式 在过去,绘画是艺术家们通过手中的画笔,蘸取颜料,在画布上自由挥洒的创造性过程。然而,随着AI绘画工

一份LLM资源清单围观技术大佬的日常;手把手教你在美国搭建「百万卡」AI数据中心;为啥大模型做不好简单的数学计算? | ShowMeAI日报

👀日报&周刊合集 | 🎡ShowMeAI官网 | 🧡 点赞关注评论拜托啦! 1. 为啥大模型做不好简单的数学计算?从大模型高考数学成绩不及格说起 司南评测体系 OpenCompass 选取 7 个大模型 (6 个开源模型+ GPT-4o),组织参与了 2024 年高考「新课标I卷」的语文、数学、英语考试,然后由经验丰富的判卷老师评判得分。 结果如上图所

C++必修:模版的入门到实践

✨✨ 欢迎大家来到贝蒂大讲堂✨✨ 🎈🎈养成好习惯,先赞后看哦~🎈🎈 所属专栏:C++学习 贝蒂的主页:Betty’s blog 1. 泛型编程 首先让我们来思考一个问题,如何实现一个交换函数? void swap(int& x, int& y){int tmp = x;x = y;y = tmp;} 相信大家很快就能写出上面这段代码,但是如果要求这个交换函数支持字符型

AI儿童绘本创作

之前分享过AI儿童绘画的项目,但是主要问题是角色一致要花费很长的时间! 今天发现了这款,非常奈斯! 只需输入故事主题、风格、模板,软件就会自动创作故事内容,自动生成插画配图,自动根据模板生成成品,测试效果如下图。 变现方式:生成儿童绘本发布到各平台,吸引宝妈群体进私域。  百度网盘 请输入提取码百度网盘为您提供文件的网络备份、同步和分享服务。空间大、速度快、安全

亮相WOT全球技术创新大会,揭秘火山引擎边缘容器技术在泛CDN场景的应用与实践

2024年6月21日-22日,51CTO“WOT全球技术创新大会2024”在北京举办。火山引擎边缘计算架构师李志明受邀参与,以“边缘容器技术在泛CDN场景的应用和实践”为主题,与多位行业资深专家,共同探讨泛CDN行业技术架构以及云原生与边缘计算的发展和展望。 火山引擎边缘计算架构师李志明表示:为更好地解决传统泛CDN类业务运行中的问题,火山引擎边缘容器团队参考行业做法,结合实践经验,打造火山

Eclipse+ADT与Android Studio开发的区别

下文的EA指Eclipse+ADT,AS就是指Android Studio。 就编写界面布局来说AS可以边开发边预览(所见即所得,以及多个屏幕预览),这个优势比较大。AS运行时占的内存比EA的要小。AS创建项目时要创建gradle项目框架,so,创建项目时AS比较慢。android studio基于gradle构建项目,你无法同时集中管理和维护多个项目的源码,而eclipse ADT可以同时打开

Python应用开发——30天学习Streamlit Python包进行APP的构建(9)

st.area_chart 显示区域图。 这是围绕 st.altair_chart 的语法糖。主要区别在于该命令使用数据自身的列和指数来计算图表的 Altair 规格。因此,在许多 "只需绘制此图 "的情况下,该命令更易于使用,但可定制性较差。 如果 st.area_chart 无法正确猜测数据规格,请尝试使用 st.altair_chart 指定所需的图表。 Function signa

人工和AI大语言模型成本对比 ai语音模型

这里既有AI,又有生活大道理,无数渺小的思考填满了一生。 上一专题搭建了一套GMM-HMM系统,来识别连续0123456789的英文语音。 但若不是仅针对数字,而是所有普通词汇,可能达到十几万个词,解码过程将非常复杂,识别结果组合太多,识别结果不会理想。因此只有声学模型是完全不够的,需要引入语言模型来约束识别结果。让“今天天气很好”的概率高于“今天天汽很好”的概率,得到声学模型概率高,又符合表达

智能客服到个人助理,国内AI大模型如何改变我们的生活?

引言 随着人工智能(AI)技术的高速发展,AI大模型越来越多地出现在我们的日常生活和工作中。国内的AI大模型在过去几年里取得了显著的进展,不少独创的技术点和实际应用令人瞩目。 那么,国内的AI大模型有哪些独创的技术点?它们在实际应用中又有哪些出色表现呢?此外,普通人又该如何利用这些大模型提升工作和生活的质量和效率呢?本文将为你一一解析。 一、国内AI大模型的独创技术点 多模态学习 多

JavaWeb系列二十: jQuery的DOM操作 下

jQuery的DOM操作 CSS-DOM操作多选框案例页面加载完毕触发方法作业布置jQuery获取选中复选框的值jQuery控制checkbox被选中jQuery控制(全选/全不选/反选)jQuery动态添加删除用户 CSS-DOM操作 获取和设置元素的样式属性: css()获取和设置元素透明度: opacity属性获取和设置元素高度, 宽度: height(), widt