起心动念 | 生成式 AI 开发实践系列的开端

2024-02-03 16:52

本文主要是介绍起心动念 | 生成式 AI 开发实践系列的开端,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

生成式 AI 和大模型的技术变革力量,正在逐渐影响着我们当下这个时代,全球各行各业都呈现百舸争流、万象更新的趋势。在 2023 年,我们通过各种面向开发者的活动,收集到了大量开发者关于基于生成式 AI 的开发内容需求和建议反馈。开发者们都期待我们在 2024 年推出更多关于生成式 AI 开发实践的系列内容。

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏,看到这里请一定不要匆匆划过,点这里让它成为你的技术宝库!

根据来自于过去一年的开发者的需求建议上的深度思考,我们确定了以下三个围绕生成式 AI 开发实践的内容系列,希望在 2024 年里,对开发者们在生成式 AI 应用领域的开发实践有所帮助:

  • 构建生成式 AI 应用开发实践系列

  • 开源大语言模型的优化实践系列

  • 亚马逊云科技上的生成式 AI 开发实践系列

构建生成式 AI 应用开发实践系列

在亚马逊云科技 re:Invent 2023 以及之后的 reCap 巡展中,细心的开发者们也许已经发现有一个很有趣的动手实验:

开发一款可部署的基于大语言模型的字谜游戏。

该款游戏使用了文生图模型为玩家提供一个未知的提示词,玩家需要根据模型生成的图像来猜测该提示词,来完成游戏。该动手实验完整地展示了如何在亚马逊云科技上完整构建生成式 AI 应用程序。

这款游戏的后端使用了三个大模型,包括:

  • 文本到图像的模型

  • 文本嵌入(Text Embedding)模型

  • 文本生成模型

整个游戏的主要拓扑结构图如下所示:

image.png

本系列计划用 3-5 篇博客的篇幅,完整阐述如何构建基于大模型的生成式 AI 应用实践,来帮助开发者们全面了解构建 生成式 AI 应用开发的完整流程,包括:构建前端程序、构建后端程序、以及代码面向生产环境的持续集成和持续部署(CI/CD)等方面内容:

  • 生成式 AI 应用设计概述

  • 文本到图像模型的设计

  • 嵌入模型的设计

  • 文本生成模型的设计

  • 生成式 AI 应用 CI/CD 实践

开源大语言模型的优化实践系列

该系列的策划起源自我们在 2023 年亚马逊云科技 re:Invent 上的演讲分享——使用 Amazon SageMaker 优化开源大语言模型的部署和微调。

  • 《使用 Amazon SageMaker 优化开源大语言模型的部署和微调》 演示文稿下载:https://d1.awsstatic.com/events/Summits/reinvent2023/BOA402\_Open-source-LLM-optimization-with-Amazon-SageMaker.pdf?trk=cndc-detail

在技术分享中,我们和世界各地的开发者们一起探讨了大语言模型的模型部署和微调优化领域,包括:模型编译、模型压缩、模型分布式训练、模型推理批处理等方面的行业最新论文和发展趋势,以及通过两个实际代码展示了 Amazon SageMaker 如何高效简化大语言模型的部署和微调流程。如下图所示:

image.png

分享结束后,很多开发者和我们沟通联系,希望我们可以把这个话题延展地更深入一些,因为和开源大模型优化相关的很多子领域,在过去一年行业进步迅速,很多优秀的论文和想法脱颖而出。因此,我规划了这一系列,通过 4-6 篇博客来分享我在开源大语言模型优化领域的心得和体会,话题包括:

  • 模型编译

  • 模型压缩

  • 模型分布式训练

  • 模型部署

  • 模型推理优化

在亚马逊云科技上的生成式 AI 开发实践系列

从 2023 年开始,在生成式 AI 领域涌现了很多优秀的书籍和在线课程。为帮助开发者可以系统了了解如何利用亚马逊云科技在云基础设施、数据存储、数据处理以及数据分析等诸多方面的优势,我们特别规划了这个系列的内容。

我们希望在 2024 年里通过 8-12 篇技术博客和大家逐步分享行业的最新进展和在亚马逊云科技上的开发实践,主要内容规划如下:

  • 生成式 AI 用例、基础知识、项目生命周期

  • 提示工程和上下文学习

  • 大型语言基础模型

  • 模型量化和模型的分布式训练

  • 模型微调和模型评估

  • 参数高效微调(PEFT)

  • 使用 RLHF 进行强化学习微调

  • 优化和部署 生成式 应用程序

  • 检索增强生成 (RAG) 和代理

  • 多模态基础模型概述

  • 使用 Stable Diffusion 模型进行用户可控的模型生成和微调

  • 使用 Amazon Bedrock 的生成式 AI 开发实践

敬请期待!

特别推荐

除了今年的内容分享预告,我也希望给开发者们推荐以下学习资源,与开发者共勉。

书籍《Generative AI on Amazon Web Services》

难度:初级/中级

该书的作者为来自亚马逊云科技的同事 Chris Fregly、Antje Barth 和 Shelbee Eigenbrode 等。 

书籍主要内容包括了:生成式 AI 的生命周期,包括用例定义、模型选择、模型微调、检索增强生成、通过人类反馈的强化学习以及模型量化、优化和部署等。如果开发者计划利用亚马逊云科技的诸多服务,在云端设计和开发生成式 AI 的应用的话,非常推荐此书。

书籍链接:https://www\.amazon.com/\_/dp/1098159225?trk=cndc-detail

在线课程《Generative AI with Large Language Models》

技术难度:中级

吴恩达创办的 DeepLearning.AI 一直在提供各种面向 AI 领域的精品课程。而在大语言模型领域,笔者非常推荐 DeepLearning.AI 与亚马逊云科技合作推出这门在线课程。

这门在线课程的主要内容是讲授生成式 AI 的工作原理,以及如何部署面向真实世界应用的生成式 AI 模型。这门课的对象主要是针对中等水平的生成式 AI 开发人员,所以需要有一定的编程基础并且对机器学习有一定的了解。此外,官方建议课程的学习时间是三周,也是一个比较长的学习周期。

在线课程链接:https://www\.coursera.org/learn/generative-ai-with-llms?trk=cndc-detail

在线课程《Hands-on Machine Learning with Amazon Web Services and NVIDIA》

技术难度:中级/高级

该在线课程是 DeepLearning.AI 与亚马逊云科技合作的又一重要课程,专为数据科学家和开发人员等 ML 实践者设计。课程要求注册课程的开发者,具有机器学习工作流程的基础知识。

在该课程中,开发者将了解如何让使用 Amazon SageMaker 和 NVIDIA GPU 加速的 Amazon EC2 实例构建、训练和部署可扩展机器学习模型的实践经验。

课程首先概述了 Amazon SageMaker 和 NVIDIA GPU。然后指导开发者通过运行由 GPU 驱动的 Amazon SageMaker 笔记本实例进行实践操作。学习内容包括:如何准备用于模型训练的数据集、构建模型、执行模型训练以及部署和优化 ML 模型等生成式 AI 模型训练的完整流程。

在线课程链接:https://www\.coursera.org/learn/machine-learning-aws-nvidia?trk=cndc-detail

最后,祝福各位开发者龙年新年快乐,阖家幸福,万事如意!

文章来源:起心动念 | 生成式 AI 开发实践系列的开端

这篇关于起心动念 | 生成式 AI 开发实践系列的开端的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/674796

相关文章

基于Qt开发一个简单的OFD阅读器

《基于Qt开发一个简单的OFD阅读器》这篇文章主要为大家详细介绍了如何使用Qt框架开发一个功能强大且性能优异的OFD阅读器,文中的示例代码讲解详细,有需要的小伙伴可以参考一下... 目录摘要引言一、OFD文件格式解析二、文档结构解析三、页面渲染四、用户交互五、性能优化六、示例代码七、未来发展方向八、结论摘要

Docker集成CI/CD的项目实践

《Docker集成CI/CD的项目实践》本文主要介绍了Docker集成CI/CD的项目实践,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录一、引言1.1 什么是 CI/CD?1.2 docker 在 CI/CD 中的作用二、Docke

在 VSCode 中配置 C++ 开发环境的详细教程

《在VSCode中配置C++开发环境的详细教程》本文详细介绍了如何在VisualStudioCode(VSCode)中配置C++开发环境,包括安装必要的工具、配置编译器、设置调试环境等步骤,通... 目录如何在 VSCode 中配置 C++ 开发环境:详细教程1. 什么是 VSCode?2. 安装 VSCo

C#图表开发之Chart详解

《C#图表开发之Chart详解》C#中的Chart控件用于开发图表功能,具有Series和ChartArea两个重要属性,Series属性是SeriesCollection类型,包含多个Series对... 目录OverviChina编程ewSeries类总结OverviewC#中,开发图表功能的控件是Char

鸿蒙开发搭建flutter适配的开发环境

《鸿蒙开发搭建flutter适配的开发环境》文章详细介绍了在Windows系统上如何创建和运行鸿蒙Flutter项目,包括使用flutterdoctor检测环境、创建项目、编译HAP包以及在真机上运... 目录环境搭建创建运行项目打包项目总结环境搭建1.安装 DevEco Studio NEXT IDE

Python开发围棋游戏的实例代码(实现全部功能)

《Python开发围棋游戏的实例代码(实现全部功能)》围棋是一种古老而复杂的策略棋类游戏,起源于中国,已有超过2500年的历史,本文介绍了如何用Python开发一个简单的围棋游戏,实例代码涵盖了游戏的... 目录1. 围棋游戏概述1.1 游戏规则1.2 游戏设计思路2. 环境准备3. 创建棋盘3.1 棋盘类

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M