大模型学习之菜鸟的进阶道路---工程迭代

2024-06-08 17:20

本文主要是介绍大模型学习之菜鸟的进阶道路---工程迭代,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

我们的大模型学习开始了新篇章,这一章还是比较基础的调用api,有些朋友建议直接搞构造大模型,很显然这是很不科学的,我们先从基础学习,大模型本来就是很晦涩难懂的东西,并且知识体系十分庞大,所以我们慢慢学习才是最重要的事情!

工程迭代

首先我们需要介绍这个名词,什么是工程迭代?我们需要理解,在此我们总结为以下几点:
在大模型(如GPT-3.5、GPT-4等)的开发和改进过程中,工程迭代是一个非常重要的环节。工程迭代指的是在模型开发、训练和部署过程中,不断进行改进、测试和优化的循环过程。以下是大模型工程迭代的一些关键方面:

1. 数据收集和预处理

  • 数据收集:收集大规模、多样化的训练数据。数据的质量和多样性对模型的性能至关重要。
  • 数据清洗和预处理:处理和清洗数据,以确保数据的准确性和一致性。这包括去除噪声数据、处理缺失值、标准化等。

2. 模型训练

  • 初始训练:使用收集的数据进行初始模型训练。这通常需要大量的计算资源和时间。
  • 超参数调整:通过调整超参数(如学习率、批量大小等)来优化模型的性能。
  • 分阶段训练:在某些情况下,可能需要分阶段训练模型,即先进行初步训练,再进行精细调优。

3. 模型评估和验证

  • 性能评估:使用测试数据集评估模型的性能,包括准确性、召回率、F1分数等。
  • 验证集:使用验证集来选择最优模型并避免过拟合。
  • 错误分析:分析模型的错误输出,以找出模型的弱点和改进点。

4. 模型优化

  • 模型压缩:为了在实际应用中提高效率,可能需要对模型进行压缩,如量化、剪枝等。
  • 加速推理:使用优化算法和硬件加速(如GPU、TPU)来提高模型的推理速度。
  • 内存管理:优化模型的内存使用,以便在资源有限的环境中运行。

5. 部署和监控

  • 模型部署:将训练好的模型部署到生产环境中,这可能涉及到服务器配置、API开发等。
  • 实时监控:监控模型在实际应用中的性能,收集用户反馈和使用数据,以便进行进一步优化。
  • 持续集成和部署:通过自动化工具实现模型的持续集成和部署,确保快速迭代和更新。

6. 用户反馈和改进

  • 用户反馈:收集用户的反馈意见,了解模型在实际应用中的表现和问题。
  • 迭代改进:根据用户反馈和新数据进行模型的持续改进和重新训练。

7. 安全和伦理考虑

  • 偏见和公平性:确保模型在不同群体中的公平性,减少偏见。
  • 隐私保护:确保训练数据和模型的使用符合隐私保护法规和伦理标准。

8. 研究和创新

  • 新技术探索:不断探索新的技术和方法,以提高模型的性能和能力。
  • 学术合作:与学术界合作,共同研究和攻关技术难题。 通过以上这些迭代步骤,大模型可以不断改进和优化,以满足更高的应用需求和用户期望。

最基础的例子

当然我们现在水平是不足以做到这么多的,我们这篇文章会以一个小白的视角(我的视角)去看最基础的工程迭代
首先我们现在假设是有一个公司,我们主打的就是宣传我们的家具–凳子,但是我们不想写啊,我就交给了大模型处理,所以现在我们把对应的信息喂给模型进行处理,以下是对应代码:

传统的输出样式

fact_sheet_chair = """
OVERVIEW
- Part of a beautiful family of mid-century inspired office furniture, 
including filing cabinets, desks, bookcases, meeting tables, and more.
- Several options of shell color and base finishes.
- Available with plastic back and front upholstery (SWC-100) 
or full upholstery (SWC-110) in 10 fabric and 6 leather options.
- Base finish options are: stainless steel, matte black, 
gloss white, or chrome.
- Chair is available with or without armrests.
- Suitable for home or business settings.
- Qualified for contract use.CONSTRUCTION
- 5-wheel plastic coated aluminum base.
- Pneumatic chair adjust for easy raise/lower action.DIMENSIONS
- WIDTH 53 CM | 20.87”
- DEPTH 51 CM | 20.08”
- HEIGHT 80 CM | 31.50”
- SEAT HEIGHT 44 CM | 17.32”
- SEAT DEPTH 41 CM | 16.14”OPTIONS
- Soft or hard-floor caster options.
- Two choices of seat foam densities: medium (1.8 lb/ft3) or high (2.8 lb/ft3)
- Armless or 8 position PU armrests MATERIALS
SHELL BASE GLIDER
- Cast Aluminum with modified nylon PA6/PA66 coating.
- Shell thickness: 10 mm.
SEAT
- HD36 foamCOUNTRY OF ORIGIN
- Italy
"""

这个是对应语料对应翻译的话可以使用deepl或者其他翻译手段看看,简单来说就是些我们这个凳子的商品信息
然后我们就要开始给模型投入相应的信息或者说是要求

prompt = f"""
Your task is to help a marketing team create a 
description for a retail website of a product based 
on a technical fact sheet.Write a product description based on the information 
provided in the technical specifications delimited by 
triple backticks.Technical specifications: ```{fact_sheet_chair}```
"""
response = get_completion(prompt)
print(response)

这段代码的目的是使用OpenAI的语言模型帮助营销团队根据产品的技术规格撰写产品描述。具体来说,这段代码会根据提供的技术规格信息生成一个适合零售网站的产品描述。
构建提示字符串

prompt = f"""
Your task is to help a marketing team create a 
description for a retail website of a product based 
on a technical fact sheet.Write a product description based on the information 
provided in the technical specifications delimited by 
triple backticks.Technical specifications: ```{fact_sheet_chair}```
"""

这段代码构建了一个提示字符串prompt,其内容如下:

Your task is to help a marketing team create a description for a retail website of a product based on a technical fact sheet.Write a product description based on the information provided in the technical specifications delimited by triple backticks.Technical specifications: ```{fact_sheet_chair}```

这个提示请求模型帮助营销团队创建一个产品描述。它要求模型基于技术规格表中的信息撰写一个适合零售网站使用的产品描述。

调用函数生成响应

response = get_completion(prompt)

这行代码调用了前面定义的get_completion函数,传入构建的prompt作为参数。该函数使用OpenAI的API生成对提示的响应。

打印结果

print(response)

这行代码打印出模型生成的响应。具体来说,将显示模型根据技术规格表撰写的产品描述。

总结
这段代码的作用是:

  1. 构建一个详细的提示,要求模型根据技术规格表创建一个产品描述。
  2. 使用OpenAI的模型生成响应并打印输出。
  3. 通过打印输出,展示模型撰写的产品描述,这对于营销团队在零售网站上展示产品信息非常有帮助。

通过运行代码我们可以看到结果是:

image.png
我们现在就有个问题,生成的内容太多了,有一说一本人在买东西的时候看到字多的我都不愿意看,所以我们可以简单些,所以我们就继续让模型给我们生成信息,我们继续给模型提要求,实现一个迭代过程

prompt = f"""
Your task is to help a marketing team create a 
description for a retail website of a product based 
on a technical fact sheet.Write a product description based on the information 
provided in the technical specifications delimited by 
triple backticks.Use at most 50 words.Technical specifications: ```{fact_sheet_chair}```
"""
response = get_completion(prompt)
print(response)

这段代码和上述代码其实并没有太多的区别,主要的区别还是在于要求Use at most 50 words.
在这里插句话:在现在模型当中这种具体多少词数的要求其实处理能力是很有限的,就这么说吧,我相信有些人肯定会用chatgpt写作业,不少于多少多少字,但很显然有时候大模型是不能正确处理这些信息的
所以我们在这里其实不需要太过于准确

image.png
然后各位可以看这个运行结果我们可以看到,简洁了许多,我们再来看看具体输出的词数

image.png

WoW,还不错,这个模型还挺给我面子,哈哈哈哈哈哈
然后就是第二点,我们如果发现这个有一些错误的信息我们可以继续提示,或者说,我想要模型重点提及某些信息同样是可以写的

prompt = f"""
Your task is to help a marketing team create a 
description for a retail website of a product based 
on a technical fact sheet.Write a product description based on the information 
provided in the technical specifications delimited by 
triple backticks.The description is intended for furniture retailers, 
so should be technical in nature and focus on the 
materials the product is constructed from.Use at most 50 words.Technical specifications: ```{fact_sheet_chair}```
"""
response = get_completion(prompt)
print(response)

这段代码的目的是帮助营销团队根据产品的技术规格撰写一个简洁且技术性的产品描述,特别关注产品的材料,并将字数限制在最多50个单词以内
构建提示字符串

prompt = f"""
Your task is to help a marketing team create a 
description for a retail website of a product based 
on a technical fact sheet.Write a product description based on the information 
provided in the technical specifications delimited by 
triple backticks.The description is intended for furniture retailers, 
so should be technical in nature and focus on the 
materials the product is constructed from.Use at most 50 words.Technical specifications: ```{fact_sheet_chair}```
"""

这段代码构建了一个提示字符串prompt,其内容如下:

Your task is to help a marketing team create a description for a retail website of a product based on a technical fact sheet.Write a product description based on the information provided in the technical specifications delimited by triple backticks.The description is intended for furniture retailers, so should be technical in nature and focus on the materials the product is constructed from.Use at most 50 words.Technical specifications: ```{fact_sheet_chair}```

这个提示请求模型帮助营销团队创建一个技术性产品描述,要求基于技术规格表中的信息撰写一个适合家具零售商使用的、最多50个单词的产品描述,特别关注产品的材料。

调用函数生成响应

response = get_completion(prompt)

这行代码调用了前面定义的get_completion函数,传入构建的prompt作为参数。该函数使用OpenAI的API生成对提示的响应。

打印结果

print(response)

这行代码打印出模型生成的响应。具体来说,将显示模型根据技术规格表撰写的技术性且简洁的产品描述。

总结
这段代码的作用是:

  1. 构建一个详细的提示,要求模型根据技术规格表创建一个技术性且简洁的、最多50个单词的产品描述,特别关注材料信息。
  2. 使用OpenAI的模型生成响应并打印输出。
  3. 通过打印输出,展示模型撰写的技术性产品描述,这对于营销团队在零售网站上展示产品信息非常有帮助,能够快速传达产品的技术特点和材料信息。

image.png
很显然这个就是个训练模型的过程

然后还有比如我要让你举例

prompt = f"""
Your task is to help a marketing team create a 
description for a retail website of a product based 
on a technical fact sheet.Write a product description based on the information 
provided in the technical specifications delimited by 
triple backticks.The description is intended for furniture retailers, 
so should be technical in nature and focus on the 
materials the product is constructed from.At the end of the description, include every 7-character 
Product ID in the technical specification.Use at most 50 words.Technical specifications: ```{fact_sheet_chair}```
"""
response = get_completion(prompt)
print(response)

这段代码的目的是帮助营销团队根据产品的技术规格撰写一个简洁且技术性的产品描述,特别关注产品的材料,并将字数限制在最多50个单词以内。此外,要求在描述的末尾包含每个7个字符的产品ID。

构建提示字符串

prompt = f"""
Your task is to help a marketing team create a 
description for a retail website of a product based 
on a technical fact sheet.Write a product description based on the information 
provided in the technical specifications delimited by 
triple backticks.The description is intended for furniture retailers, 
so should be technical in nature and focus on the 
materials the product is constructed from.At the end of the description, include every 7-character 
Product ID in the technical specification.Use at most 50 words.Technical specifications: ```{fact_sheet_chair}```
"""

这个提示请求模型帮助营销团队创建一个技术性产品描述,要求基于技术规格表中的信息撰写一个适合家具零售商使用的、最多50个单词的产品描述,特别关注产品的材料,并在描述末尾包含所有7个字符的产品ID。

调用函数生成响应

response = get_completion(prompt)

这行代码调用了前面定义的get_completion函数,传入构建的prompt作为参数。该函数使用OpenAI的API生成对提示的响应。

打印结果

print(response)

这行代码打印出模型生成的响应。具体来说,将显示模型根据技术规格表撰写的技术性且简洁的产品描述,并在描述末尾包含产品ID。

总结
这段代码的作用是:

  1. 构建一个详细的提示,要求模型根据技术规格表创建一个技术性且简洁的、最多50个单词的产品描述,特别关注材料信息,并在描述末尾包含所有7个字符的产品ID。
  2. 使用OpenAI的模型生成响应并打印输出。
  3. 通过打印输出,展示模型撰写的技术性产品描述,这对于营销团队在零售网站上展示产品信息非常有帮助,能够快速传达产品的技术特点和材料信息,同时确保包含产品ID以便识别。

image.png
很显然模型做的非常好

表格形式

在这里如果我们需要用到表格该怎么办呢,我们的用户喜欢看表格更加直观好看,怎么办???
在这里我们可以运用HTML知识

prompt = f"""
Your task is to help a marketing team create a 
description for a retail website of a product based 
on a technical fact sheet.Write a product description based on the information 
provided in the technical specifications delimited by 
triple backticks.The description is intended for furniture retailers, 
so should be technical in nature and focus on the 
materials the product is constructed from.At the end of the description, include every 7-character 
Product ID in the technical specification.After the description, include a table that gives the 
product's dimensions. The table should have two columns.
In the first column include the name of the dimension. 
In the second column include the measurements in inches only.Give the table the title 'Product Dimensions'.Format everything as HTML that can be used in a website. 
Place the description in a <div> element.Technical specifications: ```{fact_sheet_chair}```
"""response = get_completion(prompt)
print(response)

这段代码的目的是帮助营销团队根据产品的技术规格撰写一个技术性且简洁的产品描述,并以HTML格式输出,适用于在网站上使用。描述中需要特别关注产品的材料,并包含产品ID和产品尺寸表 构建提示字符串

prompt = f"""
Your task is to help a marketing team create a 
description for a retail website of a product based 
on a technical fact sheet.Write a product description based on the information 
provided in the technical specifications delimited by 
triple backticks.The description is intended for furniture retailers, 
so should be technical in nature and focus on the 
materials the product is constructed from.At the end of the description, include every 7-character 
Product ID in the technical specification.After the description, include a table that gives the 
product's dimensions. The table should have two columns.
In the first column include the name of the dimension. 
In the second column include the measurements in inches only.Give the table the title 'Product Dimensions'.Format everything as HTML that can be used in a website. 
Place the description in a <div> element.Technical specifications: ```{fact_sheet_chair}```
"""

这个提示请求模型帮助营销团队创建一个产品描述,要求基于技术规格表中的信息撰写一个适合家具零售商使用的产品描述,并在描述末尾包含所有7个字符的产品ID和产品尺寸表。要求使用HTML格式输出,描述部分放在<div>元素中。

调用函数生成响应

response = get_completion(prompt)

这行代码调用了前面定义的get_completion函数,传入构建的prompt作为参数。该函数使用OpenAI的API生成对提示的响应。

打印结果

print(response)

这行代码打印出模型生成的响应。具体来说,将显示模型根据技术规格表撰写的技术性且简洁的产品描述,并在描述末尾包含产品ID和产品尺寸表,所有内容格式化为HTML。

总结
这段代码的作用是:

  1. 构建一个详细的提示,要求模型根据技术规格表创建一个技术性且简洁的、适合家具零售商使用的产品描述,特别关注材料信息,并在描述末尾包含所有7个字符的产品ID和产品尺寸表。
  2. 要求使用HTML格式输出,描述部分放在<div>元素中,尺寸表使用<table>元素。
  3. 使用OpenAI的模型生成响应并打印输出。
  4. 通过打印输出,展示模型生成的HTML格式的产品描述和尺寸表,这对于营销团队在零售网站上展示产品信息非常有帮助。

然后因为输出内筒有点多我们就直接复制输出的信息

<div>
<p>This mid-century inspired office chair is a stylish and functional addition to any workspace. The chair is available in a variety of shell colors and base finishes to suit your aesthetic preferences. Choose between plastic back and front upholstery or full upholstery in a range of fabric and leather options. The chair features a 5-wheel plastic coated aluminum base for stability and mobility, along with a pneumatic adjustment for easy height customization. Whether for home or business use, this chair is designed to provide comfort and support. Made with high-quality materials, including cast aluminum with a modified nylon coating for the shell and HD36 foam for the seat, this chair is built to last. Enhance your office with this versatile and durable seating option.</p><p>Product IDs: SWC-100, SWC-110</p>
</div><table><caption>Product Dimensions</caption><tr><th>Dimension</th><th>Measurements (inches)</th></tr><tr><td>Width</td><td>20.87"</td></tr><tr><td>Depth</td><td>20.08"</td></tr><tr><td>Height</td><td>31.50"</td></tr><tr><td>Seat Height</td><td>17.32"</td></tr><tr><td>Seat Depth</td><td>16.14"</td></tr>
</table>

然后我们来看看这个对应的信息是什么样子

image.png
可以看到这个代码运行是这个样子的,是不是好看了一点点

总结

在这里,我们发现其实我们口中所说的工程迭代不过是一直给机器提供信息然后让机器进行学习,锻炼模型最后就可以拿到我们想要的结果啦!!!
本章节结束啦,如果文章对您有帮助,还望留下一个大大的赞,您的支持是我滴动力!!!

那么,我们该如何学习大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

一、大模型全套的学习路线

学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别:AI大模型API应用开发工程

L3级别:大模型应用架构进阶实践

L4级别:大模型微调与私有化部署

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线,不知道为什么发出来就有点糊,高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

这篇关于大模型学习之菜鸟的进阶道路---工程迭代的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1042816

相关文章

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

Spring Security 从入门到进阶系列教程

Spring Security 入门系列 《保护 Web 应用的安全》 《Spring-Security-入门(一):登录与退出》 《Spring-Security-入门(二):基于数据库验证》 《Spring-Security-入门(三):密码加密》 《Spring-Security-入门(四):自定义-Filter》 《Spring-Security-入门(五):在 Sprin

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

Java进阶13讲__第12讲_1/2

多线程、线程池 1.  线程概念 1.1  什么是线程 1.2  线程的好处 2.   创建线程的三种方式 注意事项 2.1  继承Thread类 2.1.1 认识  2.1.2  编码实现  package cn.hdc.oop10.Thread;import org.slf4j.Logger;import org.slf4j.LoggerFactory

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]