本文主要是介绍从原理到实现教你做一个Code Interpreter,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
▼最近直播超级多,预约保你有收获
近期直播:《基于从原理到实现教你做出一个 Code Interpreter》
—1—
Code Interpreter 技术架构剖析
Code Interpreter 是“一个实验性的 ChatGPT 模型”,它将 Python 代码写入 Jupyter Notebook,并在 SandBox 沙箱中执行,该沙箱具有以下几个特性:
第一、其他用户以及互联网隔离,无法上网;
第二、支持最多 100MB 文件上传/下载;
第三、预装了 343 个库;
第四、支持持久会话。
通过反向工程(如上图)我们看到 Code Interpreter 的底层基座并不是基于 GPT-4,而是采用了新的微调大模型 gpt-4-code-interpreter,针对代码生成进行了微调。
此外,Code Interpreter 本质上一种 AI Agent(如下图),借助 LLM 大模型的推理能力,实现了代码的生成、代码的运行、代码的异常处理等落地执行工作。
Code Interpreter = LLM + Planning + Memory + Use Tools.
Code Interpreter 有输入模块,支持输入文本、文件、图片、视频等结构化和非结构化数据。
Code Interpreter 的规划能力借助 ReAct 思维链模式来把代码生成、代码运行等复杂工作拆分成简单工作。比如针对用户 Prompt 先思考(Thought)给出执行步骤,然后进行行动(Action),最后通过观察(Observation)执行结果是否完成复杂任务。
Code Interpreter 的使用工具主要是 Python 的 SandBox 沙箱环境,用于 Python 代码的自动执行。
Code Interpreter 在执行过程中借助于 Memory 记忆能力实现子任务的通信和协作。
总之,掌握好 Coder Interpreter 的技术架构和实现原理,对于 IT 人来说是一项非常重要的技能,它可以让您的 LLM 业务研发更高效和创新。
—2—
超干货 Code Interpreter 技术实战直播
为了帮助同学们掌握好 AI Agent 技术架构和应用案例实战,明晚20点,我会开一场直播和同学们深度聊聊:
第一、Code Interpreter 应用场景解析
第二、Code Interpreter 技术架构深度剖析
第三、基于 LangChain 实现 Code Interpreter
第四、Code Interpreter 架构实践中的难点及解决方案
请同学点击下方按钮预约直播,咱们明晚20点不见不散哦~~
近期直播:《基于从原理到实现教你做出一个 Code Interpreter》
END
这篇关于从原理到实现教你做一个Code Interpreter的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!