本文主要是介绍2024/08(二) 近期关于AI的阅读和理解[笔记],希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
## Multi Agent/Flow
最近团队在实验 flowise 的 Agentflows 设计,顺带看了现在市面多加解决方案,这两天偶尔看到蚂蚁CodeFuse团队开发的Mulit Agent框架开发思想, 所以将他们一起总结归纳下。
-
Agent Base:构建了四种基本的Agent类型BaseAgent、ReactAgent、ExecutorAgent、SelectorAgent,支撑各种场景的基础活动
-
Communication:通过Message和Parse Message 实体完成Agent间的信息传递,并与Memory Manager交互再Memory Pool完成记忆管理
-
Prompt Manager:通过Role Handler、Doc/Tool Handler、Session Handler、Customized Handler,来自动化组装Customized 的Agent Prompt
-
Memory Manager:用于支撑 chat history 的存储管理、信息压缩、记忆检索等管理,最后通过Memory Pool在数据库、本地、向量数据库中完成存储
-
Component:用于构建Agent的辅助生态组件,包括Retrieval、Tool、Action、Sandbox等
-
Customized Model:支持私有化的LLM和Embedding的接入
from CodeFuse-muAgent
很早的 AutoGPT 也有相类似概念,再到 Langchain 据闻也搞自己的 Studio IDE, 其实总总的这些操作, 一个是补充LLM 不具备行业知识和现有业务流程的融入问题; 二是对齐也就是怕回答很妖的答案;由于现在LLM上下文窗口的问题, 做了很多补丁类似的事; 现有组织资产无非:数据(结构非结构)+ 流程(API); 现在市面上解决方案都无法达到比较能用(不知道是遗老派跟不上,还是这些产品方案太急,太糙,你瞅github代码能感受到),2024/08 近期关于AI的阅读和理解[笔记] 上次汇总中看到很多不错的思考方向, 但貌似部分是非开源的。
其实操作过 flowise, dify 都很容易联想到已存非常成熟的BPM 方式;是否有一种方案?Combining LLM flexibility and rule engine predictability?老牌的 JBPM 标准下的 Drool + 国内的新秀各种魔改的flow, 其实在和现有系统的融合上有不可言喻的优势。
亦或是新世界的解决方案要和遗老派彻底割裂,还是遗老派消化不良,跟不上节拍?
未来可能的情况现在的各种 ai?flow, 被大厂统一?或在LLM飞跃发展下,这些中间方案被边缘化和替代掉。
嘿嘿, 所以决定挖个新坑, 有义务统一下,看下面 【新坑】
## 新坑
在不破坏大家的习惯情况下,如何让你飞快地拥有驾驭LLM能力?也就是 buz words LLMOps(涵盖了大型语言模型(如GPT系列)开发、部署、维护和优化的一整套实践和流程)。
在粗扫了7/8家解决方案后,得出结论这个思路是可行的(quarkus-drools-llm)。
-
Lite flow
-
flowise
-
easy flow
-
dify
-
drool
-
autodev
-
....
SO 她得:
-
声明式的 DSL
-
简单易懂
-
静态扫描编译
-
设计和运行分离
-
可测,可追踪
-
plugable
-
可以和现在业务系统无缝衔接
-
context
-
API
-
-
成本低 - 过程
-
得有UI? 必须得,先安排IDEA
-
本地能搞
-
....
这得控制到 byte 级别了吧? 嘚!暂给她起名:
byteflowise = byte + flow + wise
Sure 你值得拥有!!!
## Generative UI
为什么一直对 UI 耿耿于怀?你终端用户只对UI感兴趣哈, 最近迫于很多友商的压力,咱也被迫上了个“AI”产品, 你发现基本是挂个AI的客服系统, 有的基本IF/ELSE 都不判断, 直接就是接的产品搜索, 唯一流出路径就是产品详情页。所以 AI 不 AI 对用户没得关系, 她感觉像AI 就是AI, 感觉不是就不是,所以这个脸面非常重要。
在这一块先前看到 Claude3 artifact 在搞这个方向, 然后又看到 Vercel 其实早就玩这个, 包括他们的 v0.dev;大概意思从LLM 推导出 UI 然后用 react 服务器端渲染 SSR, 其实这个咱们不陌生, 百度早前框计算(应该这个名字?)就有这个, 现在你在百度搜索,日历,天气相关内容,都是可直接交互的了;
按理说这个是很难的,在无限通用的集合里,推导出这个UI;但是在有限集合里面这个解很容易, 一个企业业务流程中涉及表单有多少?可以数的过来,不用去大模型推导UI 组建了, 识别业务意图就可以, 参数一识别,直接一个 iframe 就搞定---正有此意。
## 3A
最近因为一个游戏大家集体高潮了;苟众其实没有资格参与。
3A游戏通常指:
-
A lot of money(大量的金钱)
-
A lot of resources(大量的资源)
-
A lot of time(大量的时间)
SO, 你3A了吗?May be 3+?
A lot of confidence & determination...
## Refer
-
https://vercel.com/blog/ai-sdk-3-generative-ui
-
https://v0.dev/
-
https://github.com/codefuse-ai/CodeFuse-muAgent/blob/main/README_zh.md
-
https://github.com/Significant-Gravitas/AutoGPT
-
https://dify.ai/
-
https://flowiseai.com/
-
https://github.com/langchain-ai/langgraph-studio
-
https://github.com/mariofusco/quarkus-drools-llm
-
https://docs.dify.ai/v/zh-hans/learn-more/extended-reading/what-is-llmops
这篇关于2024/08(二) 近期关于AI的阅读和理解[笔记]的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!