本文主要是介绍【论文观点】全华班LLM战队:图灵完备的RAG堆栈框架,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
前天出差来到曾经的那个小渔村里的那个街道办,参观并了解到曾经的以街道办一己之力构建对抗如今整个大国竞争的历史发展进程,昨夜也关注到近期在aigc浪潮下我们全华班发表的这篇paper以及所代表的针对复杂医学领域(也与自己当前的工作领域相关)rag方法,真的很让人兴奋。
针对这篇paper有一些自己的想法和观点也同步分享给大家,希望未来全华班们来的更猛烈一些~:
Ⅰ. 论文中的push和pop堆栈操作设计也许对于当下能力稍欠佳的llm或不太善于长文本处理的llm来说,确实能够有效屏蔽或噪声,但未来如果(只是如果哈)涉及到的更复杂的生物医学推理决策以及多样化的外部工具调用上,并采用更擅长长文本llm或更强大规划推理的llm后,结合真实世界中更复杂的医学推理与决策空间,其中pop掉的一些过程是否会造成对最终的推理过程再到最终结果的一些信息损失,也许在无法保证足够完美的通识与领域llm下,隐含在“噪声”之下的某些过程信息会对最终推理与决策结果带来某种空间探索与洞察的增益。
Ⅱ. 上述“Ⅰ”提及的如果领域推理问题扩展到更加复杂的多样化外部工具或函数的调用,那么结合基于llm隐含的参数化知识的充分计算与利用是否会为文中设计的图灵完备堆栈带来复杂性的提升,并或许进而带来文中图灵完备性理论证明的复杂度,感觉这样的话就不是面对的一个内存堆栈设计了,而是更类似于某种图灵完备的程序设计语言的复杂性。
Ⅲ. 在原作者某书上的笔记留言中,看到有人问到传统基于黑盒的llm隐参数化知识模型自身机理的状态与文中tc-rag堆栈显性状态是否有做过对比分析的问题,我其实感觉:作者是已经利用将llm隐层参数化知识显性而图灵完备的加载到tc堆栈中并统一计算历史状态了(通过条件困惑度cppl和tokens输出概率分布熵uct来评估状态St并进行与σ的判断),不过倒也可以对比分析下下head激活或各层激活状态,甚至扩展到更广泛的模型可解释性理论的探索当中来~
这篇关于【论文观点】全华班LLM战队:图灵完备的RAG堆栈框架的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!