reasoning专题

【Agent】Agent Q: Advanced Reasoning and Learning for Autonomous AI Agents

1、问题背景 传统的训练Agent方法是在静态数据集上进行监督预训练,这种方式对于要求Agent能够自主的在动态环境中可进行复杂决策的能力存在不足。例如,要求Agent在web导航等动态设置中执行复杂决策。 现有的方式是用高质量数据进行微调来增强Agent在动态环境中的决策能力,但这往往会出现复合错误和有限的探测数据,最终导致结果不够理想。 2、提出方法 Agent Q 框架将蒙特卡洛树搜

反事实推理(Counterfactual Reasoning):探索未知与决策的桥梁

反事实推理(Counterfactual Reasoning):探索未知与决策的桥梁 反事实推理(Counterfactual Reasoning)是一种思维方式,它试图回答“如果……会怎样?”的问题。简单来说,反事实推理是在已有事实的基础上,通过假设条件发生改变,来推测可能的结果。我们可以通过这个过程更好地理解因果关系,并帮助我们在未来做出更好的决策。 1. 反事实推理的基本原理 反事

VCTP(Visual Chain-of-Thought Prompting for Knowledge-Based Visual Reasoning)论文

目录 摘要介绍相关工作方法总体模型细节 实验 摘要 知识型视觉推理仍然是一个艰巨的任务,因为它不仅要求机器从视觉场景中解释概念和关系,而且还需要将它们与外部世界知识联系起来,对开放世界问题进行推理链。然而,以前的工作将视觉感知和基于语言的推理视为两个独立的模块,在推理的所有阶段都没有同时关注这两个模块。为此,我们提出了一种知识型推理的视觉思维链提示(VCTP),它涉及视觉内容与自

越复杂的CoT越有效吗?Complexity-Based Prompting for Multi-step Reasoning

Complexity-Based Prompting for Multi-step Reasoning 论文:https://openreview.net/pdf?id=yf1icZHC-l9 Github:https://github.com/FranxYao/chain-of-thought-hub 发表位置:ICLR 2023 Complexity-Based Prompting for

Interleaving Retrieval with Chain-of-Thought Reasoning for ... 论文阅读

Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions 论文阅读 文章目录 Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-S

《超越代码生成:Agentic Reasoning探索研发智能化》——【研发效能·创享大会】

【研发效能·创享大会】是由IDCF社区独家举办,这个会议主要聚焦于技术和研发管理,旨在为社区成员提供一个学习与交流的平台,分享技术经验,交流行业见解,促进技术合作与创新,发现并培养人才,推动软件行业的发展 。 此次大会涵盖了众多议题,如AIGC技术的应用领域和发展趋势、B端业务增长、代码质量和产品稳定性、研发管理工具和方法、领导力在团队管理中的角色等。这些内容旨在帮助参会者深入了解行业的最新动态

Overview of knowledge reasoning for knowledge graph

摘要 知识图是影响知识表示的大规模语义网络。从现有数据中挖掘隐藏知识,包括三元组知识推理,是知识图的主要目标。随着神经网络(NN)和深度学习(DL)的发展,三元组知识推理的可解释性逐渐降低;此外,机器学习的不是实际的推理,而是数字推理的捷径。为了解决这个问题,需要在知识图中引入更多的背景知识:因果图可以为推理提供有价值的因果逻辑知识;时间四重组可以提供基本的时间分布细节;而常识性图表可以提供

Sarcasm detection论文解析 | 通过阅读进行讽刺推理-Reasoning with sarcasm by reading in-between

论文地址  论文地址:[1805.02856] Reasoning with Sarcasm by Reading In-between (arxiv.org)  论文首页   笔记大纲 通过阅读进行讽刺推理论文笔记 📅出版年份:2018📖出版期刊:📈影响因子:🧑文章作者:Tay Yi,Luu Anh Tuan,Hui Siu Cheung,Su Jian

论文阅读 Graph-Based Global Reasoning Networks

Graph-Based Global Reasoning Networks 论文题目:基于图结构的全局推理网络 会议:CVPR 2018 作者单位:脸书研究院 新加坡国立大学 作者: Chen Yunpeng 代码:https://github.com/NUST-Machine-Intelligence-Laboratory/nsrom/tree/main/segmentation/libs

Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasonin

摘要 大型语言模型(llm)在复杂任务中表现出令人印象深刻的推理能力。然而,他们在推理过程中缺乏最新的知识和经验幻觉,这可能导致不正确的推理过程,降低他们的表现和可信度。知识图谱(Knowledge graphs, KGs)以结构化的形式捕获了大量的事实,为推理提供了可靠的知识来源。然而,现有的基于kg的LLM推理方法只将kg作为事实知识库,忽略了其结构信息对推理的重要性。在本文中,我们提出了一

Self-Consistency Improves Chain of Thought Reasoning in Language Models阅读笔记

论文链接:https://arxiv.org/pdf/2203.11171.pdf 又到了读论文的时间,内心有点疲惫。这几天还是在看CoT的文章,今天这篇是讲如何利用self-consistency(自我一致性)来改进大语言模型的思维链推理过程。什么是self-consistency呢,读完论文感觉可以这么解释,就是有个渣男/大语言模型,你问了他五次昨天晚上九点跟谁在一起/文章里问大语言模型一个

论文浅尝-WSDM | Stepwise Reasoning for Multi-Relation QA

论文笔记整理:谭亦鸣,东南大学博士。 来源:WSDM ’20 链接: https://dl.acm.org/doi/pdf/10.1145/3336191.3371812   1.介绍 知识图谱问答旨在利用知识图谱的结构化信息回答以自然语言提出的问题。当面对多关系问题时,现有基于embedding的方法所采用的构建主题实体子图策略会导致较高的时间复杂,同时,由于数据标注的高成本,精确地给出回

论文浅尝 - ICLR2020 | Abductive Commonsense Reasoning

论文笔记整理:毕祯,浙江大学硕士,研究方向:知识图谱、自然语言处理。   链接:https://arxiv.org/pdf/1908.05739.pdf 动机 尽管长期以来人们一直认为归因是人们在自然语言界线之间进行解释和阅读的核心,但很少有研究支持归因自然语言推理和产生。这篇文章提出了第一个研究基于语言的归纳推理可行性的研究,引入了一个数据集ART,该数据集包含超过20k的常识性叙述上下文

读《Reasoning with Heterogeneous Graph Alignment for Video Question Answering》

摘要 主要的视频问题回答(VQA)方法是基于细粒度表示或特定于模型的注意机制。他们通常分别处理视频和问题,然后将不同模式的表示输入后续的后期融合网络(决策层融合?)。虽然这些方法使用一种模态的信息来增强另一种模态,但它们忽略了在统一模态中整合模态间和模态内的相关性。 本文提出了一个深度异构对视频图对齐网络。从四个步骤来探索网络架构:表示、融合、对齐和推理。在我们的网络中,模态间信息和模态内信息可

论文阅读《2020ICML:Inductive Relation Prediction by Subgraph Reasoning》

论文链接 论文工作简介 知识图谱中关系预测的主要范式涉及实体和关系的潜在表示(即嵌入)的学习和操作。 然而,这些基于嵌入的方法并没有显式地捕获知识图谱背后的组合逻辑规则,并且它们仅限于直推式设置,在直推式设置中,实体的全部集合必须在训练期间已知。 本文提出了一种基于图神经网络的关系预测框架GraIL,它在局部子图结构上进行推理,并具有很强的归纳偏差来学习实体独立的关系语义。 如右图,

Interactive Path Reasoning on Graph for Conversational Recommendation阅读笔记

1.首先理解这种任务型对话推荐 1.1过程 这一类型的对话推荐相较于传统对话推荐的一个显著优势在于:directly ask users about their preferred attributes on items(traditional methods suffer from the intrinsic limitation of passively acquiring user

论文阅读之Multimodal Chain-of-Thought Reasoning in Language Models

文章目录 简介摘要引言多模态思维链推理的挑战多模态CoT框架多模态CoT模型架构细节编码模块融合模块解码模块 实验结果总结 简介 本文主要对2023一篇论文《Multimodal Chain-of-Thought Reasoning in Language Models》主要内容进行介绍。 摘要 大型语言模型(LLM)通过利用思想链(CoT)提示生成中间推理链作为推断答案的基

论文分享(3)----DialogueCRN: Contextual Reasoning Networks for Emotion Recognition in Conversations

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 论文分享(3)----DialogueCRN: Contextual Reasoning Networks for Emotion Recognition in Conversations 前言一、摘要二、模型解析1.定义问题2.Text Features3.Model3.1感知阶段3.2认知阶段 4.模型图和结果 总

Recurrent Feature Reasoning for Image Inpainting-image inpainting 实践

Image inpainting 论文总结: https://github.com/geekyutao/Image-Inpainting Recurrent Feature Reasoning for Image Inpainting github: https://github.com/jingyuanli001/RFR-Inpainting 环境:Ubuntu16.04, python

Iterative Visual Reasoning Beyond Convolutions代码运行

代码地址:https://github.com/endernewton/iter-reason 论文:Iterative Visual Reasoning Beyond Convolutions 注意:作者公布的源码里面没有全局推理模块这个有点坑。所以我只是在我的环境下把代码调通了然后并没有继续训练下去。 环境:python3.5+tensorflow1.10+cuda9.0 遇到的问题:g

文献翻译与阅读《ChatRule: Mining Logical Rules with Large Language Models for Knowledge Graph Reasoning》

目录​​​​​​​ 知识图谱与大模型如何结合? 一、预备知识 1 prompt 提示词 2 AI指令的实用意义 3 AI指令编写的方法,编写AI提示词(Prompt)的一般步骤 4 AI提示词(Prompt)的学习重点与意义: 4 Prompt的应用场景 5 Prompt也存在一些挑战和限制 6 大语言模型的预训练:思维链(Chain-of-thought,CoT)原理详解 6

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models导读

通过生成一系列中间推理步骤(即“思维链”)显著提高大型语言模型进行复杂推理的能力 这篇论文探讨了如何通过生成一系列中间推理步骤(即“思维链”)显著提高大型语言模型进行复杂推理的能力。研究人员使用一种简单的方法——思维链提示法——提供一些思维链示例作为提示,发现这种方法可以使足够大的语言模型自然地获得这种推理能力。实验结果表明,在三个大型语言模型上进行测试时,思维链提示法可以显著提高在算术、常识和

Case-Based Reasoning Tool铪

Case-Based Reasoning Tool 案例式推理 (Case-Based Reasoning, CBR) 是知识表达的一种新方法, 最主要就是利用先前的经验来解决问题。 在 CBR 中, 知识是以过去的案例来表示。 而需要解决类似问题时, 便使用这些经验来引导推理。 简单地说, Case-Based Reasoning 就是: 人类推理的过程 推理过程的表达 在应用程序发展上,

EMNLP 2020 BiST: Bi-directional Spatio-Temporal Reasoning for Video-Grounded Dialogues

动机 基于视频的对话是非常具有挑战性的,这是因为(i)包含空间和时间变化的视频的复杂性,以及(ii)用户在视频或者多个对话轮中查询不同片段和/或不同目标的话语的复杂性。然而,现有的基于视频的对话方法往往关注于表面的时间级视觉线索,而不是从视频中获取更细粒度的空间信号。作者的方法旨在通过双向推理框架从视频中检索细粒度信息来挑战基于视频的对话来解决这一问题。与视频对话相关的任务是视频问答和视频c

【提示工程】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

解决问题 探索大语言模型解决推理问题的能力。从头训练或微调模型,需要创建大量的高质量含中间步骤的数据集,成本过大。 相关工作 1、使用中间步骤来解决推理问题 (1)使用自然语言通过一系列中间步骤解决数学应用题 (2)通过创建更大的数据集微调语言模型,而不是从头训练 (3)使用语言模型一行一行的预测中间结果预测最终输出 2、采用提示方式 (1)少样本提示 (2)自动学习提示 (3)描述任务的

【提示工程】Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

解决问题 探索大语言模型解决推理问题的能力。从头训练或微调模型,需要创建大量的高质量含中间步骤的数据集,成本过大。 相关工作 1、使用中间步骤来解决推理问题 (1)使用自然语言通过一系列中间步骤解决数学应用题 (2)通过创建更大的数据集微调语言模型,而不是从头训练 (3)使用语言模型一行一行的预测中间结果预测最终输出 2、采用提示方式 (1)少样本提示 (2)自动学习提示 (3)描述任务的