Openreview IClR2024审稿意见以及如何rebuttal

2023-11-11 11:04

本文主要是介绍Openreview IClR2024审稿意见以及如何rebuttal,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

R1

  1. 为什么直接从其他剧集获取信息可以提高性能,尽管动态可能会有所不同。

  2. 请与其他一些数据增强基线进行比较。

R2 

问题:

  1. 批评者和价值差异d(s,a,s',a')似乎是在IM中共同学习的。为什么这是一个有意义的目标?
  2. 与其他带有类比推理模块的方法相比,该方法的表现如何?
  3. 该方法如何在其他任务上执行?例如,其他 Mujoco 任务,如 Walker2d、Hopper 和 Humanoid 或 Meta-world [4] 任务。

R3

弱点:

方法

我相信缺少对该方法的重要描述。 虽然很清楚如何使用相似性计算网络和差分推理网络,但我没有看到任何关于它们被训练的信息。

我也有疑问为什么会这样。 从本质上讲,为了使该方法起作用,我们需要差分推理网络和相似性计算网络来很好地泛化状态和动作。否则,人为地为批评者设定的目标将具有误导性,并可能损害学习成绩。鉴于我找不到有关这些网络如何训练的信息,我真的怀疑这些网络是否能够快速适应并产生有意义的目标。

实验

鉴于该方法如此简单,并且论文提出了如此大的要求,我希望在更多领域进行评估。例如,既然您已经在 Acrobot 和 Lunar Lander 中评估该方法,为什么不同时评估 Cart Pole 呢?此外,雅达利游戏已被用作DRL方法的标准基准。我强烈建议至少在其中一些中做实验。

实验细节

根本没有关于实验的细节。 至少,需要讨论如何调整超参数以确保公平的比较。 还缺少有关该方法的实现和网络架构的重要细节。

与其他试图提高DRL方法样品效率的方法的比较

由于这种方法的重点是提高DRL方法的采样效率,因此我还希望看到与其他尝试做同样事情的方法进行比较,以了解它的有效性。

问题:

次要:

  1. 错误的引用:在第 5 页的底部,He et al., 2020 不应该被引用为 Adam 优化器,这是由于 Kingma & Ba, 2014 的。

R4 

弱点:

1.这篇论文的中心假设感觉是合理的,实验似乎证实了这一点。但是没有理论证据。本文不足以拆解和验证IM方法的优点,因此建议在实验的消融研究中重点讨论。 2.本文强调对现有大多数RL算法的IM进行了广泛的增强,但相关工作中主流RL算法的最新描述是2018年的SAC。这有点夸大其词,缺乏与最新工作的比较,尤其是解决数据效率的非基于像素的方法。 3.本文介绍的IM会带来额外的计算和存储过载,是否可以进行相关的消融研究来消除这部分干扰。 4.本文强调了求解高维状态空间和大规模问题的优势,但实验部分选择的连续Mujoco任务和离散Gym任务并不能代表上述问题场景。同时,第 6 页的最后一段强调了无模型 RL,这与全文中描述的限制范围不一致。 5.本文的实验缺乏对方法依赖神经网络结构和超参数设置的描述。

问题:

1.本文在第3页的最后一段中强调,早期的工作可能导致“灾难性的学习失败”。这种说法的由来不明,本文也没有通过实验来证明IM解决这一问题的优势。 2.算法1的描述不清晰、不规范,缺乏相关的神经网络。直观地说,IM引入的网络似乎没有更新过程。 3.In 论文第8页的最后一段,对“钟摆”任务的实验结果的描述,直接归因于有限的状态空间,在没有类似实验或证据的情况下,这样的描述是不够的。

参考资料

CVPR 2021评审出炉!得分惨不忍睹,面对奇葩评审该如何反击? - 知乎 (zhihu.com)

Imagination Mechanism:网格信息传播提高强化学习中的数据效率 |打开评论 (openreview.net)

作为审稿人,你什么情况下会选择拒稿?_weak accept-CSDN博客 

这篇关于Openreview IClR2024审稿意见以及如何rebuttal的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/389608

相关文章

当天审稿,当天上线,9月检索!

各领域CNKI知网普刊,最快一期预计下周送检,最快1天上线 领域广,计算机,社科,医学等各个方向都能收 包检索,可提供期刊部发票 知名出版社英文普刊 NO.1、Food Science and Nutrition Studies ISSN: 2573-1661 审稿周期:1个工作日内 录用通知:投稿后1个工作日 检索时间:9月份 接收范围: 公共医学、社会医学 1-4周

ICLR2024: 大视觉语言模型中对象幻觉的分析和缓解

https://arxiv.org/pdf/2310.00754 https://github.com/YiyangZhou/LURE 背景 对象幻觉:生成包含图像中实际不存在的对象的描述 早期的工作试图通过跨不同模式执行细粒度对齐(Biten et al.,2022)或通过数据增强减少对象共现模式(Rohrbach et al.,2018; Kim et al.,2023)来解决小规模多

各位天命人!国自然评审意见出来了,那如何判断是否上会?

公众号:生信漫谈,获取最新科研信息! 各位天命人!国自然评审意见出来了,那如何判断是否上会?https://mp.weixin.qq.com/s?__biz=MzkwNjQyNTUwMw==&mid=2247487055&idx=1&sn=1dc8b66e10323d37e477e8829dad0c76&chksm=c0e9ebbff79e62a94fcd49341ae18cfe19aa3aa8

为什么国自然越来越难中?不同类型的评审意见怎么看?

读懂专家评议对于下一次的标书甚至是立项的路径的改进有着重要的作用,同时也是对自己项目情况的一次全面体检与更新。 潦草敷衍型 此类型的评审意见基本上是把申请人的摘要摘抄一遍,加上简单的评价,没有具体或者中肯的意见和有效信息。 📌例:本研究拟探究XX基因的XX修饰方式导致XX癌症发生发展的机制,加深对XX癌症发生发展机制的研究,对XX癌症的治疗或预防策略有潜在意义。创新性尚可。 ⏩这类专

神秘顾客意见及反馈

神秘顾客,可以帮助企业了解各种类型窗口行业营业/服务的环境、服务人员的服务态度、业务素质和技能等情况,广泛应用到如电信、银行、超市、连锁店、医院等窗口服务性行业。从企业的长远发展来考虑,做神秘顾客调查是非常重要的。开元研究,成立于2002年,是一家专业的市场调研公司。具有丰富神秘顾客访问项目经验,包括银行、通信、商场超市、餐饮、房地产及其它窗口服务行业。以下则是其房地产售楼处神秘顾客调查方案-神秘

康奈尔大学之论文审稿模型Reviewer2及我司七月对其的实现(含PeerRead)

前言 自从我司于23年7月开始涉足论文审稿领域之后「截止到24年6月份,我司的七月论文审稿GPT已经迭代到了第五版,详见此文的8.1 七月论文审稿GPT(从第1版到第5版)」,在业界的影响力越来越大,所以身边朋友如发现业界有相似的工作,一般都会第一时间发给我,比如本部分要介绍的康奈尔大学的reviewer2 当然,我自己也会各种看类似工作的论文,毕竟同行之间的工作一定会互相借鉴的,我们会学他们

水利部:关于推进水利工程建设数字孪生的指导意见

从《关于大力推进智慧水利建设的指导意见》到《十四五智慧水利建设规划》,自2022年以来,水利部先后出台一系列文件部署“数字孪生水利”政策框架。2024年4月1日,水利部再次颁发《关于推进水利工程建设数字孪生的指导意见》,强调: “到2025年,新建大型和重点中型水利工程普遍开展信息化基础设施体系、数字孪生平台和业务应用体系建设,实现对水利工程建设过程动态感知、智能预警、智慧响应,数字孪生

农林科学SCI期刊,中科院2区,IF=5.5+,审稿速度快,性价比非常高

一、期刊名称 APPLIED SOIL ECOLOGY  二、期刊简介概况 期刊类型:SCI 学科领域:农林科学 影响因子:5.509 中科院分区:2区 三、期刊征稿范围 应用土壤生态学涉及土壤生物的作用及其相互作用,涉及可持续性和生产力、养分循环和其他土壤过程、土壤功能的维持、人类活动对土壤生态系统的影响以及对土壤害虫、疾病和杂草的生物(技术)控制。 四、期

从大量文本中挖掘‘典型意见‘-基于DBSCAN的文本聚类实战

文本聚类,是一个无监督学习里面非常重要的课题,无论是在风控还是在其他业务中,通过对大规模文本数据的分析,找出里面的聚集观点,有助于发现新的问题或者重点问题。 通过对评论文本的分析,我们可以发现消费者关注的产品或服务痛点 通过对店铺商品标题的文本聚类,可以知道店铺主要集中卖什么类型的商品 通过对来电语音转文本聚类,可以知道公司售后业务的典型问题或者新问题的爆发 ... ... 通过对新闻文

Flowable工作流中会签节点处理回退并清除审批意见

文章目录 1,操作方法及步骤2,实现细节3,总结 1,操作方法及步骤 在Flowable工作流会签流程中,如果最后一个人选择回退流程,想要清除前面用户A和B填写的审批意见,需要通过Flowable提供的API来操作流程实例和任务,具体操作方法可以遵循以下步骤: 设计流程时设置回退规则:在设计工作流时,应该考虑到回退的情况,并为每个节点设置相应的规则。例如,当流程被回退时,可