uncertain专题

Causal Effect Identification in Uncertain Causal Networks

我们采用以下六个分类标准为: 数据模态: 观察数据: 这类数据是在没有研究人员任何干预的情况下收集的。它通常很容易获得,但由于潜在的混杂变量而带来挑战。例如,在流行病学中,由于实验的伦理限制,观察性研究很常见。参考文献[6]讨论了观察性研究中因果效应的识别和估计。实验数据: 这是因果推理的黄金标准,因为它涉及随机对照试验(RCT),研究人员在其中操纵治疗变量。RCT旨在最大限度地减少偏差,为因

Sequential Decision Making under uncertain - 不确定性条件下的序列决策制定

Sequential Decision Making 序列决策制定可以被归纳为为下面的交互式闭环过程: 目标:选择能够最大化未来全部收益期望的动作(actions)。 这可能不一直都是好的标准,但这是大多数强化学习所关注的。但现在也有一些人对distribution honorable强化学习和其他方面有兴趣 可能需要平衡即时收益和长期回报可能需要策略化的行为以取得高回报(你可能需要牺牲初