tpgr专题

TPGR代码详解 Large-Scale Interactive Recommendation with Tree-Structured Policy Gradient

论文阅读笔记链接 github代码链接 目录 论文内容MDP过程训练TPGR过程:采样过程 结构讲解DEBUG过程代码详解整体流程run函数1. PRE_TRAIN()init()make_graph()train()evaluate 一些问题记录参数相关 2. Tree()init()construct_tree()build_mapping()hierarchical_code()pc