首页
Python
Java
前端
数据库
Linux
Chatgpt专题
开发者工具箱
tpgr专题
TPGR代码详解 Large-Scale Interactive Recommendation with Tree-Structured Policy Gradient
论文阅读笔记链接 github代码链接 目录 论文内容MDP过程训练TPGR过程:采样过程 结构讲解DEBUG过程代码详解整体流程run函数1. PRE_TRAIN()init()make_graph()train()evaluate 一些问题记录参数相关 2. Tree()init()construct_tree()build_mapping()hierarchical_code()pc
阅读更多...