hiro专题

分层强化学习 Data-Efficient Hierarchical Reinforcement Learning（HIRO）（NeurIPS 2018）

\quad 分层的思想在今年已经延伸到机器学习的各个领域中去，包括NLP 以及很多representataion learning。 \quad 近些年，分层强化学习被看作更加复杂环境下的强化学习算法，其主要思想就是将一个大的问题进行分解，思路是依靠一个上层的policy去将整个任务进行分解，然后利用下层的policy去逐步执行。 Code: https://github.com/te