调参史专题

深度强化学习血泪调参史:从人工智障到人工智能

深度强化学习血泪调参史:从人工智障到人工智能——粗调 背景应用深度强化学习经常遇到的问题调参大法针对问题1:不能达到预期效果,AI宛如神经智障。导致这种问题的源头可能有太多太多种,但是一旦遇到这种问题,建议从以下几个方面入手:针对问题2:神经网络的cost不下降,一直在高位(有时候的cost能达到二位数)徘徊。产生这种情况的原因很有可能是神经网络的初始化存在问题,举例:神经网络的初始化输出落