计器-凯发官网注册

计器-凯发官网注册

阅读(16)

这项工作从理论角度探索了在深度强化学习中有着广泛应用的doubleq-learning算法,并首次给出了在有限状态-行为空间(finitestate-actionspace)下该算法的有限时长分析(收敛的时间复杂度)...

更多推荐