图/表 详细信息

基于深度强化学习的北极最优航线智能规划算法研究
胡浩帆, 吴阿丹, 韩冰, 朱小文, 陈胜鹏, 张瑞
冰川冻土, 2025, 47(2): 587-598.   DOI: 10.7522/j.issn.1000-0240.2025.0046

方向QQ
Q(5,上)=00+0.001×(-2.46+0.97×0-0)=-0.00246
Q(5,下)=00+0.001×(-1.53+0.97×0-0)=-0.00153
Q(5,左)=00+0.001×(-100+0.97×0-0)=-0.1
Q(5,右)=00+0.001×(-1.19+0.97×0-0)=-0.00119
表2 5号点更新一次后4个动作方向对应的最新Q
本文的其它图/表