(1)算法原理简单;
(2)不需针对模型进行训练和预测
(1)A*使用传统贪婪策略,每次都选择当前最优的路径,容易造成局部最优,导致规划失败或者只能找到次优的路径;
(2)A*算法模型复杂且计算量大,很难进行实时的路径规划
(1)预测结果速度非常快;
(2)使用ϵ-贪婪策略,在训练中广泛探索不同的状态,找到更合理的路线