1.1研究背景
随着人工智能技术的兴起,智能机器人已经广泛应用于物流配送无人机的巡检或自动驾驶等方面。在这些应用中,我们的机器人或者智能体,它往往需要到达多个目标点,路径规划已成为任务规划中最重要和最基础的要素之一; 当存在障碍物时,实时避障规划算法会根据这些中间点的方位生成避障的路径,确保能够安全稳定地到达目标位置,因此,多目标的路径规划成为了核心需求,目前,路径轨迹算法的研究主要聚焦于多个关键领域,如在复杂环境适应性方面;多目标优化也是研究重点等。
目前的轨迹规划大概分为三类,分别是传统算法,智能优化算法和强化学习算法。其中传统算法又分为A*和RRT等算法。其中A*算法在高维空间中,计算复杂度和内存消耗可能会显著增加,因此常应用于低维场景,此外A*算法加入了启发式函数,搜索速度快,搜索效率受启发式函数影响。RRT算法能够适应复杂的高维环境并进行探索,但基于概率学的探索方式导致算法的效率较低,生成的路径存在较多冗余节点。传统轨迹规划方法依赖精确数学模型,但机器人系统的非线性、时变性和不确定性使其难以满足实际需求。单个目标可以通过已有的轨迹规划方法中较好的优化解决,但是在一个场景下多目标的优化问题存在,往往会导致其他目标劣化且多个目标会发生冲突。
由于多目标会发生冲突,因此需要进行优化。为了进行优化,使用智能优化算法就可以。智能优化算法可分为蚁群,遗传等算法。蚁群算法凭借分布式并行搜索和信息素自适应调整的特点,能够有效平衡全局探索和局部开发能力,在路径规划和多目标优化问题中表现出色。遗传算法在适应各种复杂优化问题的通用性很强,不局限于特定的问题领域,然后通过选择交叉变异,不断迭代并筛选出最优解。强化学习是通过通过智能体育环境的相互交互策略,以最大化的累积奖励,然后深度强化学习结合了深度学习的感知能力和强化学习的决策优势,能够让这个平台能够在复杂环境中自主的决策。深度强化学习有望彻底改变人工智能领域,并代表着朝着构建对视觉世界有更高层次理解的自主系统迈出的一步。深度强化学习(DRL)自2006年Hinton的深度置信网络起步,2013年DQN在Atari游戏中超越人类水平,后续发展出DDPG、PPO等算法,提升了稳定性和效率。DRL结合感知与决策能力,支持无人平台自主优化。此外,Cooperative A*算法(2005)通过共享路径信息优化多机器人协作,应用于物流系统,但需结合全局优化方法避免局部最优。
单个机器人轨迹行走面临复杂环境下的路径规划问题,如动态障碍物、狭窄通道和非结构化地形。A*算法能高效搜索最短路径,但在动态环境中适应性差,路径不平滑且计算量随地图复杂度增加。蚁群算法则擅长全局优化和自适应调整,但初期收敛慢且计算成本高,对多个目标点进行排序的启发式规划策略,使融合改进算法能够以较短的路径长度遍历多个目标点。
为此,本文提出了结合两种算法的混合优化思路,结合两者优势,可先用A*快速生成初始路径,再通过蚁群算法优化路径平滑性和动态适应性。融合之后的算法综合性能更强,路径规划方面更优,鲁棒性强,在算法在计算效率和路径质量之间取得了良好平衡,既不过度消耗计算资源,又能显著提升路径质量,特别适合动态变化的环境。最终呈现出清晰的多目标路径规划场景。
1.2研究方法
针对多目标优化过程中目标的互相干扰和动态障碍物难以优化的问题,本文将A*算法和优化算法蚁群算法进行融合。首先对A*算法和蚁群算法两种算法进行分析对比,之后两种算法融合后进行最终结果研究
1.2.1A*算法
A*算法是一种启发式搜索算法,用于在图中寻找从起点到目标点的最优路径。它结合了Dijkstra算法的完备性(保证找到最优解)和贪心最佳优先搜索的高效性(通过启发式函数引导搜索方向)。A的核心思想是通过一个评估函数f(n)对每个节点进行优先级排序,优先扩展最有可能接近目标的节点。
A*算法的评估函数定义为:
其中
代表从起点到当前节点n的实际代价(已知成本)
代表从节点n到目标节点的启发式估计代价(需满足可采纳性,即不高估真实代价);
代表通过节点n到达目标的总估计代价。
1.2.2蚁群算法
蚁群算法优势显著:一是具分布式计算优势,人工蚂蚁并行搜索、群体协作,可降负荷、避局部最优,提升全局寻优能力;二是鲁棒性强,参数或解结构受扰动时仍能稳定收敛;三是正反馈机制为核心,信息素随优质解累积引导搜索,高效逼近最优解,适用于路径规划等组合优化场景。
信息素作为蚁群算法中蚂蚁间的通信媒介,其更新规则是算法运行的基础,该过程包含挥发与增强两部分,可用公式:

其中
代表边(i,j)在时刻t的信息素浓度;ρ代表信息素挥发系数(0<ρ<1),控制信息素衰减速度;Δ
代表所有蚂蚁在边(i,j)上留下的信息素增量。这一增量由蚂蚁总数m共同决定,即:

其中m:蚂蚁总数;其中
:代表蚂蚁k在边(i,j)上留下的信息素(若蚂蚁k未经过该边,则
=0)。
针对旅行商问题(TSP),信息素增量的计算有三种典型模型:常用的全局更新 Ant-Cycle 模型中

其中Q代表信息素常量(影响收敛速度);
代表蚂蚁k本次遍历的路径总长度。
局部更新的 Ant-Density 模型直接取:

而 Ant-Quantity 模型则结合边的距离
,定义为

其中
代表边 (i,j)的距离。
信息素的浓度状态直接决定了蚂蚁的路径选择行为,蚂蚁k从节点i转移到节点j的概率公式清晰体现了这一关联.当j属于蚂蚁k 未访问的节点集合
时,

其中α代表信息素重要程度因子越大,蚂蚁越倾向于选择信息素多的边;β代表启发式信息重要程度因子越大,蚂蚁越倾向于选择距离短的边;
代表启发式信息(如
=
,
为边(i,j)的距离),与信息素浓度共同构成蚂蚁路径选择的核心依据。
它的流程图如图1-1所示。

图1 蚁群算法流程图
其中,图1首先描述了初始化参数如蚂蚁数量、信息素挥发系数等及信息素分布后,算法进入迭代循环:每只蚂蚁基于信息素浓度和启发式信息(如距离倒数)的概率选择路径,构建完整解后计算路径长度;随后所有边信息素按挥发系数衰减,并由蚂蚁留下的信息素增量进行增强;每次迭代更新全局最优解,直至满足终止条件如最大迭代次数,最终输出最优路径及其长度。该过程通过信息素的动态调整平衡探索与利用,逐步收敛至全局最优。
1.2.3 融合A*和蚁群多目标路径规划算法
该混合算法采用主次协作和优势互补的结合方式,核心逻辑为:以A*算法的高效路径搜索能力为基础,用蚁群算法的全局寻优特性优化路径质量。具体结合过程是,在多航点规划中,先对相邻两个航点,优先通过A*算法快速生成一条初始可行路径;若A*因障碍无法找到路径,则直接启动蚁群算法寻路。当A*生成初始路径后,蚁群算法会将该路径作为信息素引导:在初始路径位置增强信息素浓度,让蚂蚁在迭代寻路时更易围绕A*路径探索,同时通过信息素蒸发与更新机制,跳出A*可能陷入的局部最优,最终选择蚁群优化后的更优路径若优化路径更短或保留A*原始路径,再将各两点间路径串联为完整多航点路径。
理论层面,结合了A*算法的启发式引导高效性,它是基于曼哈顿距离的h值函数,快速缩小搜索范围,保证找到最优解的完备性与蚁群算法的群体智能全局寻优性,它是模拟蚂蚁信息素通信机制,通过信息素重要性的代表α、启发式重要性的代表β参数平衡探索与利用,避免局部最优,提升路径适应性,同时弥补A*易受初始障碍分布影响、局部最优的缺陷,以及蚁群算法单独使用时收敛慢的问题。
融合算法流程图如下图2所示。
图2 融合算法流程图
图2描述了一个路径规划的过程。首先,生成静态障碍物地图,并设定起点、中间点和终点,同时生成初始动态障碍物,初始化地图与实体。接着,混合路径规划器进行初始化,利用A*算法寻找初始路径。若找到A*路径,则通过蚁群算法对其进行优化,并用A*路径增强信息素,随后进行蚁群迭代寻优,判断优化后的路径是否更优,根据判断结果选择蚁群优化路径或A*原始路径;若未找到A*路径,则直接使用蚁群算法寻路。若找到蚁群路径,将相邻固定航点之间的路径依次连接形成完整路径并进行动画可视化,之后判断动态障碍物是否需要更新,若需要则移动动态障碍物并更新当前位置,最后判断是否到达终点,若到达则等待后重新开始;若未找到蚁群路径,则规划失败,流程结束。
1.3实验做法
本文先通过A*算法来快速找到起点到终点的可行路径,然后再通过蚁群算法来承担路径优化和兜底探索的作用,最后两种算法融合采用先探索优化+兜底备用模式:A*快速生成初始路径并强化蚁群算法信息素以引导优化,优化路径缩短5%以上则采用,否则保留A*路径;A*无解时,蚁群算法兜底全局探索,保障规划有效最优。最后再进行融合算法的单目标与多目标路径规划,得出最后的结果。