摘要:在战场通信对抗中,干扰参数的合理分配一直是一项具有挑战性的任务。本文基于强化学习对干扰方的干扰功率、干扰波形和干扰目标进行分配,在保证干扰效果的前提下,以节省资源消耗,提高资源的利用率。具体地,将干扰参数分配问题构建为完全协作的多智能体任务,采用集中式训练、分布式决策的SA-QMIX算法缓解多智能体决策维度高的问题,通过在QMIX算法中引入最大熵方法和多头注意力机制,使智能体在部分可观测环境下更有效地协同决策。仿真结果表明,本文所采用的SA-QMIX算法进行干扰参数分配时相比传统的QMIX算法能够在减少1.5dbm的干扰功率前提下,增加5%的干扰成功率,并且算法的收敛速度更快。