一、 中期答辩题目:基于强化学习的多无人机协同攻防对抗方法研究
二、 中期答辩人:雷蕾
三、 中期答辩时间:2023年1月5日 下午15:00
四、 中期答辩地点:腾讯会议线上答辩 会议号326-513-975
五、 中期答辩内容简介:
针对多智能体强化学习中的信用分配问题,引入动态解耦并设计一种结合距离奖励和编队奖励的奖励函数,提出了一种基于PPO算法和集中培训和分散执行(CTDE)框架的多智能体注意近端策略优化算法;针对强化学习中前期探索过程所得奖励差值较大导致探索性能下降问题,提出了一种基于频率分解近端策略优化算法(FD-PPO)。最后,在Open AI的gym强化学习环境上开发研究所需的无人机群追逃对抗的仿真平台进行实验验证。
六、 中期答辩人简介
雷蕾,女,帝博国际会所入口控制科学与工程专业,2019级在读博士研究生,主要研究方向为多无人机追逃博弈。