一、中期答辩题目:基于深度强化学习的多智能体协同控制方法研究
二、中期答辩人:左轩
三、中期答辩时间:2021年12月22日19点30分
四、中期答辩地点:腾讯会议(203611181)
五、中期答辩内容简介:为了解决无人系统集群对抗中的多智能体协同控制问题,利用基于深度确定性策略梯度算法的多智能体深度强化学习方法,生成智能体的策略网络,实现多智能体的自主决策与协同对抗。
六、开题答辩人简介(附照片、个人基本信息、研究方向、获奖情况等)
左轩,男,我院2017级在读博士生,现阶段主要研究方向为机器学习、多智能体控制。