江南机电设计研究所 贵州贵阳 550009
摘要:为解决作战博弈对抗中由于策略集较大,变量多出现的求解难度指数型增长等问题,如何在复杂条件下有效获取作战博弈对抗中的混合策略解还需进一步研究。本文提出一种基于Hopfield神经网络的作战对策模糊决策方法,利用Hopfield神经网络模型进行混合策略的求解;并将作战对策的双边冲突局势下的决策问题,转化为单边风险决策问题,通过模糊决策方法来对作战对策问题进行处理,选出最优策略。
关键词:Hopfield神经网络;矩阵决策;模糊决策方法
1 引言
作战决策是指作战指挥员为实现一定的作战企图或目标,对所属部队未来作战行动的决定,即定下作战决心的过程及结果。作战指挥员在进行作战决策时,需要根据作战实际情况,拟制多种可行的作战方案,并对所有方案进行综合评估,选出最优方案,这实质上是一个多属性决策问题。因此作战首先要对策略进行优化选取,对对抗双方来说一方的赢得就是另一方的损失,则可以用对策论[1]来研究作战决策问题。
矩阵对策是对策论的基础,由于在不确定条件下赢得矩阵中的元素难以精确表示,很多文献探讨了改进的模糊矩阵对策方法[2-7],特点是策略集、赢得矩阵由模糊集描述。但是存在的问题是当策略数量较大时,运算效率和准确性明显降低。本文针对这些方法的不足,提出了一种基于Hopfield神经网络的作战对策模糊决策方法,并给出了求解算法流程。
2基于Hopfield的模糊决策方法
针对作战博弈对抗中混合策略求解出现指数性质的“爆炸”现象。本文利用Hopfield神经网络具有的优化计算能力,通过构造能量函数进行混合策略的求解,然后以模糊决策方法来对带有混合策略的决策矩阵进行处理,从而选出最优策略。
2.1决策矩阵
假设在一次作战行动中存在个作战步骤,决定本次作战的作战步骤是双方信息和所做策略,在第个步数时,D(Defend)方所作策略集合为,A(Attack)方所作策略集合为,当D选定的策略为,A选定的策略为双方局势为,以防御方D位例,此时防御方D的效用矩阵为
(1)
其中,分别为A方和D方在第步的效用。
从而构造的矩阵对策模型可以记为
对A,D双方而言,若存在等式与等式成立,则称与为对策G的值,对应的策略组合为对策G在纯策略下的解,和分别为D和A在第i步的最优策略。
但在典型作战对抗博弈情况下,由于战场环境的高度复杂以及人为因素,一般不存在纯策略解,但总存在混合策略解,即局中人选取不同策略的概率分布。即对矩阵对策,有D方的混合策略集
(2)
(3)
对此,可以将混合策略的求解转化为线性规划问题求解,即将对矩阵对策的求解等价于一堆互为对偶的线性规划问题,G的阶、等价于下面两个不等式的解:
(4)
(5)
2.2Hopfield神经网络模型
Hopfield神经网络是有美国加州理工学院的Hopfield提出的,由于它对于所谓“组合爆炸”的离散优化问题具有极强的解适应性,可以很好的用来解决对作战博弈对抗进行混合策略求解时存在的策略集较大、变量较多导致的指数性质的“爆炸”现象,因此引入具有优化计算能力的Hopfield模型来进行混合策略的求解。
对于公式4-5的线性规划问题,求解思路是:根据目标函数与约束条件构造能量函数,能量函数的极小点就对应于线性规划问题的最优解。
以公式4为例,说明利用Hopfield神经网络求解混合策略的步骤和算法
步骤一:构造能量函数:
(6)
其中,为一个控制参数,为罚函数,。
另外为了满足的要求,选择神经网络的输出变量与对应的状态变量的关系为:,这里取为线性函数是为了保证可导。
步骤二:求导数:
(7)
令
(8)
其中,为系数
则有
(8)
公式8表明能量函数E是时间t的单调下降函数,故公式9可知:
(9)
确定的神经网络模型最后将达到系统的稳定状态,其能量函数取极小点,亦即公式4中目标函数在满足约束条件下达到极小。
步骤三:有了神经网络的稳定输出,我们即可以求出D方的混合策略为:
(10)
同理设计公式5的Hopfield神经网络实现模型,设稳定输出为,则A方的混合策略为:
(11)
至此我们已求出作战博弈对抗的混合策略解。
2.3作战对策模糊决策方法
作战对策是一种在冲突环境下的对抗现象,通常用博弈论的方法来分析和处理,找出“稳定解”或“平衡解”,这样得出的结果是一种保守结果。而在实战中,决策者往往采用以最小的冒险代价去取得尽可能大的胜利的行动策。为此我们将作战对策的双边冲突局势下的决策问题,转化为单边风险决策问题,并通过模糊决策方法来对作战对策问题进行处理,选出最优策略。具体步骤如下:
步骤一:建立带混合策略的对策矩阵:
(12)
步骤二:计算相对偏差值,
其中,,分别称为理想优、劣策略向量,于是得由相对偏差值构成的模糊矩阵。
步骤三:计算加权相对偏差距离
(13)
步骤四:选出D方的最优策略
令,则D方的最优策略为。
3 基于Hopfield神经网络的作战对策模糊决策流程
在利用基于策略集合构建的效用矩阵后,结合Hopfield神经网络模型对线性规划模型进行求解,形成基于Hopfield神经网络的作战对策模糊决策流程,见图1。
图 1基于Hopfield神经网络的作战对策模糊决策流程
4 案例应用
4.1矩阵对策分析
假定在一次战斗中,针对进行的第一步策略,D方指挥员结合敌我情报决定有五种策略,同时根据情报推测A方可能采取相应的五种策略。记D方五种策略为,A方五种策略为。由战场局势可得D方对抗关系矩阵为:
4.2神经网络模型求解
构造我方求解问题的能量函数:
根据仿真要求令。
将问题输入神经网络模型,经求解可得网络稳定输出为:
则进一步得A方混合策略:
同理用神经网络模型模块可得D方混合策略为:
4.3作战对策模糊决策
Step1:带混合策略的对策矩阵为:
Step2:相对偏差矩阵为:
Step3:加权相对偏差距离向量为:
Step4:
则由以上步骤可得A方的最优策略为第3个策略。
5 结论
本文针对作战博弈对抗进行混合策略求解时存在的策略集较大、变量较多导致的指数性质的“爆炸”现象。因此引入具有优化计算能力的Hopfield模型来进行混合策略的求解,提出了基于Hopfield神经网络的作战对策模糊决策方法。
试验结果表明,利用Hopfield模型来进行混合策略的求解能够快速高效的实现混合策略的求解,为此问题的研究提供了一条新的思路。同时在体系对抗过程中,若果可以准确判断出敌方的作战方案,可以使用最为有效的反制策略,从而提升作战效能。
参考文献
[1]李勇,杨光,尤志锋.大区域防空作战条件下防空兵作战方案的优选[J].现代防御技术,2005.33(5):1-3.
[2]罗均平,翟永庚,于伟,等.采用正盘理想方案和灰色关联法进行防空指挥决策算法研究[J],电光与挎制,2005.12(6):83-85.
[3]ZADEH L A.Fuzzy sets[J].Inform and control,1965,8:338.350.
[4]ATANASSOV K,Intuitionistie fuzzy sets[J].Fuzzy Sets and systems,1986,20:87-96.
[5]李登峰.模糊多目标多人决策与对策[M].北京:国防工业出版社,2003.
[6]何炼坚,冷国俊,蒲春霞. 基于决策概率逼近的矩阵对策近似求解方法[J]. 数学学习与研究,2020( 3) :116-118.
[7]顾佼佼,赵建军,刘卫华. 基于博弈论及 Memetic 算法 求解的空战机动决策框架[J]电光与控制,2015,22 (1):20-23.