Advanced Search

ISSN1001-3806 CN51-1125/TN Map

Volume 45 Issue 6
Nov.  2021
Article Contents
Turn off MathJax

Citation:

Tracking mode decision of compound seeker based on random forest

  • Received Date: 2020-12-11
    Accepted Date: 2020-12-31
  • In order to improve the adaptability of complex logic decision-making in the tracking mode of the compound seeker, a mode decision network was constructed using random forest. The model error compensation was combined to optimize the traditional manual condition interpretation process, and the classification accuracy of the model was improved at the same time. The proposed method was added to the compound seeker for theoretical analysis and simulation verification. The results show that the classification accuracy of tracking mode is about 100%, and the running speed increased by 16%, the amount of code was reduced by 3 times. The optimized tracking mode decision process, which based on random forest and error compensation, can good adapt to the seeker tracking mode decision, efficiently implement the autonomous decision of tracking mode. This research algorithm provides a reference for the efficient realization of seeker tracking mode decision-making.
  • 加载中
  • [1]

    FAN H T, CUI H, TIAN G. A review on the 70-year development of air-to-air missiles[J]. Aero Weaponry, 2016(1): 3-12(in Chin-ese).
    [2]

    LIU K, LI L J. Development analysis of air-to-air missile and infrared guidance[J]. Laser & Infrared, 2016, 46(1): 5-10(in Chinese).
    [3]

    LI L J, LIU K. Analysis of air-to-air missile IR image detecting technology development[J]. Infrared Technology, 2017 39(1): 1-7(in Chinese).
    [4]

    WANG W K, TIAN R, WU H, et al. Development and characteristics of foreign infrared missile guidance system[J]. Aerodynamic Mis-sile Journal, 2017 (11): 33-37(in Chinese).
    [5]

    GAO X D, WANG F, FAN J X. The challenge and development paths for precision guidance system[J]. Tactical Missile Technology, 2017(6): 62-69(in Chinese).
    [6]

    LI Sh Sh, LI W J, FU Zh Q, et al. The development of precision guidance technology from the perspective of operational use and technical improvement[J]. Aerodynamic Missile Journal, 2017(3): 74- 77(in Chinese).
    [7]

    US NAVY. AIM-9X air-to-air missile upgrade navy programs[R]. Washington DC, USA: US Navy, 2015: 107-120.
    [8]

    ZHANG T F, ZHANG H X, MENG F, et al. Application of improved Hausdorff distance and quantum genetic algorithm in laser image guidance[J]. Laser Technology, 2016, 40(3): 321-325(in Chinese).
    [9]

    SHEN Y X, HUANG X X, WANG Y H. The foreign multimode compound guidance technology[J]. Sichuan Ordnance Journal, 2013, 34(10): 29-31(in Chinese).
    [10]

    HE Y M, ZHOU J. Methods of data fusion based on IR/MMW dual-model combined guidance[J]. Journal of Projectiles, Rockets, Missiles and Guidance, 2008, 28(1): 75-78(in Chinese).
    [11]

    JIANG Y Y. Research on the information fusion technology of multi-mode guidance[D]. Harbin: Harbin Engineering University, 2007: 17-21(in Chinese).
    [12]

    WU Y Sh, XU R J. Simulation analysis on combined seeker data fusion algorithm[J]. Radio Engineering, 2018, 48(12): 1072-1076.
    [13]

    LI J, ZHANG T, ZHANG P F, et al. Analysis of key techniques of multi-mode seeker for anti-missile/anti-near-space vehicle interceptor[J]. Aero Weaponry, 2018(1): 8-14(in Chinese).
    [14]

    GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C//The IEEE Conference on Computer Vision and Pattern Recognition. New York, USA: IEEE, 2017: 59-65.
    [15]

    SUO W K, HU W G, BAN L M, et al. Research on flight control of quadrotor UAV based on visual image[J]. Laser Technology, 2020, 44(4): 452-458(in Chinese).
    [16]

    ZHOU Zh H. Machine learning[M]. Beijing: Tsinghua University Press, 2016: 35-47(in Chinese).
    [17]

    SCHACHTER B J. Automatic target recognition[M]. 2nd ed. New York, USA: SPIE Press, 2017: 45-53.
    [18]

    KECHAGIAS-STAMATIS O, AOUF N, RICHARDSON M A. 3D automatic target recognition for future LIDAR missiles[J]. IEEE Transactions on Aerospace and Electronic Systems, 2017, 52(6): 2662-2675.
    [19]

    SCHACHTER B J. Automatic target recognition[M]. 3rd ed. New York, USA: SPIE Press, 2018: 17-32.
    [20]

    KIM S. Infrared variation reduction by simultaneous background suppression and target contrast enhancement for deep convolutional neural network-based automatic target recognition[J]. Optical Engineering, 2017, 56(6): 063108. doi: 10.1117/1.OE.56.6.063108
  • 加载中
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索

Figures(10) / Tables(4)

Article views(3075) PDF downloads(16) Cited by()

Proportional views

Tracking mode decision of compound seeker based on random forest

  • 1. Naval Equipment Department, Chengdu 610100, China
  • 2. Southwest Institute of Technical Physics, Chengdu 610041, China

Abstract: In order to improve the adaptability of complex logic decision-making in the tracking mode of the compound seeker, a mode decision network was constructed using random forest. The model error compensation was combined to optimize the traditional manual condition interpretation process, and the classification accuracy of the model was improved at the same time. The proposed method was added to the compound seeker for theoretical analysis and simulation verification. The results show that the classification accuracy of tracking mode is about 100%, and the running speed increased by 16%, the amount of code was reduced by 3 times. The optimized tracking mode decision process, which based on random forest and error compensation, can good adapt to the seeker tracking mode decision, efficiently implement the autonomous decision of tracking mode. This research algorithm provides a reference for the efficient realization of seeker tracking mode decision-making.

引言
  • 导引头是制导导弹的重要组成部分,作为核心分系统之一, 在精确制导过程中完成对目标的探测、目标分类识别、目标跟踪、干扰对抗等功能,为导弹武器系统实现目标的捕获、跟踪、精确打击提供决策依据[1-7]。传统的单一模式制导导引头有电视导引头、红外导引头、激光导引头、雷达导引头[8],复合制导则是根据各类单一制导模式按作战需求组合而成两种及以上的制导模式。在多模复合制导中,各探测器将实时对目标进行检测,同时将跟踪的目标信息传输到综合控制系统,此时综合控制系统将会得到两种及以上的目标状态信息,通过对输入的目标信息进行处理得到唯一的目标信息,其过程即是信息融合的过程[9-12]

    目前对多模信息融合处理,实现跟踪模式决策主要采用的是根据各探测器对目标工作状态为捕获(含捕获成功、捕获异常)、跟踪(含跟踪稳定、跟踪不稳定、跟踪记忆、跟踪丢失)的排列组合条件。流程决策目前使用流程分支设计方法,决策策略受人为思维限制,排列组合条件有限,且条件选择受主观因素影响太多,当出现更多条件时可能会出现误判的情况,同时也面临着制导模式增多、作战使用复杂的情景下代码分支庞大和通用性差的缺陷,从软件和硬件的层面都对设计带来了不便。

    作者针对目前算法的不足之处,提出利用随机森林算法和误差补偿结合的方法对复合制导的跟踪模式决策流程进行优化的思路,将传统的条件组合判读流程用人工智能模型替代,依据外场试验得到大量样本数据,用样本基于随机森林算法训练跟踪模式决策模型,对于模型分类错误的样本数据,提取数据特征,采用人工判读的方式进行误差补偿,使得提出的方法在保证决策正确率的前提下,简化人工判读流程代码量,提升运行速度,同时在复杂条件下使决策策略更智能,适应性更强。

1.   复合导引头工作原理
  • 作者基于典型的激光/雷达/红外多模复合制导导引头进行研究,目标的测量数据主要来源于红外探测器、半主动激光探测器、主动毫米波探测器[13-14]。在实际应用中根据弹上工作模式指令确定复合模式,包括:红外/激光复合、雷达/激光复合、红外/雷达复合、红外/激光/雷达复合。在各复合模式中会根据弹目距离分时分段让各探测器工作。具备激光引导条件时,会先使用激光源照射目标,当导引头接收到激光回波后,对目标进行捕获,实现目标的远距离导引,为雷达和红外提供初始指向,在到达相应的可探测距离便分时启动雷达和红外工作,快速对目标进行捕获跟踪。系统原理框图如图 1所示。

    Figure 1.  Block diagram of seeker working principle

    当有两模或三模同时工作时,各探测器会根据内部算法解算出弹目相对运动的变化,以跟踪偏差的形式上报综合控制器,综合控制器根据各探测器上报的目标偏差(包括偏航偏差和俯仰偏差)、置信度、稳定性等目标信息综合判断探测器跟踪目标信息可靠性,用可靠性高的探测器解算的跟踪偏差完成伺服闭环,实现对目标的稳定跟踪。复合制导简化流程如图 2所示,其中DIR是红外开启工作弹目距离。影响控制器闭环决策的主要因素包括:弹目距离、各子系统跟踪目标偏差、置信度。利用这些信息,综合控制器便可以判断哪个探测器对目标跟踪更稳定,以便做出伺服决策,同时上报制导信息。

    Figure 2.  Simplified flow chart of compound guidance

2.   跟踪模式决策
  • 在制导武器作战过程中,导引头探测器探测到目标的跟踪偏差等信息输入到综合控制系统,综合控制器系统用探测器测得的偏差信息进行闭环,并驱动电机,控制导引头始终指向目标的方向。在复合制导导引头中,由于存在多个探测器探测到的目标信息,跟踪模式决策就是综合控制系统根据输入的不同探测器跟踪目标信息经过内部的判定条件输出唯一更可靠的目标信息。跟踪模式是最终的闭环模式,即输出的唯一目标信息来自于哪种探测器便是哪种跟踪模式,例如,若是决策出红外探测器跟踪信息更可靠,便是红外跟踪模式,红外探测器测得的目标偏差信息将用于完成导引头稳定平台伺服闭环,对目标进行稳定跟踪,实现对目标的精确打击,提高目标的命中概率。

    作者提出基于随机森林算法对跟踪模式决策流程进行优化,用探测器、惯导测得的目标信息对跟踪模式决策过程建模,得到跟踪模式决策器,当有新的目标信息输入时,该决策器自动判别出跟踪模式,综合控制系统将会用此模式进行闭环。实现步骤如图 3所示。

    Figure 3.  The modeling process of tracking mode classifier

    (1) 数据预处理。可用数据包括各探测器跟踪的目标信息、惯导测得目标信息,通过对数据相关预处理操作得到包含属性和目标变量的样本数据集;(2)模型构建:将样本数据集划分为训练集和测试集,基于随机森林算法,用训练集训练模型,得到跟踪模式决策模型;(3)模型评估:将测试集输入决策模型,采用分类模型评价指标,对模型的分类准确率进行评估。

3.   建立基于随机森林算法的跟踪模式决策模型
  • 随机森林是一种利用集成学习思想的机器学习算法,主要用于分类和回归任务场景,它由多个决策树组成,各个决策树的决策过程及结果相互独立,并由融合策略输出最终预测结果。集成学习是通过构建并结合多个学习器来完成学习任务,其思想是先产生一组“个体学习器”,再用某种策略将它们结合起来。随机森林的“个体学习器”即是决策树,决策树是一种常用的树结构机器学习方法,决策树的决策结果经某种策略融合后输出的最终预测结果即是随机森林的决策结果[15-20]。使用随机森林对样本大小为V的训练集建立模型,包括3个步骤:(1)设定决策树模型的个数N,利用bootstrap方法从训练集随机有放回抽样,得到N个大小为V的训练集; (2)利用决策树训练步骤(1)的训练集,得到T个决策树模型,该步骤包括3个重要参量,即决策树使用特征的最大数量、决策树的最大深度、决策树内部节点被划分时所需最小样本数; (3)根据具体的融合策略组合所有决策树的输出,得到最终预测结果。

    以上步骤中涉及的参量根据交叉验证方法调优设置。

    本文中基于随机森林对导引头跟踪模式决策的流程如图 4所示。

    Figure 4.  Decision flow of optimization strategy

    通过对系统输入的bootstrap采样构造不同分布的训练集,进而建立N个基决策器(N≥1),每个基决策器能独立执行跟踪模式的判别,最后通过决策融合形成终决策器,输出跟踪模式。

  • 基决策器采用决策树算法实现,其对跟踪模式的判别可表示为:f(X)→YY的取值为{1, 2, 3}, 分别代表激光、雷达、红外(infrared, IR)3种跟踪模式,X是一个n维向量,表示系统输入。图 5为某个基决策器的执行流程。

    Figure 5.  Execution path of base decision maker

    图中,xn代表X的某一个维度输入。每个基决策器由若干条(不小于1)决策路径构成,1条决策路径由若干(不小于1)决策节点和决策结果构成,图 5中的基决策器包含4条决策路径,例如:[x1, x3, x4, x7, IR]为1条决策路径。决策路径是有执行顺序的,两条决策路径要相同当且仅当它们的决策节点、决策结果、执行顺序完全相同。同理,两个基决策器相同当且仅当它们所有决策路径相同。

  • 决策融合的本质是对N个基决策器的输出结果进行整合,得到最终的随机森林决策器,基于3个原因:(1)不同基决策器的质量是不相同的,质量越高的决策器,在不同场景下对跟踪模式的决策输出越稳定;(2)每个决策器有它最擅长的工作场景;(3)实验证明融合后的决策器相比单棵决策树分类器有更加稳定可靠的决策结果。采用对基决策器加权融合的思想,权重越大的基决策器,最终决策的话语权越高。设Wif(X)i分别为第i个基决策器的权重及决策输出,F(X)为最终跟踪模式输出,则:

    F(X)的输出值为$\sum\limits_{i = 1}^N {{W_i}} \cdot I\left[ {\mathit{\boldsymbol{f}}{{(\mathit{\boldsymbol{X}})}_i} = \mathit{\boldsymbol{Y}}} \right]$最大时Y的取值, Y={1, 2, 3},其中1代表激光,2代表雷达,3代表红外。当f(X)i=Y时,I=1;当f(X)iY时,I=0。权重Wi=γEi (γ>0),且$\sum\limits_{i = 1}^N {{W_i}} = 1, E_i$为第i个基决策器质量的评价指标, γ为权重的缩放系数。

  • 评价指标用来衡量决策器质量的好坏,同时也是实验结果的主要参考。选取真实的导引头工作数据作为验证数据,其中X由10个量组成,分别是:激光方位跟踪偏差Lx、激光俯仰跟踪偏差Ly、激光跟踪目标置信度Lp、雷达方位跟踪偏差Rx、雷达俯仰跟踪偏差Ry、雷达跟踪目标置信度Rp、红外方位跟踪偏差Ix、红外俯仰跟踪偏差Iy、红外跟踪目标置信度Ip、弹目距离D表 1中为N条验证数据。

    number Lx/(°) Ly/(°) Lp Rx/(°) Ry/(°) Rp Ix/(°) Iy/(°) Ip D/km mode
    1 0.08 0.12 1 0 0 0 0 0 0 8000 1
    2 0.08 -0.05 1 0.07 0.09 1 0 0 0 7650 1
    3 -0.07 0.03 1 0.01 0.02 1 0 0 0 6000 2
    4 -0.02 0.05 1 -0.03 0.01 1 0.09 0.08 0 4500 2
    5 0.06 -0.09 1 0.04 -0.02 1 -0.07 0.12 0 4213 2
    6 0.08 0.01 1 0.09 0.07 0 0.04 0.09 0 3908 1
    7 0.09 0.02 1 0.08 -0.07 0 0.08 0.06 0 3412 1
    8 -0.1 0.08 0 0.06 0.08 0 0.012 0.03 1 2566 3
    9 0.04 0.07 1 -0.09 0.06 1 -0.02 0.01 1 1980 3
    N 0.09 -0.05 0 -0.07 0.05 0 0.04 0.06 1 1840 3

    决策器可以输出3种模式:红外、激光、雷达。以下以激光模式的决策为例,演示决策器在该模式下如何评价。

    X为输入数据,Y为决策器的输出(即模式的选择),将Y的取值合并为两种{激光和非激光(指红外和雷达)}, 同理将用于验证的模式取值也合并为两种。验证值和决策值的不同组合构成见表 2

    verification value decision value
    laser non-laser
    laser TP FN
    non-laser FP TN

    表 2中,TP(true positive)为正确分类的正例,FP(false positive)为错误分类的正例,TN(traue negative)为正确分类的负例, FN(false negative)为错误分类的负例, 它们分别表示每条输入数据对应的验证结果的取值范围。例如TP表示决策器输出激光模式,验证值也是激光模式,这是一次正确的决策;同理,TN也表示决策正确,相反,FP和FN表示决策错误。

    采用3个指标评价决策器质量,分别为:

    式中,P为查准率,R为查全率,F为决策器在当前跟踪模式上关于查准率和查全率的综合表现。

    用同样的方法求得决策器分别在红外、雷达模式下的综合表现,求出决策器在{红外、激光、雷达}3种模式下的综合评价指标为:

    式中, |MY|表示N条验证数据中模式Y出现的次数, Y取值{1, 2, 3},FY表示Y模式下F评估指标。E越大,则决策器的综合性能越好。

4.   仿真及结果分析
  • 基于传统流程是类树的条件判读过程,在仿真分析中,分别采用决策树和随机森林算法对传统决策过程建模,得到跟踪模式决策器,其仿真结果如表 3表 4所示。

    label/measurement P R FY
    1 0.99074 0.98165 0.98618
    2 0.99547 0.99935 0.99740
    3 1.00000 0.99796 0.99898
    E 0.99805 0.99805 0.99805

    Table 3.  The simulaton result based on random forest

    label/measurement P R FY
    1 0.95349 0.97895 0.97619
    2 0.98756 0.98945 0.98043
    3 0.97681 0.97319 0.97521
    E 0.97851 0.97851 0.97851

    Table 4.  The simulaton result based on decision tree

    表 3表 4中的实验数据可知,基于随机森林对传统决策过程建模,精度达到0.99805,基于单决策树建模,精度为0.97851,具有极高的精度和稳定性。由仿真结果对比可知,对于多模跟踪模式决策而言,随机森林算法模型分类准确率优于决策树算法模型。

  • 模型稳定性是衡量模型在不同场景下适应性强弱的重要指标,采用不同采样方法制备多个验证数据集,使它们的数据量大小和分布均不相同,分别采用决策树和随机森林算法对传统决策过程建模,得到的决策器评价指标E的曲线对比图, 如图 6所示。

    Figure 6.  Comparison of evaluation indicators of two models with different sample sizes

    由图可知,采用随机森林算法决策在多数场景下比单决策树算法的性能高(6种场景下,有5种高于决策树),该结果表明, 随机森林算法在复杂的应用场景下输出的决策结果更可靠,适应性更强。

  • 由模型精度和稳定性对比结果可知,尽管采用随机森林建模精度达0.99805,无限逼近于1(理想情况是用随机森林算法构建的决策模型能够完全复刻传统流程的判断结果),但依然存在决策误判的情况,抽取其中1200条验证样本数据进行分析, 得到随机森林决策器跟踪模式决策结果分布图, 如图 7所示。

    Figure 7.  Distribution of decision results about tracking mode without error compensation

    由图可知,用随机森林方法得到的跟踪模式误判的情况为1200例数据中错误6例,其中,红外错误2例,激光错误2例,雷达错误2例。

    针对模型存在误判的情况,提取判别错误的样本数据,采用异常检测、相关性分析等手段进一步分析,提取出决策器的误判路径,并采用条件判读的方式进行误差补偿,得到随机森林结合误差补偿的跟踪模式决策结果, 如图 8所示。

    Figure 8.  Distribution of decision results about tracking mode with error compensation

    由图可知,用随机森林结合误差补偿的方法对跟踪模式的识别正确率达到100%。

  • 在保证本文中提出的方法对跟踪模式分类的正确率的前提下,对本文中的方法和传统的方法在模式决策上的耗时进行了对比,结果如图 9所示。由图可知,本文中方法的决策速度提升约为16%。

    Figure 9.  Comparison chart of decision time-comsuming

  • 对传统方法和本文中方法的实现代码量(决策流程的逻辑)进行了对比,其结果如图 10所示。

    Figure 10.  The comparion chart of code size of decision process

    由图可知,在应用程序代码实现过程中,本文中方法150行便实现跟踪模式决策,替换原上千行的流程判读代码,大大简化代码量。

5.   结论
  • 基于随机森林算法对跟踪模式决策过程建模并结合误差补偿的方法,保证了决策准确率的前提下,对传统的条件判读决策流程进行优化,实现了跟踪模式的自主决策。首先,基于传统判读流程的特点,随机森林模型和决策树模型都可适用,随机森林采用训练多棵决策树的模式,使分类错误的样本在下一次训练中得到更多关注,通过加权组合的方式训练决策模型,提高决策的准确率,使决策准确率无限接近1,再用误差补偿的方式修正错误率;其次,随机森林网络模型对传统流程进行封装,输入探测器样本数据后自动决策出跟踪模式,简化代码分支量,提升运行速度,封装后的代码量仅是传统流程代码量的1/3,跟踪模式的决策速度相比传统流程提升16%;除此之外,在面临更复杂的场景时,无需增加代码量,只需提供更多训练数据,更新决策模型,便能够准确地预测复杂逻辑下探测器的跟踪有效性,减小漏判和误判的概率,提高系统复杂逻辑的容错性。

Reference (20)

Catalog

    /

    DownLoad:  Full-Size Img  PowerPoint
    Return
    Return