高级检索

ISSN1001-3806CN51-1125/TN 网站地图

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于随机化张量算法的红外弱小目标检测

蹇渊 黄自力 王询

引用本文:
Citation:

基于随机化张量算法的红外弱小目标检测

    通讯作者: 黄自力, huangzili01@163.com
  • 中图分类号: TN911.73

Infrared small target detection based on randomized tensor algorithm

    Corresponding author: HUANG Zili, huangzili01@163.com ;
  • CLC number: TN911.73

  • 摘要: 为了降低基于张量低秩稀疏分解的红外弱小目标检测算法的计算复杂度, 提升红外弱小目标的检测性能, 将图像时空张量与随机化算法进行结合, 提出了一种基于随机化张量算法的红外弱小目标检测算法。首先将红外图像序列构造成时空张量作为张量优化模型的输入, 然后使用随机化张量算法求解张量优化模型, 最后将计算得到的稀疏张量还原为图像, 获得目标图像。结果表明, 相比于传统基于低秩稀疏分解的算法, 所提出的算法不仅计算速度快, 而且具有较好的弱小目标检测性能。该研究为提升基于张量低秩稀疏分解的红外弱小目标检测算法的运算速度提供了参考。
  • 图 1  图像时空张量构造示意图

    Figure 1.  Illustration of spatial-temporal tensor construction

    图 2  张量稀疏、低秩分解示意图

    Figure 2.  Illustration of low-rank and sparse tensor decomposition

    图 3  本文中的算法步骤

    Figure 3.  Procedure of the proposed method in this paper

    图 4  目标与局部背景的关系示意图

    Figure 4.  Relationship between the target and local background

    图 5  4种不同场景的原始数据红外图像

    Figure 5.  Original infrared images with four different scenes

    图 6  4种算法对应图 5中4种场景的处理结果

    Figure 6.  Processing results of the four algorithms correspond to the four scenes in Fig. 5

    图 7  确定型算法的处理结果展示

    Figure 7.  Results of the deterministic algorithm

    表 1  实验数据的目标特性/pixel

    Table 1.  Target properties of different experimental data/pixel

    data number RSCR[31] target size image size
    Fig. 5a 5.45 2×2 256×256
    Fig. 5b 5.11 3×3 256×256
    Fig. 5c 6.33 4×4 256×256
    Fig. 5d 3.75 2×2 256×256
    下载: 导出CSV

    表 2  不同算法的背景抑制性能比较

    Table 2.  Comparison of background suppression performance of different algorithms

    data number top-hat IPI RIPT our algorithm
    RBSF RSCRG RBSF RSCRG RBSF RSCRG RBSF RSCRG
    Fig. 5a 2.4741 2.0777 27.8253 5.2951 11.869 4.7182 95.5546 78.1503
    Fig. 5b 3.3595 2.9259 19.9748 5.0564 15.5203 7.5025 30.3962 46.3231
    Fig. 5c 2.0807 3.1669 10.7791 4.4580 7.866 3.7133 21.4214 24.4603
    Fig. 5d 1.5642 3.3352 14.9459 30.3318 10.0474 26.3098 39.7541 54.6129
    下载: 导出CSV

    表 3  不同算法处理单幅图像的平均用时

    Table 3.  Average processing time per frame of different algorithms

    data number IPI/s RIPT/s top-hat/s our algorithm/s
    Fig. 5a 4.644 0.5711 0.0124 0.0515
    Fig. 5b 5.4659 0.6132 0.0134 0.0539
    Fig. 5c 4.5874 0.6188 0.0131 0.0683
    Fig. 5d 4.5871 0.6577 0.0137 0.0595
    下载: 导出CSV

    表 4  确定型算法的背景抑制性能

    Table 4.  Background suppression performance of the deterministic algorithm

    data number RBSF RSCRG
    Fig. 5a 51.9017 61.0455
    Fig. 5b 33.5586 43.6552
    Fig. 5c 20.1347 26.1133
    Fig. 5d 37.6441 51.4539
    下载: 导出CSV

    表 5  确定型算法处理单幅图像的平均用时

    Table 5.  Average processing time per frame of the deterministic algorithm

    data number average processing time/s
    Fig. 5a 0.0932
    Fig. 5b 0.0901
    Fig. 5c 0.1023
    Fig. 5d 0.1003
    下载: 导出CSV
  • [1]

    DESHPANDE S D, ER M H, VENKATESWARLU R, et al. Max-mean and max-median filters for detection of small targets[J]. Proceedings of the SPIE, 1999, 3809: 74-83. doi: 10.1117/12.364049
    [2]

    BAI X, ZHOU F. Analysis of different modified top-hat transformations based on structuring element construction[J]. Signal Processing, 2010, 90(11): 2999-3003. doi: 10.1016/j.sigpro.2010.04.021
    [3]

    CHEN C L P, LI H, WEI Y, et al. A local contrast method for small infrared target detection[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 52(1): 574-581.
    [4] 朱金辉, 张宝华, 谷宇, 等. 基于双邻域对比度的红外小目标检测算法[J]. 激光技术, 2021, 45(6): 794-798.

    ZHU J H, ZHANG B H, GU Y, et al. Infrared small target detection algorithm based on double neighborhood contrast measure[J]. Laser Technology, 2021, 45(6): 794-798(in Chinese). 
    [5] 韩金辉, 魏艳涛, 彭真明, 等. 红外弱小目标检测方法综述[J]. 红外与激光工程, 2022, 51(4): 20210393.

    HAN J H, WEI Y T, PENG Zh M, et al. Infrared dim and small target detection: A review [J]. Infrared and Laser Engineering, 2022, 51(4): 20210393(in Chinese).
    [6]

    CANDÈS E J, LI X, MA Y, et al. Robust principal component analysis?[J]. Journal of the ACM, 2011, 58(3): 1-37.
    [7]

    GAO Ch Q, MENG D, YANG Y, et al. Infrared patch-image model for small target detection in a single image[J]. IEEE Transactions on Image Processing, 2013, 22(12): 4996-5009. doi: 10.1109/TIP.2013.2281420
    [8]

    WANG X Y, PENG Zh M, KONG D H, et al. Infrared dim target detection based on total variation regularization and principal component pursuit[J]. Image and Vision Computing, 2017, 63: 1-9. doi: 10.1016/j.imavis.2017.04.002
    [9]

    DAI Y M, WU Y Q, SONG Y, et al. Non-negative infrared patch-image model: Robust target-background separation via partial sum minimization of singular values[J]. Infrared Physics & Technology, 2017, 81: 182-194.
    [10]

    DAI Y M, WU Y Q. Reweighted infrared patch-tensor model with both nonlocal and local priors for single-frame small target detection[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(8): 3752-3767. doi: 10.1109/JSTARS.2017.2700023
    [11]

    KILMER M E, MARTIN C D. Factorization strategies for third-order tensors[J]. Linear Algebra and Its Applications, 2011, 435(3): 641-658. doi: 10.1016/j.laa.2010.09.020
    [12]

    LU C, FENG J, CHEN Y, et al. Tensor robust principal component analysis with a new tensor nuclear norm[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, 42(4): 925-938.
    [13]

    ZHANG X Y, DING Q H, LUO H B, et al. Infrared small target detection based on an image-patch tensor model[J]. Infrared Phy-sics & Technology, 2019, 99: 55-63.
    [14]

    ZHANG L D, PENG Zh M. Infrared small target detection based on partial sum of the tensor nuclear norm[J]. Remote Sensing, 2019, 11(4): 382. doi: 10.3390/rs11040382
    [15]

    SUN Y, YANG J G, LONG Y L, et al. Infrared patch-tensor model with weighted tensor nuclear norm for small target detection in a single frame[J]. IEEE Access, 2018, 6: 76140-76152. doi: 10.1109/ACCESS.2018.2883727
    [16]

    ZHANG P, ZHANG L, WANG X, et al. Edge and corner awareness-based spatial-temporal tensor model for infrared small-target detection[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020, 59(12): 10708-10724.
    [17]

    LIU H K, ZHANG L, HUANG H. Small target detection in infrared videos based on spatio-temporal tensor model[J]. IEEE Transactions on Geoscience and Remote Sensing, 2020, 58(12): 8689-8700. doi: 10.1109/TGRS.2020.2989825
    [18]

    PANG D D, SHAN T, LI W, et al. Facet derivative-based multidirectional edge awareness and spatial-temporal tensor model for infrared small target detection[J]. IEEE Transactions on Geoscience and Remote Sensing, 2021, 60: 5001015.
    [19]

    HALKO N, MARTINSSON P G, TROPP J A. Finding structure with randomness: Probabilistic algorithms for constructing approximate matrix decompositions[J]. SIAM Review, 2011, 53(2): 217-288. doi: 10.1137/090771806
    [20]

    ZHANG J, SAIBABA A K, KILMER M E, et al. A randomized tensor singular value decomposition based on the t-product[J]. Nume-rical Linear Algebra with Applications, 2018, 25(5): e2179. doi: 10.1002/nla.2179
    [21]

    TARZANAGH D A, MICHAILIDIS G. Fast randomized algorithms for t-product based tensor operations and decompositions with applications to imaging data[J]. SIAM Journal on Imaging Sciences, 2018, 11(4): 2629-2664. doi: 10.1137/17M1159932
    [22]

    BULUC A, KOLDA T G, WILD S M, et al. Randomized algorithms for scientific computing[EB/OL]. (2022-03-21)[2023-01-12]. https://arxiv.53yu.com/abs/2104.11079.
    [23]

    KÖTHE U. Edge and junction detection with an improved structure tensor[C]//Joint Pattern Recognition Symposium. Berlin, Heidelberg, Germany: Springer, 2003: 25-32.
    [24]

    JIANG T X, HUANG T Z, ZHAO X L, et al. Multi-dimensional imaging data recovery via minimizing the partial sum of tubal nuclear norm[J]. Journal of Computational and Applied Mathematics, 2020, 372: 112680. doi: 10.1016/j.cam.2019.112680
    [25]

    KOLDA T G, BADER B W. Tensor decompositions and applications[J]. SIAM Review, 2009, 51(3): 455-500. doi: 10.1137/07070111X
    [26]

    BOYD S, PARIKH N, CHU E, et al. Distributed optimization and statistical learning via the alternating direction method of multipliers[J]. Foundations and Trends® in Machine Learning, 2011, 3(1): 1-122.
    [27]

    CANDES E J, WAKIN M B, BOYD S P. Enhancing sparsity by reweighted ℓ1 minimization[J]. Journal of Fourier Analysis and Applications, 2008, 14(5): 877-905.
    [28]

    CHE M, WANG X Zh, WEI Y M, et al. Fast randomized tensor singular value thresholding for low-rank tensor optimization[J]. Numerical Linear Algebra with Applications, 2022: 29(6): e2444. doi: 10.1002/nla.2444
    [29]

    ZHANG Y, SHAO Y, SHEN J, et al. Infrared image impulse noise suppression using tensor robust principal component analysis and truncated total variation[J]. Applied Optics, 2021, 60(16): 4916-4929. doi: 10.1364/AO.421081
    [30]

    van LOAN C F, GOLUB G H. Matrix computations[M]. 4th ed. Baltimore MD, USA: The Johns Hopkins University Press, 2013: 488-493.
    [31]

    HUI B W, SONG Zh Y, FAN H Q, et al. A dataset for infrared image dim-small aircraft target detection and tracking under ground/air background [DB/OL]. (2019-10-28)[2023-04-03]. https://www.scidb.cn/en/detail?dataSetId=720626 4209334 59968&version=V1&dataSetType=journal&tag=2&language=zh_CN.
  • [1] 刘煊渠慎明 . 低秩稀疏和改进SAM的高光谱图像误标签检测. 激光技术, 2022, 46(6): 808-816. doi: 10.7510/jgjs.issn.1001-3806.2022.06.016
    [2] 周永康朱尤攀曾邦泽胡健钏欧阳慧明李泽民 . 宽动态红外图像增强算法综述. 激光技术, 2018, 42(5): 718-726. doi: 10.7510/jgjs.issn.1001-3806.2018.05.025
    [3] 张凡 . 红外图像改进非局部均值滤波算法研究. 激光技术, 2015, 39(5): 662-665. doi: 10.7510/jgjs.issn.1001-3806.2015.05.016
    [4] 李文龙戈海龙任远成巍 . 图像处理技术在激光熔池温度检测的应用. 激光技术, 2018, 42(5): 599-604. doi: 10.7510/jgjs.issn.1001-3806.2018.05.004
    [5] 张雷罗长更张颖颖李根全杨兴强王肖霞 . 基于支持度变换的红外与可见光图像融合算法. 激光技术, 2015, 39(3): 428-431. doi: 10.7510/jgjs.issn.1001-3806.2015.03.032
    [6] 刘艾琳 . 基于提升小波变换的红外图像双重滤波算法. 激光技术, 2015, 39(4): 545-548. doi: 10.7510/jgjs.issn.1001-3806.2015.04.026
    [7] 虞文俊顾国华杨蔚 . 基于小波变换的红外偏振图像融合算法. 激光技术, 2013, 37(3): 289-292. doi: 10.7510/jgjs.issn.1001-3806.2013.03.004
    [8] 刘逸飞苏亚姚晓天崔省伟杨丽君周聪聪何松 . OCT无创血糖检测图像处理最优化方法研究. 激光技术, 2023, 47(2): 178-184. doi: 10.7510/jgjs.issn.1001-3806.2023.02.004
    [9] 热孜亚·艾沙艾斯卡尔·艾木都拉 . 基于元学习的红外弱小点状目标跟踪算法. 激光技术, 2021, 45(3): 396-404. doi: 10.7510/jgjs.issn.1001-3806.2021.03.023
    [10] 陈树越刘金星丁艺 . 基于小波变换的红外与X光图像融合方法研究. 激光技术, 2015, 39(5): 685-688. doi: 10.7510/jgjs.issn.1001-3806.2015.05.021
    [11] 张明淳牛春晖刘力双刘洋 . 用于无人机探测系统的红外小目标检测算法. 激光技术, 2024, 48(1): 114-120. doi: 10.7510/jgjs.issn.1001-3806.2024.01.018
    [12] 朱金辉张宝华谷宇李建军张明 . 基于双邻域对比度的红外小目标检测算法. 激光技术, 2021, 45(6): 794-798. doi: 10.7510/jgjs.issn.1001-3806.2021.06.020
    [13] 王其华叶苗 . 基于裂变自举粒子滤波的红外目标跟踪处理. 激光技术, 2011, 35(1): 141-144. doi: 10.3969/j.issn.1001-3806.2011.01.038
    [14] 虞文俊顾国华刘骋昊 . 红外偏振图像的仿真. 激光技术, 2014, 38(1): 76-78. doi: 10.7510/jgjs.issn.1001-3806.2014.01.016
    [15] 冯洋 . 基于改进的奇异值分解的红外弱小目标检测. 激光技术, 2016, 40(3): 335-338. doi: 10.7510/jgjs.issn.1001-3806.2016.03.007
    [16] 江天沈会良杨冬晓刘建军邹哲 . 基于模糊局部信息C均值的太赫兹图像目标检测. 激光技术, 2015, 39(3): 289-294. doi: 10.7510/jgjs.issn.1001-3806.2015.03.001
    [17] 孙越娇雷武虎胡以华赵楠翔任晓东 . 基于视觉显著模型的遥感图像舰船快速检测. 激光技术, 2018, 42(3): 379-384. doi: 10.7510/jgjs.issn.1001-3806.2018.03.017
    [18] 李昌海叶玉堂沈淦松徐伟叶涵姚景昭 . 基于图像轮廓分析的LCD线路缺陷检测. 激光技术, 2013, 37(2): 207-210. doi: 10.7510/jgjs.issn.1001-3806.2013.02.017
    [19] 李庆辉李艾华姜柯赵少宁 . HIS空间的火灾图像模糊增强快速算法. 激光技术, 2014, 38(1): 137-140. doi: 10.7510/jgjs.issn.1001-3806.2014.01.030
    [20] 张健李白燕 . 基于图论最小割集算法的图像分割研究. 激光技术, 2014, 38(6): 863-866. doi: 10.7510/jgjs.issn.1001-3806.2014.06.030
  • 加载中
图(7) / 表(5)
计量
  • 文章访问数:  1420
  • HTML全文浏览量:  964
  • PDF下载量:  17
  • 被引次数: 0
出版历程
  • 收稿日期:  2022-12-09
  • 录用日期:  2023-01-12
  • 刊出日期:  2024-01-25

基于随机化张量算法的红外弱小目标检测

    通讯作者: 黄自力, huangzili01@163.com
  • 西南技术物理研究所, 成都 610041, 中国

摘要: 为了降低基于张量低秩稀疏分解的红外弱小目标检测算法的计算复杂度, 提升红外弱小目标的检测性能, 将图像时空张量与随机化算法进行结合, 提出了一种基于随机化张量算法的红外弱小目标检测算法。首先将红外图像序列构造成时空张量作为张量优化模型的输入, 然后使用随机化张量算法求解张量优化模型, 最后将计算得到的稀疏张量还原为图像, 获得目标图像。结果表明, 相比于传统基于低秩稀疏分解的算法, 所提出的算法不仅计算速度快, 而且具有较好的弱小目标检测性能。该研究为提升基于张量低秩稀疏分解的红外弱小目标检测算法的运算速度提供了参考。

English Abstract

    • 红外弱小目标检测技术一直是制导预警系统、机载、陆载、星载监视系统的关键技术。俄乌冲突中,小型无人机、高超音速弹药的大量使用,颠覆了传统战争模式,弱小目标检测技术的需求变得越来越迫切。许多国家在该技术的研发上投入了大量科研力量。弱小目标检测技术的难点在于: 目标在图像中通常仅占几十甚至几个像素,缺乏明显的形状、纹理、颜色等信息,对比度低,受周围环境的干扰,目标容易被淹没在背景中。基于目标强纹理特征的算法适用性较差。工程中使用广泛弱小目标检测方法是基于单帧图像的局部信息算法,具有代表性的算法包括:最大均值和最大中值滤波器[1]、顶帽(top-hat)变换[2]、局部对比度方法[3-4]等。这些算法通常认为目标灰度与周围邻域存在着较明显的差异,并通过背景抑制、形态学估计等方法提取目标。此类算法的优点主要体现在:算法原理简单、计算量通常较小、易于硬件平台实现、实时性高;缺点是:算法基于的假设前提是目标在局部区域必须是最突出的,而在实际应用场景中,目标可能会出现在亮度较高的背景周围(如云层、道路、建筑边界等),使用局部信息检测出目标将变得十分困难[5]

      随着压缩感知技术的兴起,基于低秩稀疏分解模型[6]的红外弱小目标检测方法凭借其数学意义明确、解释性强,受到了研究者们的青睐。该方法认为图像的背景具有一定的非局部自相关的性质,相似性较高,表现出低秩的性质,而前景(弱小目标)在整幅图像中仅占较少的像素,表现出稀疏的性质。因此,将原始图像代入某种优化模型进行计算,便能实现图像的前景与背景分离。2013年,GAO等人提出了红外图像块(infrared patch-image,IPI)方法[7], 该方法使用滑动窗口将单帧图像拆分成大小相同的若干小块,把获得的图像块拉直成向量,按顺序拼接成矩阵,使用优化模型提取矩阵的稀疏与低秩部分,再按原顺序还原为图像,从而获得目标。由于该算法思路新颖、检测性能较好,基于图像块的方法受到了研究者们的认可[8-9]。基于张量的弱小目标检测方法是基于图像块方法的扩展。提出这一方法的研究者通常认为: 图像块经向量化后拼接为矩阵的方式破坏了图像中的空间相关联信息,这种信息的破坏导致了弱小目标检测性能的下降。2017年, DAI等人首先将张量模型引入到弱小目标检测算法中, 即重加权红外块张量(reweighted infrared patch-tensor, RIPT)算法[10],该方法将图像分块并堆叠,构造为3阶张量,并使用张量低秩稀疏分解模型进行处理,最终获得分离后的弱小目标;模型中将3阶张量直接按各指标展开成矩阵的操作导致了算法需要计算较大矩阵的奇异值分解(singular value decomposition, SVD)。为了提升算法性能,基于张量积运算的张量奇异值分解[11](tensor-singular value decomposition, t-SVD)逐渐在张量优化模型的求解中流行了起来,如:基于张量核范数[12]的张量鲁棒性主成分分析方法[13]、基于张量核范数的部分和的方法[14]、基于张量加权核范数的方法[15]等,都应用到了t-SVD。

      近几年,随着图像探测器帧率的不断提升,在基于张量的弱小目标检测方法中,使用多帧图像构造张量的方法成为了一个新的研究趋势[16-18]。多帧图像构造的张量又被称为时空张量。提出这一方法的研究者通常认为,单帧图像构造张量的方法仅使用了图像的空间信息,而多帧图像构造张量的方法能够将时间信息与空间信息结合,带来更好的目标检测效果。

      无论是基于单帧或多帧的张量弱小目标检测方法,问题的求解通常被归结于求解一个低秩稀疏分解优化模型。对于大多数模型,其求解步骤中通常需要计算t-SVD(即一系列矩阵的SVD),这一步骤通常是模型求解过程中计算复杂度最高的部分。为了降低该步骤的计算复杂度,一些使用随机化方法的t-SVD替代算法被提出,例如:基于随机化奇异值分解[19]的随机化t-SVD[20]、基于矩阵骨骼分解的张量骨骼分解[21]等,这些算法的步骤是:首先使用随机采样、投影等方法对原始张量进行预处理,获得体积较小的张量; 再使用处理后的张量进行相应的分解, 从而实现降低算法复杂度的目的。随机化算法由于其令人满意的可靠性与计算的有效性吸引了大量的算法研究者[22]

      基于图像时空张量以及随机化算法的思想,本文作者结合张量核范数与图像结构张量[23]提出了一种基于时空张量的弱小目标检测方法,并在算法求解过程中引入随机化张量算法,有效地提升了算法的计算效率。

    • 本文中所指的图像时空张量是由图像序列分块、堆叠构造而来。分块是使用固定尺寸的窗口将图像序列中的每一幅图像分成若干大小相同的小块,堆叠即将分割后的图像块按照相应的位置进行堆叠,从而获得一系列的图像块序列。将上述构造时空张量的方法展示为图 1。图像堆叠的顺序为图中箭头指向, 将图 1右侧任一个独立的图像块序列称为图像时空张量。

      图  1  图像时空张量构造示意图

      Figure 1.  Illustration of spatial-temporal tensor construction

      图像块序列记为张量$\boldsymbol{A} \in \mathbb{C}^{n_1 \times n_2 \times n_3}$($\mathbb{C}$为复数域,n1×n2为图像块的大小,n3表示图像块序列中图像块的个数)。为了便于表示,将 A (: , : , k)表示 A的第k个正向切面(符号“:”为该维度的所有元素),即对应于图像块序列中的第k个图像块,显然 A (: , : , k)为一个n1×n2矩阵; A (i, j, k)表示 A的第(i, j, k)元素,即图像序列中第k个图像块中第i行、第j列处的图像灰度值。

    • 一幅红外图像通常可以表示为背景、前景、噪声三部分之和。在简化的情况下,图像被认为由前景和背景两部分之和组成。基于张量的红外弱小目标检测方法的原理是:通过某种操作将图像构造为张量,并代入预先设计的张量优化模型,通过算法计算分离出目标。以下分别从张量低秩稀疏分解优化模型、模型的求解介绍本文作者提出的红外弱小目标检测算法。

    • 本文中所指的基于张量的红外弱小目标检测方法是通过张量低秩稀疏分解模型的求解, 将红外弱小目标(稀疏部分)从原始的张量中分离出来。图 2展示了原始张量与低秩、稀疏张量间的关系。即原始张量A经模型计算后得到低秩张量B、稀疏张量T,满足B+T=A。稀疏张量T即为包含弱小目标的前景张量。

      图  2  张量稀疏、低秩分解示意图

      Figure 2.  Illustration of low-rank and sparse tensor decomposition

      给定一个张量$\boldsymbol{A} \in \mathbb{R}^{n_1 \times n_2 \times n_3}$($\mathbb{R}$表示实数域),一般形式的张量低秩稀疏分解模型如下:

      $ \begin{gathered} \min _{\boldsymbol{B}, \boldsymbol{T} \in \mathbb{R}^{n_1 \times n_2 \times n_3}}\left[\operatorname{trank}(\boldsymbol{B})+\lambda\|\boldsymbol{T}\|_0\right], \\ (\boldsymbol{B}+\boldsymbol{T}=\boldsymbol{A}) \end{gathered} $

      (1)

      即计算满足条件B+T=A的张量BT使得目标函数trank(B)+λT0达到最小值。模型中trank(B)为B的秩,‖T0表示T非零元素的个数,λ>0为一设定的常数。麻烦的是:式(1)是一个非确定性多项式(nondeterministic polynomially,NP)问题,无法直接求解。通常的做法是将式(1)进行转化,例如使用张量核范数[12]、张量核范数的部分和[24]等代替trank(B),使用Tl1范数[25]T1代替‖T0,以及在目标函数中添加其它的正则项抑制图像背景中边缘或噪声等。考虑到模型的简洁,本文作者在张量稳健主成分分析(tensor robust principal component analysis, TRPCA)模型[12]的基础上引入权重张量获得如下的优化模型:

      $ \begin{gathered} \min _{\boldsymbol{B}, \boldsymbol{T} \in \mathbb{R}^{n_1 \times n_2 \times n_3}}\|\boldsymbol{B}\|_*+\lambda\|\boldsymbol{K} \odot \boldsymbol{T}\|_1, \\ (\boldsymbol{B}+\boldsymbol{T}=\boldsymbol{A}) \end{gathered} $

      (2)

      式中: KA的权重张量[24];张量KT表示KT的哈达马达积[25]; ‖KT1为张量KTl1范数; ‖B*B的核范数(tensor nuclear norm, TNN)[12]。与参考文献[14]中的优化模型不同之处在于式(2)使用了TNN对低秩张量B进行约束, 这使得式(2)为一个凸优化问题。

    • 式(2)的拉格朗日函数为:

      $ \begin{gathered} L(\boldsymbol{B}, \boldsymbol{T}, \boldsymbol{Y}, \mu)=\|\boldsymbol{B}\|_*+\lambda\|\boldsymbol{K} \odot \boldsymbol{T}\|_1+ \\ \quad\langle\boldsymbol{Y}, \boldsymbol{B}+\boldsymbol{T}-\boldsymbol{A}\rangle+\frac{\mu}{2}\|\boldsymbol{B}+\boldsymbol{T}-\boldsymbol{A}\|_{\mathrm{F}}\;^2 \end{gathered} $

      (3)

      式中: $\boldsymbol{Y} \in \mathbb{R}^{n_1 \times n_2 \times n_3}$为拉格朗日乘子; μ>0为惩罚因子; 〈Y, B+TA〉为张量Y与张量B+TA的内积; ‖B+TAF为张量B+TA的Frobenius范数[25]。式(3)可使用交错方向法(alternating direction multiplier method,ADMM)[26]通过迭代求解。根据参考文献[12]和[14]中模型的求解方法, 设第l步已获得B, T, Y, μ, K的迭代值,使用下标l,分别记为Bl, Tl, Yl, μl, Kl,则第l+1步迭代为:

      $ \begin{gathered} \boldsymbol{B}_{l+1}=\underset{\boldsymbol{B} \in \mathbb{R}^{n_1 \times n_2 \times n_3}}{\operatorname{argmin}}\left[L\left(\boldsymbol{B}, \boldsymbol{T}_l, \boldsymbol{Y}_l, \mu_l\right)\right]= \\ \underset{\boldsymbol{B} \in \mathbb{R}^{n_1 \times n_2 \times n_3}}{\operatorname{argmin}}\left(\|\boldsymbol{B}\|_*\;^{+} \frac{\mu_l}{2}\left\|\boldsymbol{T}_l+\boldsymbol{B}-\boldsymbol{A}+\frac{1}{\mu_l} \boldsymbol{Y}_l\right\|_F{ }^2\right) \end{gathered} $

      (4)

      $ \begin{gathered} \boldsymbol{T}_{l+1}=\underset{\boldsymbol{T} \in \mathbb{R}^{n_1 \times n_2 \times n_3}}{\operatorname{argmin}} L\left(\boldsymbol{B}_{l+1}, \boldsymbol{T}, \boldsymbol{Y}_l, \mu_l\right)= \\ \underset{\boldsymbol{T} \in \mathbb{R}^{n_1 \times n_2 \times n_3}}{\operatorname{argmin}}\left(\lambda\left\|\boldsymbol{K}_l \odot \boldsymbol{T}\right\|_1+\frac{\mu_l}{2} \| \boldsymbol{T}+\right. \\ \left.\boldsymbol{B}_{l+1}-\boldsymbol{A}+\frac{1}{\mu_l} \boldsymbol{Y}_l \|_{\mathrm{F}}{ }^2\right) \end{gathered} $

      (5)

      $ \boldsymbol{Y}_{l+1}=\boldsymbol{Y}_l+\mu_l\left(\boldsymbol{T}_{l+1}+\boldsymbol{B}_{l+1}-\boldsymbol{A}\right) $

      (6)

      $ \mu_{l+1}=\min \left(\rho \mu_l, \mu_{\max }\right) $

      (7)

      $ \boldsymbol{K}_{l+1}=\boldsymbol{K}_0 \odot\left(\frac{c}{\left|\boldsymbol{T}_l\right|+\varepsilon}\right) $

      (8)

      式中:ρ>1为增长系数; μmax为设定的惩罚因子的最大值; c/(|Tl|+ε)为3阶张量; |·|为取模运算;εc为大于0的常数; 除法与加法运算均为元素运算; argmin(·)函数表示其括号中算式取得最小值时变量的取值。式(8)中的重加权方式见相关文献[27],其作用是提高问题的收敛速度。

      求解上述迭代问题的关键在于计算式(4)、式(5)的解。幸运的是式(4)、式(5)均有闭式解[12]。首先给出式(5)的闭式解表达式。

      给定权重张量$\boldsymbol{K} \in \mathbb{R}^{n_1 \times n_2 \times n_3}$张量以及常数τ>0,收缩算子SτK(·)(下标τK表示τ与张量K的各个元素相乘)的定义如下,对于任意的3阶张量$\boldsymbol{E} \in \mathbb{R}^{n_1 \times n_2 \times n_3}$,张量H=SτK(E)的元素满足:

      $ \begin{gathered} \boldsymbol{H}(i, j, k)=\operatorname{sign}(\boldsymbol{E}(i, j, k)) \times \\ \max (0, |\boldsymbol{E}(i, j, k)|-\tau \boldsymbol{K}(i, j, k)) \end{gathered} $

      (9)

      式中: i=1, 2, …, n1; j=1, 2, …, n2; k=1, 2, …, n3; sign(·)为符号函数; max(·, ·)表示取两元素的最大值运算。因此式(5)的闭式解为:

      $ \boldsymbol{T}_{l+1}=S_{\mu_l^{-1} \lambda \boldsymbol{K}_l}\left(\boldsymbol{A}-\frac{1}{\mu_l} \boldsymbol{Y}_l-\boldsymbol{B}_{l+1}\right) $

      (10)

      式中: Sμl-1λKl(·)是关于μl-1λKl的收缩算子,下标表示μl-1λ和张量Kl的各个元素相乘。

      在TNN的意义下,式(4)的闭式解表达式可由张量奇异值阈值算子(tensor-singular value thresholding,t-SVT)[12]给出,t-SVT的实质是计算输入张量的快速傅里叶(逆)变换与一系列矩阵的SVD。由于计算SVD复杂度通常较高(对于一个m×n矩阵,其SVD的时间复杂度为O(mn2)), 这导致式(4)的求解是每一次迭代中计算复杂度最高的部分。为了降低算法的计算复杂度,本文中使用随机化奇异值阈值算子(randomized tensor singular value thresholding,rt-SVT)Dτ(·)近似替代t-SVT算子,这里τ>0为常数。Dτ(·)的计算步骤在下节中给出,值得一提的是, 参考文献[28]和[29]中提到了类似的算法, 但在构造正交投影张量时与本文中的算法略有差异。

    • 给定常数τ>0,张量$\boldsymbol{A} \in\mathbb{C}^{n_1 \times n_2 \times n_3}$, s=min(n1, n2), 目标秩r≥2,过采样参数p≥2,且p+r < s,指数q=0或者1,2。本文中计算rt-SVT算子Dτ(·)的步骤如下:(a)沿A的第3维做快速傅里叶变换(fast Fourier transform, FFT)得到A=FFT(A, [], 3), 并生成标准高斯张量$\boldsymbol{G} \in \mathbb{R}^{n_2 \times(p+r) \times n_3}$, 即张量G中的每一个元素服从相互独立的标准正态分布; (b)沿G的第3维做快速傅里叶变换得到G =FFT(G, [], 3);(c)开始循环,令循环次数i=1分别进行如下计算; (d)使用瘦正交三角分解[30]计算矩阵(A (: , : , iA (: , : , i)*)qA (: , : , i)G (: , : , i)的列正交基,并记为矩阵Q (: , : , i),上标*为复共轭转置运算;(e)计算矩阵Q (: , : , i)*A (: , : , i)的SVD,记作U (: , : , i), S (: , : , i), V (: , : , i),分别为其左奇异矩阵、奇异值矩阵与右奇异矩阵;(f)计算并更新U (: , : , i)=Q (: , : , i)U (: , : , i);(g)使用张量收缩算子计算得到X(: , : , i)=U (: , : , i)Sτ(S (: , : , i))V (: , : , i)*(这里X为中间变量,Sτ为张量K中元素全为1的收缩算子);(h)令i=i+1,重复步骤(d)~(g),直到i=「(n3+1)/2+1时,停止循环(符号「·表示向上取整运算);(i)开始循环,令循环次数j=「(n3+1)/2 +1;(j)计算复共轭X(: , : , j)=conj(X(: , : , n3j+2))(conj(·)为取复共轭函数,即对每个元素取复共轭);(k)令j=j+1,重复步骤(j),直到j=n3+1时,停止循环;(l)沿X的第3维做快速傅里叶逆变换(inverse fast Fourier transform, IFFT)得到Dτ(A)=IFFT(X, [], 3);(m)输出Dτ(A)。

      上述算法使用随机化方法,与确定型t-SVT算子[12]的不同之处在于,该算法不直接计算矩阵A (: , : , i)的SVD。而是先使用了随机投影对矩阵进行预处理,获得了尺寸更小的矩阵Q (: , : , i)*A (: , : , i),再对该矩阵进行SVD,从而获得了A (: , : , i)的SVD近似估计(这种使用随机化投影方法近似计算SVD的方法便是随机化SVD[19])。虽然在该算法中涉及了矩阵的瘦正交三角分解,但相比于直接计算原始矩阵的SVD花费的计算时间,算法的整体计算复杂度得到了降低[20, 28]

      根据上述算法,式(4)的近似解可表示为:

      $ \boldsymbol{B}_{l+1}=D_{1 / \mu_l}\left(\boldsymbol{A}-\boldsymbol{T}_l-\frac{1}{\mu_l} \boldsymbol{Y}_l\right) $

      (11)

      式中: D1/μl(·)为随机化奇异值阈值算子。

    • 给定$\boldsymbol{A} \in \mathbb{R}^{n_1 \times n_2 \times n_3}$以及大于0的常数λ, μ0, μmax, ρ, cε,迭代终止阈值η>0,最大迭代步数Nmax。使用ADMM求解式(2)的步骤如下:(a)将张量T, B, Y的各元素初始化为0,根据参考文献[24]中的方法初始化A的权重张量K,即K0;(b)开始迭代,令迭代次数l=0,进行以下计算; (c)根据2.2.1中算法计算Bl+1=D1/μl(ATlYl/μl);(d)计算Tl+1=Sμl-1λKl(A-Yl/μl-Bl+1);(e)计算Yl+1= Yl+μl(Tl+1+Bl+1A);(f)计算μl+1=min(ρμl, μmax),Kl+1= K0⊙(c/(|Tl|+ε));(g)取l=l+1,重复步骤(c)~(f),直到满足如下条件之一终止迭代‖BlBl+1η, ‖TlTl+1η, ‖ABl+1Tl+1η, l>Nmax(这里‖BlBl+1为张量BlBl+1的无穷范数[12]);(h)记B=Bl, T=Tl,并输出BT。当该算法中的输入张量为由红外图像构造的时空张量时,则计算输出的张量T即为包含弱小目标的前景张量。将其按原时空张量的构造顺序还原,便得到了前景(目标)图像序列,这一目标检测过程如图 3所示。值得注意的是,红外图像序列构成的时空张量由多个大小为n1×n2×n3的张量构成,因此计算时需要将这些张量依次输入本节中算法进行计算。

      图  3  本文中的算法步骤

      Figure 3.  Procedure of the proposed method in this paper

    • 为了客观地对算法的性能进行评价,这里使用信杂比增益(signal-to-clutter ratio gain,SCRG)、背景抑制因子(background suppression factor,BSF)对算法背景抑制的能力和目标增强的性能进行分析。在介绍SCRG前,首先引入目标局部信杂比(signal-to-clutter ratio,SCR)的定义。图 4展示了目标与背景区域的关系。图中目标大小为a×b,局部背景大小为(a+2d)×(b+2d),本文中取常数d=20。设μtargetμlocal分别表示目标区域与目标的局部邻域灰度平均值; σlocal为目标局部区域灰度值的标准差,则目标的局部信杂比RSCR定义如下

      图  4  目标与局部背景的关系示意图

      Figure 4.  Relationship between the target and local background

      $ R_{\mathrm{SCR}}=\frac{\left|\mu_{\text {target }}-\mu_{\text {local }}\right|}{\sigma_{\text {local }}} $

      (12)

      目标的局部信杂比反映了图像中目标的检测难易程度,通常局部信杂比越低,目标的检测难度越大。根据目标局部信杂比的定义,设RinRout分别为输入图像与输出图像(经算法处理后图像)的目标局部信杂比; σinσout分别表示输入图像与输出图像目标局部背景区域灰度的标准差,则目标的信杂比增益RSCRG与背景抑制因子RBSF分别定义如下[10]

      $ \left\{\begin{array}{l} R_{\mathrm{SCRG}}=\frac{R_{\text {out }}}{R_{\text {in }}} \\ R_{\mathrm{BSF}}=\frac{\sigma_{\text {in }}}{\sigma_{\text {out }}} \end{array}\right. $

      (13)

      这两个值反映了算法对目标局部背景的抑制程度,值越大,则说明算法对背景的抑制能力越强。

      本实验中使用了4组不同场景的红外图像序列,这些序列均来源于公开数据集[31]图 5a~图 5d分别展示了这4组不同场景的红外图像。为了便于观察,图中使用箭头指向的方框标出了弱小目标的位置。根据RSCR的定义,4组图像中目标的平均RSCR、图像的尺寸以及目标的平均尺寸分别见表 1。观察表 1图 4能够看出,实验中选取的图像背景复杂,且目标具有尺寸小、信杂比低的特点。

      图  5  4种不同场景的原始数据红外图像

      Figure 5.  Original infrared images with four different scenes

      表 1  实验数据的目标特性/pixel

      Table 1.  Target properties of different experimental data/pixel

      data number RSCR[31] target size image size
      Fig. 5a 5.45 2×2 256×256
      Fig. 5b 5.11 3×3 256×256
      Fig. 5c 6.33 4×4 256×256
      Fig. 5d 3.75 2×2 256×256
    • 分别使用IPI算法[7]、RIPT算法[10]、top-hat算法[7]、以及本文作者提出的算法处理选取的4组数据。对比算法中各参数的取值与原文一致,可参见参考文献[10]。本文中算法的参数分别选取如下:2.2.2节中参数的取值分别为n1=n2=64, n3=10, $\lambda=3 /\sqrt{n_3 \cdot \max \left(n_1, n_2\right)}$,Nmax=10, η=10-3; 2.2.1节中参数的取值分别为p+r=「n3/3, q=1。部分图像的处理结果如图 6所示。图中第1~第4行分别为IPI、top-hat、RIPT和本文中算法的处理结果,从左至右第1~第4列分别对应图 5a~图 5d的4种不同场景。图中方框标出的区域为目标的真实区域,圆圈标出的区域为虚景。根据式(13),计算得到各组图像的目标平均局部信杂比增益与背景抑制因子,如表 2所示。表中带下划线的数字表示各行中RSCRGRBSF的最大值。通过观察图 6中虚景的抑制情况,并对比表 2中的数据能够看出,本文作者提出的算法对虚景有较强的抑制能力,因此表现出较好的目标检测性能。

      图  6  4种算法对应图 5中4种场景的处理结果

      Figure 6.  Processing results of the four algorithms correspond to the four scenes in Fig. 5

      表 2  不同算法的背景抑制性能比较

      Table 2.  Comparison of background suppression performance of different algorithms

      data number top-hat IPI RIPT our algorithm
      RBSF RSCRG RBSF RSCRG RBSF RSCRG RBSF RSCRG
      Fig. 5a 2.4741 2.0777 27.8253 5.2951 11.869 4.7182 95.5546 78.1503
      Fig. 5b 3.3595 2.9259 19.9748 5.0564 15.5203 7.5025 30.3962 46.3231
      Fig. 5c 2.0807 3.1669 10.7791 4.4580 7.866 3.7133 21.4214 24.4603
      Fig. 5d 1.5642 3.3352 14.9459 30.3318 10.0474 26.3098 39.7541 54.6129

      表 3是上述不同算法分别处理4组数据中单幅图像的平均用时(本实验中使用的计算机配置为:Intel i5-8600K 6核3.6 GHz,主存24 GB)。根据表中数据,本文作者提出算法的计算速度明显快于基于低秩稀疏分解方法的IPT与RIPT。虽然top-hat速度最快,但从表 3中反映出的背景抑制能力来看,top-hat的背景抑制能力最弱, 而本文中提出的算法较好地平衡了计算的效率与目标的检测性能之间的关系,因此是有效的。

      表 3  不同算法处理单幅图像的平均用时

      Table 3.  Average processing time per frame of different algorithms

      data number IPI/s RIPT/s top-hat/s our algorithm/s
      Fig. 5a 4.644 0.5711 0.0124 0.0515
      Fig. 5b 5.4659 0.6132 0.0134 0.0539
      Fig. 5c 4.5874 0.6188 0.0131 0.0683
      Fig. 5d 4.5871 0.6577 0.0137 0.0595

      为了进一步探讨本文中提出的随机化张量算法与确定型算法的差异,将2.2.2节中的rt-SVT替换为t-SVT[12],即直接使用确定型算法求解式(2)。在保持与本文中随机化算法参数一致的情况下,使用该确定型算法分别处理图 5a~图 5d中4组数据得到的处理结果如图 7所示。图中方框标出的区域为目标真实区域。对比图 7图 6发现,随机化算法与确定型算法处理上述图像序列,获得的目标检测结果几乎一致。为了量化这种差异,将该确定型算法处理结果的SCRG值与BSF值进行比较,如表 4所示。比较表 4表 2中的数据发现,随机化算法与确定型算法的背景抑制性能具有较小的差异,在图 5a图 5d序列中,随机化算法表现出了更好的背景抑制性能。

      图  7  确定型算法的处理结果展示

      Figure 7.  Results of the deterministic algorithm

      表 4  确定型算法的背景抑制性能

      Table 4.  Background suppression performance of the deterministic algorithm

      data number RBSF RSCRG
      Fig. 5a 51.9017 61.0455
      Fig. 5b 33.5586 43.6552
      Fig. 5c 20.1347 26.1133
      Fig. 5d 37.6441 51.4539

      使用与上述实验相同的计算机与软件,获得了确定型算法处理图 5a~图 5d 4组数据中单帧图像的平均用时,如表 5所示。通过对比表 3表 5中的数据能够发现,本文中提出的随机化算法计算速度更快。上述对比实验进一步表明,使用随机化方法对确定型算法加速,不仅能够较好地继承原确定型算法的目标检测性能,而且能够有效地提升算法的计算速度。

      表 5  确定型算法处理单幅图像的平均用时

      Table 5.  Average processing time per frame of the deterministic algorithm

      data number average processing time/s
      Fig. 5a 0.0932
      Fig. 5b 0.0901
      Fig. 5c 0.1023
      Fig. 5d 0.1003
    • 红外弱小目标检测[22]是具有挑战性的问题,在工程应用方面,一些基于形态学滤波的算法使用广泛,这些算法可以通过流水线处理进行加速, 通常表现出速度快、实时性高等特点。与上述方法不同,基于张量低秩稀疏分解的方法是使用优化模型求解图像问题,相比于传统的算法,优化模型的方法通常表现出更好的图像处理效果。然而基于优化的算法求解的过程需要进行多次迭代,每一步迭代通常都需要计算一系列张量(矩阵)分解,如SVD等, 通常难以通过流水线操作加速, 需要使用多(单)核处理平台如:数字信号处理芯片等来计算,这些平台提供了与线性代数相关的函数库,为算法的实现提供了有效的工具。虽然这些库已经获得了较好的优化,但从原理上来讲,计算SVD仍然是一个需要迭代的过程[30],其计算的复杂度与矩阵的尺寸密切相关。因此,减小参与SVD计算的张量(矩阵)尺寸是降低算法复杂度和减少硬件资源开销的关键。

      本文中将随机化张量算法引入到张量优化问题的求解中,通过随机投影方法降低了计算步骤中参与分解的张量尺寸,有效地提升了基于张量低秩稀疏分解的弱小目标检测算法的计算效率。在图像张量的构造方面,本文中使用了时空张量的构造方法,使得构造的张量较好地利用了图像序列的空间与时间信息。虽然通过数值实验验证,本文作者提出的算法表现出了较好的性能,但仍然存在一些有待解决的问题,例如:不同场景的图像数据如何自适应地设置随机化算法中采样参数、构造图像时空张量时一些参数的设置等。这些问题的解决将有助于算法综合性能的进一步提升。

参考文献 (31)

目录

    /

    返回文章
    返回