HTML
-
植被伪装一般是通过将采集的植物覆盖在目标上来进行伪装,所以用于伪装目标的植物会随着时间的推移和环境的变化逐渐枯萎,水分和叶绿素逐渐减少,这个过程从植物被采集下来便开始了。因此,准确获得植物在枯萎过程中变化敏感的波段区间是作者研究的核心目的。
-
实验于2020-07开展,以云杉这种常见的植物作为材料。由于植被伪装的伪装材料一般与周围环境的主要植被相同,所以采用云杉的叶作为模拟植被伪装的原材料。首先在12:00采集云杉叶若干,确保采集的样本能够接受到充足日照;然后使用云杉叶样本分别设置3个植被伪装目标,确保伪装材料将地面目标完全覆盖,将伪装目标放置在无遮障的自然环境下。
-
本实验中采用ASD公司生产的Hand Held 2(HH2)便携式地物光谱仪进行数据采集,光谱波长范围为325nm~1075nm,波长精度±1nm,光谱分辨率小于3.0nm。分别对新鲜采集的植物样本、在自然环境下放置24h, 48h和72h的3个伪装目标进行光谱数据采样,对每一种样本采集50个样本数据,共200个光谱数据,如表 1所示。
spectral data collection sample number of collected data/piece vegetation environment
(freshly collected spruce leaf samples)50 vegetation camouflage 1
(spruce leaf samples collected 24h later)50 vegetation camouflage 2
(spruce leaf samples collected 48h later)50 vegetation camouflage 3
(spruce leaf samples collected 72h later)50 Table 1. Spectral data sampling table
为了降低周围环境中散射光对光谱数据质量的影响,实验人员统一着深色服装。采集数据时,首先对光谱仪采集暗电流、定标,然后将仪器垂直向下对准目标,距离目标约1m,确保实验人员面向太阳,目标上无阴影。采集数据过程中,每经过10min,需要对光谱仪再次定标。
光谱数据采集完成后,首先对光谱数据降噪,然后对采集到的数据转化为反射率,便于后续计算。
-
Relief算法是一种滤波式的特征选择算法,最早由KIRA和RENDELL提出用于二分类问题[13]。算法的核心思想是通过考察特征在同类近邻样本与异类近邻样本之间的差异来选择特征,权重小于某个阈值的特征将被移除[14]。后来,KONONENKO等人提出了Relief-F算法来处理多分类问题[15],将多分类问题转化成多个二分类问题,解决了多类别特征选择过程。Relief-F算法的计算过程简述如下。
假设存在数据集D={(xi, yi)}, i=1, …, n,其中xi代表第i个样本,yi代表第i个样本标签。首先从数据集中随机选择一个样本xi,随后从该样本的同类样本中寻找k个距离最近样本Hi,其中|Hi|=k,从异类样本中寻找k个距离最近样本Mi,|Mi|=k。对于每一个样本xi定义一个平均间隔向量ρi:
在得到每一个样本的平均间隔向量后,利用下式来更新特征权重向量w:
式中, ‖·‖表示范数。连续迭代一定次数,最终得到各个特征的权重向量w。
-
本实验流程如下:(1)制作并放置伪装目标;(2)使用光谱仪在不同时间点采集植被伪装的光谱数据,并进行降噪和归一化预处理;(3)分析对比伪装目标与周围植被环境的光谱曲线,利用Relief-F算法计算伪装目标分别与周围环境的特征权重关系,并根据特征权重选择特征波段;(4)与其它常用的波段选择算法对比,利用k均值无监督分类算法进行对比实验。
1.1. 设置伪装目标
1.2. 光谱数据采集与预处理
1.3. Relief-F算法
1.4. 实验流程
-
图 1是对各类样本采集到的光谱数据。每一种样本的光谱曲线取50个样本数据平均值。
通过观察图 1可以发现,与刚采集的云杉叶相比,植被伪装的时间越长,在第130波段~第250波段以及第300波段~第500波段的光谱曲线变化程度越多,这两处波段范围对应的波长范围分别是455nm~575nm和625nm~825nm波长范围内,处于水吸收波段和红光及红外波段范围。这一范围正是植物的水吸收区和“红边”的两个区域,表明植被伪装的中植被的水分和叶绿素随着时间推移在不断减少,导致对应波段范围内的光谱曲线发生相应改变。同时观察图 1还可以发现,当云杉采集24h、48h和72h后,光谱特征的变化幅度不相同。从24h~48h这段时间,在455nm~575nm和625nm~825nm波长范围内的光谱特征变化幅度明显增大。综上所述,当利用植被伪装军事目标时,短时间内伪装效果比较好,长时间之后,伪装效果会迅速下降。
-
利用Relief-F算法对植被环境、植被伪装1、植被伪装2和植被伪装3共4种样本的数据进行特征权重分析,如图 2所示。
从图 2中可以看出, 在权重较高,对应点波长范围分别是425nm~525nm和575nm~785nm,与从图 1中观察所得结果略有出入,但总体上是相同的。波段的权重系数越高,说明植被环境与伪装目标之间在该波段内差异越大。其中单波段权重系数最高的是第432波段,对应的波长为767nm,波段位于“红边”位置。
结合子空间划分的思想,从权重系数较高的2个波段区间第100波段~第200波段以及第250波段~第460波段内,按照权重系数的大小等比例选择波段,避免所选波段子集相关性过高。
-
为了验证Relief-F在揭露植被伪装的性能,将Relief-F算法与常用的波段选择算法进行对比,常用的算法包括最佳指数法、自动子空间划分法。使用3种算法选择10个波段,波段选择结果如表 2所示。
band selection method band subset optimum index factor 412,357,58,133,134,531,532,533,441,215 auto subspace partition 67,68,69,70,133,134,135,136,137,138 Relief-F 432,417,443,357,323,137,151,160,148,149 Table 2. Subset of bands selected by three algorithms
验证3种波段选择算法所得的波段子集的分类精度,具体方法为:对所测200条光谱数据利用k均值算法进行无监督分类,将其分为植被环境、植被伪装1、植被伪装2和植被伪装3共4类,其中总体分类精度代表被正确分类的样本占所有样本数的比例。分类结果如表 3所示。
optimum index factor/% auto subspace partition/% Relief-F/% vegetation environment 90.3 93.1 95.6 vegetation camouflage 1 89.5 92.4 96.3 vegetation camouflage 2 91.3 93.5 96.5 vegetation camouflage 3 91.6 93.4 97.2 overall classification similarity 90.4 93.1 96.4 Table 3. Classification accuracy of three algorithms
从表 3中的分类结果可以发现,利用Relief-F算法选择的特征波段分类精度高于其它两种算法,表明Relief-F提取到的特征波段子集在揭露植被伪装方面具有一定优越性。再利用余弦相似度将3种算法分类结果同地物真实分类标记结果比较,余弦值如表 4所示。值越接近于1,表明相似程度越高。
optimum index factor auto subspace partition Relief-F vegetation environment 0.8742 0.9325 0.9534 vegetation camouflage 1 0.8892 0.9367 0.9595 vegetation camouflage 2 0.9031 0.9410 0.9778 vegetation camouflage 3 0.9246 0.9462 0.9853 overall classification similarity 0.8978 0.9391 0.9690 Table 4. Cosine similarity between the classification results of three algorithms and the real classification
由表 4中的余弦相似度可知,通过Relief-F算法比较波段权重系数选择的特征波段分类结果相似度比其它两种筛选波段的算法略高,说明该算法可以应用于揭露植被伪装的实践中。