HTML
-
从市场上收集的84份墙面涂料样本,其中华润(Huarun)品牌的墙面涂料样本19份,立邦(Nippon)品牌的墙面涂料样本32份,梅菲特(Meffert)品牌的墙面涂料样本33份。样本基本信息见表 1。
brand manufacturer samples Huarun Guangdong Huarun
Coating Co. Ltd.HR-1, HR-2, HR-3, HR-4, HR-5, HR-6, HR-7, HR-8, HR-9, HR-10, HR-11, HR-12, HR-13, HR-14, HR-15, HR-16,
HR-17, HR-18, HR-19Nippon Nippon Coatings
(China) Co. Ltd.LB-1, LB-2, LB-3, LB-4, LB-5, LB-6, LB-7, LB-8, LB-9, LB-10, LB-11, LB-12, LB-13, LB-14, LB-15, LB-16, LB-17,
LB-18, LB-19, LB-20, LB-21, LB-22, LB-23, LB-24, LB-25, LB-26, LB-27, LB-28, LB-29, LB-30, LB-31, LB-32Meffert Meffer (Beijing)
Coatings Co. Ltd.MFT-1, MFT-2, MFT-3, MFT-4, MFT-5, MFT-6, MFT-7, MFT-8, MFT-9, MFT-10, MFT-11, MFT-12, MFT-13, MFT-14,
MFT-15, MFT-16, MFT-17, MFT-18, MFT-19, MFT-20, MFT-21, MFT-22, MFT-23, MFT-24, MFT-25, MFT-26, MFT-
27, MFT-28, MFT-29, MFT-30, MFT-31, MFT-32, MFT-33Table 1. Basic details of 84 wall paint samples
-
实验中选用Nicolet Almega XR显微共聚焦喇曼光谱仪(美国Thermo公司),以及785nm波长的激光器,光谱采集范围为0cm-1~2000cm-1,光谱分辨率为2cm-1,空间分辨率衍射极限1μm; 曝光次数2;背景曝光次数8;曝光时间8.00s;物镜倍数50×。
-
径向基函数神经网络(radial basis function neural network, RBFNN)是一种隐藏层(只有1层)、以函数逼近为基础的前馈神经网络,其能够逼近任意的非线性函数,可以处理系统内难以解析的规律性,具有良好的泛化能力,并有很快的学习收敛速度[17]。WANG等人为了更好地识别网络攻击要素,解决网络攻击要素的非线性数据多分类问题,提出了一种基于径向基神经网络的分类模型和训练模型,该模型能够很好地解决网络攻击的非线性分类问题,与现有分类方法相比,平均准确率提高了约9%[18]。
多层感知器神经网络(multilayer perceptron neural network, MLPNN)是一种有多个隐藏层的前馈式神经网络, 其能够以任意精度逼近任意连续函数及平方可积函数,而且可以精确实现任意的有限训练样本集[19]。ZHANG等人借助MLPNN对鄂尔多斯盆地白豹-南梁地区低渗透储层产能级别开展预测研究,且预测准确率达82.6 %,其可快速、有效地评价预测低渗透储层产能级别,为建设生产目标的优选及开发方案调整提供可靠依据[20]。
1.1. 实验样本
1.2. 实验设备及参量
1.3. 建模方法
-
图 1为84份墙面涂料样本显微共聚焦喇曼光谱图。由图可知,各样本的峰型和峰的个数基本一致。在喇曼位移为250cm-1处各样本均出现一个宽峰,在喇曼位移为440cm-1和600cm-1处各样本均出现一个强尖峰,在喇曼位移1000cm-1~1200cm-1段,部分样本出现一个弱峰。不难发现,各样本谱图存在交叉重叠的情况,无法直观通过谱图实现对样本的有效区分。
-
在获取样本光谱信息的过程中,由于环境温度、外界振动以及仪器自身情况的影响,光谱信息中往往存在基线漂移、噪音等干扰信息,这不仅会降低模型的准确性能,还会增加模型在计算过程中的时间和复杂度。因此,提取有效的光谱信息同时削弱冗余和噪声信息是十分重要的。移动窗口最小二乘多项式平滑Savitzky-Golay(SG)是一种有效的预处理方法,既能去除噪声等干扰信息、提高分析信号的信噪比,又可以较好地保持分析信号中有用的信息。实验中选择SG平滑考察不同平滑多项式和平滑点数下模型的分类准确性,从而选择出最适宜平滑多项式和平滑点数,进而开展对不同墙面涂料的分类工作。表 2为不同SG平滑多项式处理后MLPNN和RBFNN模型对样本的分类准确率。
model smooth polynomial classification accuracy/% total classification accuracy/% Huarun Nippon Meffert MLPNN 1 94.7 93.8 97.0 95.2 2 94.7 93.8 97.0 95.2 3 73.7 90.6 97.0 89.3 4 73.7 90.6 97.0 89.3 5 78.9 93.8 90.9 89.3 6 78.9 93.8 90.9 89.3 RBFNN 1 47.4 71.9 81.8 70.2 2 47.4 71.9 81.8 70.2 3 42.1 65.6 87.9 69.0 4 42.1 65.6 87.9 69.0 5 42.1 62.5 93.9 70.2 6 42.1 62.5 93.9 70.2 Table 2. Classification accuracy by different SG smooth polynomials
由表 2可知,不同模型下不同SG平滑多项式处理后样本的分类准确率均有差异。相比较RBFNN模型,MLPNN模型对SG平滑多项式处理后样本的分类准确率更高,这可能与隐藏层有关。隐藏层的意义是把输入数据的特征映射到另一个维度空间,在另一个空间下,这些特征能更好地进行线性划分,多个隐藏层实际上是对输入特征多层次的映射,从而实现对不同类别样本更好的线性划分。MLPNN是一种有多个隐藏层的前馈式神经网络,而RBFNN是一种单隐藏层的前馈式神经网络。因此,通过不同SG平滑多项式处理后,MLPNN模型对各样本的区分准确率高于RBFNN模型,其区分能力更强。在MLPNN模型中,一次多项式和二次多项式处理后各样本的总体分类准确率最高(95.2%),其它阶次处理后各样本的总体分类准确率有所降低。多项式拟合阶次越低,噪声等干扰信息的削弱力度越大,但能保持的中心矩会越低,保留的光谱细节信息越少;拟合阶次越高,保留的光谱细节信息越多,但同时也增加了噪声等干扰信息。综上所述,实验中以SG平滑2次多项式处理后的数据为基础,来考察不同平滑点数处理后各样本的分类效果。
图 2为不同平滑点数处理后样本的分类准确率。图 2a为RBFNN模型下3种品牌样本的分类准确率; 图 2b为MLPNN模型下3种品牌样本的分类准确率。由图可知,不同平滑点数下样本的分类准确率均有差异,且存在一定的波动现象。这与平滑点数有关,平滑点数小则无法有效地削弱噪声等干扰信息的影响,平滑点数大在一定程度上可以削弱噪声等干扰信息的影响,提高信噪比,但也容易出现“偏置”现象,即偏离真实值。在RBFNN模型中,3种品牌样本的分类准确率在35.0%~95.0%之间,当平滑点数为25点和27点时,Huarun品牌的样本分类准确率最高(73.7%),当平滑点数为7点时,Nippon品牌的样本分类准确率最高(81.2%),当平滑点数为3点时,Meffert品牌的样本分类准确率最高(93.9%);在MLPNN模型中,3种品牌样本的分类准确率在70.0%~100.0%之间,其分类效果最好,当平滑点数为27点时,3种品牌的样本均实现了100.0%的准确分类。实验中选择平滑点数为27点作为预处理条件。
综上所述,实验中选择SG一次多项式结合27点平滑作为预处理方法,借助MLPNN构建分类模型,得到了3种品牌样本的空间分布情况,如图 3所示。
图 3为3种品牌样本的空间分布图,X1, Y1和Z1分别为判别轴。从图中可以看出,3种品牌的样本彼此间区分较为明显,Huarun品牌的样本分布相对较为分散,Nippon和Meffert品牌的样本分布相对集中。不同品牌的墙面涂料样本是具有差异的,这会反映在样本显微共聚焦喇曼光谱信息之中,SG平滑结合MLPNN可实现对这些差异的可视化。借助显微共聚焦喇曼光谱和多元建模方法对不同品牌和生产厂家的墙面涂料样本进行鉴别是可行的。
实验中收集的Meffert样本有底漆、面漆和清漆之分,为进一步开展对同一品牌不同类型墙面涂料的鉴别工作,借助SG平滑预处理和MLPNN构建了3种类型的Meffert样本分类模型,如图 4所示。X2, Y2和Z2分别为判别轴,3种类型的Meffert样本彼此间区分较为明显,相较于清漆,底漆样本的分布较为分散,其次为面漆。同一品牌不同类型的墙面涂料样本在成分添加上是具有差异的,这会反映在样本显微共聚焦喇曼光谱信息之中,而SG平滑结合MLPNN可实现对这些差异的量化。同样,借助显微共聚焦喇曼光谱和多元建模方法对同一品牌不同类型的墙面涂料样本进行鉴别是可行的。