DRNN在激光多普勒测振仪测声系统中的应用

白涛; 吴谨; 李明磊; 万磊; 李丹阳

doi:10.7510/jgjs.issn.1001-3806.2019.01.022

DRNN在激光多普勒测振仪测声系统中的应用

1.
中国科学院电子学研究所，北京 100190
2.
中国科学院大学，北京 100049

作者简介: 白涛(1992-)，男，硕士研究生，现主要从事语音信号处理的研究.

通讯作者: 吴谨, jwu909@263.net ;

中图分类号: TN912;TN247

Application of DRNN in voice measurement system of laser Doppler vibrometer

1.
Institue of Electronics, Chinese Academy of Sciences, Beijing 100190, China
2.
Graduate University of Chinese Academy of Sciences, Beijing 100040, China

Corresponding author: WU Jin, jwu909@263.net ;

CLC number: TN912;TN247

摘要: 为了降低激光多普勒测振仪在测声过程中给语音信号中引入的噪声，采用深度循环神经网络语音信号去噪的方法，对从激光多普勒测声系统采集回来的语音信号做降噪处理，并进行了理论分析和实验验证。结果表明，利用层数为1层~3层、每层神经元个数为1024的深度循环神经网络，对-6dB~6dB信噪比的语音信号进行处理，随着层数的增加，语音信号的质量在多项评价指标上达到8dB~12dB的提升; 深度循环神经网络可以有效对激光多普勒测声系统采集的语音信号进行降噪处理。该研究对提升语音信号的质量有着实际意义。
- 激光技术 /
- 激光多普勒测振仪 /
- 语音信号去噪 /
- 深度循环神经网络
Abstract: In order to reduce the noise introduced to speech signal by a laser Doppler vibrometer during the measurement of sound, the method of deep recurrent neural network(DRNN) speech signal denoising was adopted. The speech signal collected from laser Doppler measurement system was denoised. By using the deep recurrent neural network with 1 layer~3 layers and 1024 neurons per layer, the speech signals with signal-to-noise ratio from -6dB to 6dB were processed. After theoretical analysis and experimental verification, the results show that, as the number of layers increases, the quality of speech signals has risen to 8dB~12dB in many evaluation indexes. DRNN can effectively denoise the speech signals collected by laser Doppler acoustic system. The research is of practical significance for improving the quality of speech signals.
- laser technique /
- laser Doppler vibrometer /
- speech signal denoising /
- deep recurrent neural network
Figure 1. RNN structure

下载: 全尺寸图片幻灯片

Figure 2. DRNN structure

下载: 全尺寸图片幻灯片

Figure 3. Denoised network structure

下载: 全尺寸图片幻灯片

Figure 4. LDV sound measurement system

下载: 全尺寸图片幻灯片

Figure 5. Flow of data processing

下载: 全尺寸图片幻灯片

Figure 6. Clean voice, the voice obtained from LDV and the denoised results

下载: 全尺寸图片幻灯片

Figure 7. Influence of network layers on the denoised results

下载: 全尺寸图片幻灯片

Figure 8. Comparison results of NMF and DRNN

下载: 全尺寸图片幻灯片

Figure 9. Spectrogram of clean voice playing through a loudspeaker

下载: 全尺寸图片幻灯片

Figure 10. The obtained voice from LDV and denoised results

下载: 全尺寸图片幻灯片

[1]	LI F F, WU J, ZHAO Zh L, et al. Air coupled vibration detection of all-fiber laser Doppler vibrometer[J]. High Power Laser and Particle Beams, 2012, 24(11): 2549-2554(in Chinese). doi: 10.3788/HPLPB
[2]	YU G, WANG Sh G, YU J H. Technology of digital speckle pattern interferometry and its applications[J]. Laser Technology, 2002, 26(3): 237-240(in Chinese).
[3]	JING X J. Research and implementation of speech enhancement algorithm[D]. Hangzhou: Zhejiang University, 2005: 1-55(in Chinese).
[4]	YUE D G, XIE Zh W. A new method to evaluate nonlinear distortion[J]. Technical Acoustics, 2007, 26(1): 84-89(in Chinese).
[5]	XU Y, DU J, DAI L R, et al. A regression approach to speech enhancement based on deep neural networks[J]. IEEE-ACM Transactions on Audio Speech and Language Processing, 2013, 23(1): 7-19.
[6]	HUANG P S, MIN J K, MARK H J, et al. Joint optimization of masks and deep recurrent neural networks for monaural source separation[J]. IEEE-ACM Transactions on Audio Speech and Language Processing, 2015, 23(12): 2136-2147. doi: 10.1109/TASLP.2015.2468583
[7]	HAN W, ZHANG X W, ZHOU X Y, et al. Joint optimization of deep neural networks and constrained Wiener filter for single channel speech enhancement[J]. Application Research of Computers, 2017, 34(3): 706-713(in Chinese).
[8]	YAO Y, WANG Q J, ZHOU W, et al. Research on speech enhancement based on spectral subtraction and neural network[J]. Electronic Measurement Technology, 2017, 40(7): 74-79(in Chinese).
[9]	LI W H, LIU M, ZHU Z G, et al. LDV remote voice acquisition and enhancement[J]. International Conference on Pattern Recognition, 2006, 20(24): 262-265.
[10]	LV T, ZHANG H Y, GUO J, et al. Acquisition and enhancement of remote voice based on laser coherent method[J]. Optics and Precision Engineering, 2017, 25(3): 569-575(in Chinese). doi: 10.3788/OPE.
[11]	QU Zh, ZHANG B H. An improved wavelet threshold algorithm applied in laser interception[J]. Laser Technology, 2014, 38(2): 218-224(in Chinese).
[12]	XU Y. Research on deep neural network based speech enhancement[D]. Hefei: University of Science and Technology of China, 2015: 55-75(in Chinese).
[13]	CHENG Y P, BU F L. Experiment study on phase perception in speech[J]. Acta Acustica, 2003, 28(1): 7-11(in Chinese).
[14]	HERMANS M, SCHRAUWEN B. Training and analyzing deep recurrent neural networks[R]. Lake Tahoe, USA: Proceedings of International Conference on Learning Representations(NIPS), 2013: 190-198.
[15]	WERBOS P J. Backpropagation through time: what it does and how to do it[J]. Proceedings of the IEEE, 1990, 78(10): 1550-1560. doi: 10.1109/5.58337
[16]	HUO L, ZENG X D, AN Sh Y, et al. Vibration measurement and analysis by means of laser Doppler heterodyne principle[J]. Laser Technology, 2011, 35(5): 600-602(in Chinese).
[17]	LIANG N. Research on laser Doppler vibrometer with homodyne detection[D]. Beijing: The University of Chinese Academy of Sciences, 2014: 13-23(in Chinese).
[18]	VINCENT E, GRIBONVAL R, FEVOTTE C. Performance measurement in blind audio source separation[J]. IEEE Trans on Audio Speech & Language Processing, 2006, 14(4):1462-1469.
[19]	ZHANG L W, JIA Ch, ZHANG X W, et al. Speech enhancement based on convolutive nonnegative matrix factorization with sparseness constraints[J]. Journal of Data Acquisition and Processing, 2014, 29(2): 259-264(in Chinese).

[1]	夏桂芬 , 赵保军 , 韩月秋 . 基于神经网络的远程激光测距机混沌弱信号检测. 激光技术, 2006, 30(5): 449-451.
[2]	谈渊 , 甘学辉 , 张东剑 , 刘香玉 , 廖壑 . 基于小波去噪的激光多普勒振动信号处理. 激光技术, 2022, 46(1): 129-133. doi: 10.7510/jgjs.issn.1001-3806.2022.01.014
[3]	黄威威 , 游德勇 , 高向东 , 张艳喜 , 黄宇辉 . 基于相关分析和神经网络的激光焊接稳态识别. 激光技术, 2022, 46(3): 312-319. doi: 10.7510/jgjs.issn.1001-3806.2022.03.004
[4]	张文博 , 张群莉 , 姚建华 . 基于人工神经网络脉冲激光强化镀层形貌预测. 激光技术, 2010, 34(2): 173-177. doi: 10.3969/j.issn.1001-3806.2010.02.009
[5]	徐大鹏 , 周建忠 , 郭华锋 , 季霞 . 基于进化神经网络的激光熔覆层质量预测. 激光技术, 2007, 31(5): 511-514.
[6]	颜鑫 , 应恺宁 , 戴鹭楠 , 谭钧夫 , 沈中华 , 倪辰荫 . 基于物理信息神经网络的激光超声波场研究. 激光技术, 2024, 48(1): 105-113. doi: 10.7510/jgjs.issn.1001-3806.2024.01.017
[7]	曹晓荷 , 朱斌 , 尚建蓉 , 王升哲 , 郑杰 , 范文瑞 . 激光制导伪随机编码信号解码技术. 激光技术, 2021, 45(2): 155-161. doi: 10.7510/jgjs.issn.1001-3806.2021.02.005
[8]	郭华锋 , 李菊丽 , 孙涛 . 基于BP神经网络的光纤激光切割切口粗糙度预测. 激光技术, 2014, 38(6): 798-803. doi: 10.7510/jgjs.issn.1001-3806.2014.06.016
[9]	邵晓东 , 姚龙海 , 张少坤 , 吴世嘉 , 陆海翔 , 王竞天 . 激光制导混合信号分选及编码识别技术研究. 激光技术, 2011, 35(5): 648-651,655. doi: 10.3969/j.issn.1001-3806.2011.05.020
[10]	柳赟 , 孙淑艳 . 基于主成分分析与曲面拟合的激光点云滤波去噪. 激光技术, 2020, 44(4): 497-502. doi: 10.7510/jgjs.issn.1001-3806.2020.04.017
[11]	赵洪博 , 张达 , 杨健坤 , 孟繁萃 , 张明 . 小波分层法在激光多普勒测速信号中的应用. 激光技术, 2019, 43(1): 103-108. doi: 10.7510/jgjs.issn.1001-3806.2019.01.021
[12]	赵兴海 , 高杨 , 程永生 . 激光点火技术综述. 激光技术, 2007, 31(3): 306-310,313.
[13]	胡增荣 , 童国权 , 陈长军 , 郭华锋 , 周亮 , 徐家乐 . 激光纳米表面工程技术. 激光技术, 2014, 38(6): 764-770. doi: 10.7510/jgjs.issn.1001-3806.2014.06.009
[14]	梁巍巍 , 黄振宇 , 张文攀 , 殷瑞光 , 刘艳芳 . 激光导引头四象限探测器偏差信号特性研究. 激光技术, 2014, 38(4): 569-573. doi: 10.7510/jgjs.issn.1001-3806.2014.04.027
[15]	王忠凯 , 毕建民 , 周昕 , 陈建国 , 陈涌 , 杨泽后 , 孙鹏 . 激光多普勒双光束横向测速技术研究. 激光技术, 2006, 30(2): 183-185.
[16]	赵世杰 , 张鹏 , 张永芹 , 杨玉萍 , 邓勇 . 基于激光回馈效应的多普勒测速技术. 激光技术, 2012, 36(2): 160-164,169. doi: 10.3969/j.issn.1001-3806.2012.02.004
[17]	陈涌 , 周秉直 , 谭锦 , 冯力天 , 杨泽后 , 赵彬 , 周鼎富 , 侯天晋 . 机载激光多普勒测风雷达技术及其应用. 激光技术, 2011, 35(6): 795-799. doi: 10.3969/j.issn.1001-3806.2011.06.020
[18]	何雅静 , 王伟 , 许本志 , 朱晓 , 齐丽君 , 朱长虹 . 复合脉冲深度激光打孔的实验研究. 激光技术, 2017, 41(3): 380-384. doi: 10.7510/jgjs.issn.1001-3806.2017.03.015
[19]	李慧 , 王志敏 , 张丰丰 , 王明强 , 李家佳 , 崔大复 , 彭钦军 , 许祖彦 . 全固态单频激光技术. 激光技术, 2016, 40(1): 141-147. doi: 10.7510/jgjs.issn.1001-3806.2016.01.031
[20]	赵长明 , 王云石 , 郭陆灯 , 张海洋 , 张子龙 , 张立伟 , 郑征 , 李建 . 激光无线能量传输技术的发展. 激光技术, 2020, 44(5): 538-545. doi: 10.7510/jgjs.issn.1001-3806.2020.05.003

点击查看大图

图(10)

计量

文章访问数: 4368
HTML全文浏览量: 2642
PDF下载量: 80
被引次数: 0

全文HTML

引言

激光多普勒测振仪(laser Doppler vibrometer，LDV)是利用光学多普勒效应来检测物体振动的设备，它可以实现对振动目标非接触、高灵敏度和远作用距离的测量^[1]。与此同时，声音信号源附近的物体通过空气耦合，会随着信号源的振动而振动，利用LDV探测说话人附近的物体的振动情况，可以远距离的还原说话人的声音。但是，通过LDV获取的语音信号会被各种各样的噪声所污染，比如激光束照射在粗糙物体表面引起的散斑效应^[2]、暗电流噪声和背景噪声等。人们将LDV内部元器件引入的噪声称作LDV的系统噪声，而将LDV的激光束打在振动目标上，最后接收回来的信号中的噪声称之为LDV测声系统的系统噪声，它是在测声过程中各种引入噪声的一个综合作用的结果。本文中主要针对去除LDV测声系统的系统噪声进行了研究, 提出针对LDV测声系统的语音信号去噪手段，对提升LDV系统的测声性能，降低从LDV获取的语音信号的噪声，有着重大的意义。

传统的单声道无监督语音信号去噪算法要求噪声比较平稳，以便在非语言段对噪声进行估计，再依据估计出来的噪声对带噪语音段进行处理^[3]。但在实际情况中，噪声具有随机性和突变性，使得对噪声的跟踪和估计变得困难。同时，传统的语音增强方法易引入非线性失真^[4]。近年来，深度神经网络(deep neural network, DNN)在语音信号处理中有着很多成功的应用，并且适应性好，限制条件少。基于大数据的训练，DNN可以充分学习噪音和干净语音之间的复杂的非线性关系，它能记住一些噪声模式，因而可以很好地抑制一些非平稳噪声^[5]。但参考文献[5]中同时提出，如果将DNN网络训练的帧数增加，随着上下文的帧数越来越多，DNN网络也难以处理。循环神经网络(recurrent neural network，RNN)可以看作是一个有无限层的DNN，但RNN缺少层次信息。为了弥补DNN和RNN网络结构的不足，HUANG等人提出了深度循环神经网络(deep recurrent neural network，DRNN)和掩蔽联合优化的语音信号去噪网络结构^[6]。在此基础上。HAN等人提出了联合优化神经网络和约束维纳滤波的语音增强方法^[7]。YAO等人提出了谱减法结合神经网络的语音增强^[8]。

针对LDV测声系统的语音降噪算法的研究较为初步，LI等人提出了利用高斯带通滤波器和维纳滤波处理LDV获取的语音信号^[9]。LÜ等人提出了基于最小控制递归平均算法估计噪声的维纳滤波抑制噪声^[10]。QU等人提出了一种改进的小波阈值算法应用于LDV测声系统^[11]。但前述的3种方法为通用的语音信号降噪手段，并没有考虑LDV测声系统所固有的噪声特性。而LDV测声系统的噪声模式较为单一，利用深度神经网络可以很好地提取LDV测声系统的噪声模式，并把语音信号从带噪语音中分离开来，从而达到降噪的目的。

本文中研究了利用深度循环网络结构提取LDV测声系统的系统噪声特征，同时利用训练好的深度循环神经网络结构，对从LDV系统采集回来的语音信号做降噪处理。实验结果表明，DRNN网络可以有效地对从LDV系统采集回来的语音信号做降噪处理，与此同时，可以很好地保留语音信号原有的信息。

4. 结论

本文中构建基于语音信号降噪的DRNN网络，利用LDV测声系统采集LDV的系统噪声和从LDV获取的带噪语音信号，构建用于训练和测试网络的数据集。通过控制扬声器的分贝，以及DRNN网络结构和训练参量做了多组对照实验。实验结果表明，DRNN网络可以对从LDV测声系统获取的语音信号做有效的降噪处理，对提升LDV测声系统的性能有着实际意义。

参考文献 (19)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

DRNN在激光多普勒测振仪测声系统中的应用

作者简介: 白涛(1992-)，男，硕士研究生，现主要从事语音信号处理的研究.

通讯作者: 吴谨, jwu909@263.net ;

Application of DRNN in voice measurement system of laser Doppler vibrometer

Corresponding author: WU Jin, jwu909@263.net ;

计量

DRNN在激光多普勒测振仪测声系统中的应用

通讯作者: 吴谨, jwu909@263.net;

作者简介: 白涛(1992-)，男，硕士研究生，现主要从事语音信号处理的研究

English Abstract

Application of DRNN in voice measurement system of laser Doppler vibrometer

Corresponding author: WU Jin, jwu909@263.net

全文HTML

1.1. 特征提取

1.2. DRNN网络结构

1.3. 去噪网络结构

2.1. 实验装置

2.2. 数据集构建

2.3. 数据处理

目录

留言板

DRNN在激光多普勒测振仪测声系统中的应用

作者简介: 白涛(1992-)，男，硕士研究生，现主要从事语音信号处理的研究.

通讯作者: 吴谨, jwu909@263.net ;

Application of DRNN in voice measurement system of laser Doppler vibrometer

Corresponding author: WU Jin, jwu909@263.net ;

计量

出版历程

DRNN在激光多普勒测振仪测声系统中的应用

通讯作者: 吴谨, jwu909@263.net;

作者简介: 白涛(1992-)，男，硕士研究生，现主要从事语音信号处理的研究

English Abstract

Application of DRNN in voice measurement system of laser Doppler vibrometer

Corresponding author: WU Jin, jwu909@263.net

全文HTML

1.1. 特征提取

1.2. DRNN网络结构

1.3. 去噪网络结构

2.1. 实验装置

2.2. 数据集构建

2.3. 数据处理

目录