一种改进的子空间语音增强算法

任永梅1，2

（1.湖南工学院电气与信息工程学院，湖南衡阳 421002；

２.湖南工学院信号与信息处理重点实验室，湖南衡阳 421002）

【摘　要】为了进一步减少传统子空间语音增强方法增强的语音中的残留噪声，提出一种改进的子空间语音增强算法。新算法首先对带噪语音进行KL(Karhunen-Loeve Transform)变换，得到带噪语音的特征值；接着用递归最小二乘算法（RLS）估计出噪声特征值，对传统子空间算法容易引起的特征值估计偏差问题进行修正；最后用带噪语音特征值减去RLS方法估计出的噪声特征值并由KL逆变换还原出纯净语音。仿真结果表明，在高斯白噪声背景下，与传统子空间语音增强算法相比，新算法提高了增强语音的信噪比，减少了语音失真。

教育期刊网 http://www.jyqkw.com
关键词语音增强；子空间；递归最小二乘算法；SNR

New Improved Subspace Method of Speech Enhancement

REN Yong-mei1,2

(1.School of Electrical and Information Engineering, Hunan Institute of Technology, Hengyang Hunan 421002, China；

2.Key Laboratory of Signal & Information Processing, Hunan Institute of Technology, Hengyang Hunan 421002, China)

【Abstract】In order to reduce the residual noise in enhanced speech that by using the traditional subspace speech enhancement method，this paper proposed the new improved subspace method of speech enhancement. The new algorithm firstly does Karhunen Loeve Transform to noisy speech and gets its eigenvalues, then it uses the Recursive least squares algorithm (RLS) to estimate noise characteristic value, which fixes the problem that the traditional subspace speech enhancement algorithm causes speech feature value estimation deviation; finally it uses the noisy speech eigenvalues to minus the noise characteristic value and the clean speech is gained by KL reverse transformation. Simulation experimental results show that comparing with subspace speech enhancement method, the new proposed algorithm improves the signal-to-noise ratio(SNR) of the enhanced speech and reduces the distortion of the speech in white Gaussian noise background.

【Key words】Speech enhancement; Subspace; RLS; SNR

※基金项目：2013年度湖南工学院校级科学研究项目（HY13002）。

作者简介：任永梅（1988.08—），女，汉族，陕西宝鸡人，硕士，湖南工学院，助教，研究方向为语音信号处理。

0　引言

语音增强技术是语音信号处理技术中的一个重要分支，它可以有效去除数字通信系统中的噪声，因此，人们越来越重视语音增强在语音处理方面的作用。近年来，子空间方法在语音增强研究中已有了较大发展[1-2]。该方法的基本思想是将带噪语音信号映射到叠加噪声的信号子空间与噪声子空间中，再将噪声子空间消除掉，在叠加噪声的信号子空间中估计原始信号[3-4]。传统的子空间算法不能滤除整个噪声子空间，所以在估计语音特征值时很容易引起偏差，致使增强的语音信号中有失真，因此本文提出一种改进的子空间语音增强算法。新算法先对带噪语音做KL变换并计算其特征值；接着利用RLS方法估计出噪声特征值，以修正传统方法中仅用无声段的方差平均值来估计噪声特征值；最后用带噪语音特征值减去估计出的噪声特征值，并做KL逆变换以得到增强语音。实验结果表明新算法在高斯白噪声背景下能够更好地去除噪声，减少了语音失真。

1　改进的子空间语音增强算法

1.1　递归最小二乘算法的原理

递归最小二乘算法（RLS）是自适应滤波器[5]中通常采用的一种自适应方法，其本质是一种有限长单位脉冲响应维纳滤波器的时间递推算法，并严格以最小二乘法准则为依据[6]。自适应滤波器的原理图如图1所示。

结合图1，对RLS算法的具体原理描述如下：

①定义估计误差

其中，k(n)为增益向量。

1.2　改进的子空间语音增强算法

传统的子空间语音增强算法仅仅用无声段（一般为前3000个采样点）的方差平均值估计噪声特征值，会对语音特征值的估计出现偏差，引起语音失真。鉴于此，提出改进的子空间语音增强算法，其流程图如图2所示。由图2可知新算法步骤如下：

①对输入的噪声语音做KL变换，得出其在子空间域的特征值Y和特征向量；

②通过RLS递归更新方法估计出噪声并计算其特征值N，实现对传统方法中的噪声特征值的修正，达到减少语音失真的目的。

③计算纯净语音的特征值S，即用Y减去N；

④由KL逆变换得到增强语音

。

2　仿真实验与分析

用MATLAB软件对新算法进行了仿真实验，并和传统子空间方法进行了对比，验证了算法的有效性。在实验中，纯净语音资料为NOIZEUS语音库中的英语男声短句“The birch canoe slid on the smooth planks.”，噪声来源于Noisex-92数据库的高斯白噪声，语音和噪声的采样率均为8kHz，依照实验结果最优的原则，设置帧长为40个采样点，帧移为一半。图3是信噪比为5dB的高斯白噪声背景下两种算法得到的增强语音的时域波形图。