基于盲信号处理的人声分离

1.问题描述

在实际生活中,存在一种基本现象称为“鸡尾酒效应”,该效应指即使在非常嘈杂的环境中,人依然可以从噪声中提取出自己所感兴趣的声音。

在实际应用中,我们可能需要对混合的声音进行分离,此时已知的只有混合后的信号X和原信号S的部分统计特性,即原信号S不可测,信号状况A不可知,混合后的信号X可以表示为

X=A[S]

此时只有信号X和原信号S的部分统计特性已知,此时需要恢复S,则要采用盲信号处理技术。

2.盲信号分离

盲信号分离即是在原信号S和信道参数A都未知的情况下,利用输入原信号的统计特性,仅根据观测信号X恢复出原始信号各个独立成分的过程。

在盲信号分离中,根据不同的原信号的混合方式,可以将传输信道分为三种,有线性瞬时混合模型、线性卷积混合模型和非线性混合模型。盲信号分离技术是依据的原信号的部分先验知识对混合信号进行分离,如高阶统计量、二阶统计量、非平稳性、独立性等等,常用的盲信号分离的算法分为三类,独立变量分析(Independent Component Analysis ICA)、非线性变量分析和状态空间法。

本案例中主要针对声音信号的分离问题,因此采用线性瞬时混合模型信道且不考虑噪声影响,并独立变量分析(ICA)算法对声音进行分离,因此本文的接下来的内容主要讨论使用ICA算法进行声音分离。

2.1基本原理

在声音分离问题中,采用线性瞬时混合模型信道,当有N个长度为原信号表示为,信道传输矩阵,此时信道输出的M个长度为混合信号可以表示为

此时,利用ICA算法对混合信号X进行分离,前提需要N个原信号相互独立,信源个数已知,且混合信号的个数M大于信源个数。该方法实质上计算得到一个分离矩阵,恢复后的信号可以表示为

在实现混合信号X完全分离的情况,分离矩阵W满足以下公式

盲信号处理技术主要包括两个主要任务:一是构造目标函数,二采用不同的迭代优化方法使得目标函数达到最优值。

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注