信息综合课设 - 语音信号的盲分离 联系客服

发布时间 : 星期日 文章信息综合课设 - 语音信号的盲分离更新完毕开始阅读4268a6b658f5f61fb73666f6

武汉理工大学《信息处理课综合训练与设计群》课程设计

在盲信号分离问题研究中,学者们提出了很多的算法,每种算法都在一定程度上取得了成功。从算法的角度而言,BSS算法可分为批处理算法和自适应算法;从代数函数和准则而言,又分为基于神经网络的方法、基于高阶统计量的方法、基于互信息量的方法、基于非线性函数的方法等。

尽管国内对盲信号分离问题的研究相对较晚,但在理论和应用方面也取得很大的进展。清华大学的张贤达教授在其1996年出版的《时间序列分析——高阶统计量方法》一书中,介绍了有关盲分离的理论基础,其后关于盲分离的研究才逐渐多起来。近年来国内各类基金支持了盲信号处理理论和应用的项目,也成立了一些研究小组。

虽然盲源分离理论方法在近几年已经取得了长足的发展,但是还有许多问题有待进一步研究和解决。首先是理论体系有待完善。实际采用的处理算法或多或少都带有一些经验知识,对于算法的稳定性和收敛性的证明不够充分。盲源分离尚有大量的理论和实际问题有待解决,例如多维ICA问题、带噪声信号的有效分离方法、如何更有效地利用各种先验知识成功分离或提取出源信号、一般性的非线性混合信号的盲分离、如何与神经网络有效地结合、源信号的数目大于观察信号的数目时ICA方法等。另外,盲源分离可同其他学科有机结合,如模糊系统理论在盲分离技术中的应用可能是一个有前途的研究方向;盲源分离技术与遗传算法相结合,可以减少计算复杂度,提高收敛速度。如何有效提高算法对源信号统计特性的学习和利用也需要进行深入研究。

1.3盲源分离的应用

近年来,盲信号处理逐渐成为当今信息处理领域中热门的课题之一,并且已经在尤其在、地震探测、移动通信、语音处理、阵列信号处理及生物医学工程领域展现出诱人的应用前景。下面介绍盲处理应用中的三个主要方面。

1.3.1 语音处理领域

语音信号分离、语音识别是盲处理应用的一个重要领域。最典型的应用就是声控计机,计算机所接受到的语音指令肯定是肯定是带有各种环境噪声的,还可能存在其他的语音信号(如有其他人说话),而且这些信号源与接收器的相对位置也未知,计算机需要在这种情况下识别出正确的语音命令。

6

武汉理工大学《信息处理课综合训练与设计群》课程设计

在移动通信中,往往存在通信质量问题,极大的影响了通话效果,而盲源分离或盲均衡技术能够消除噪声、抑制干扰及增强语音,提高通话质量。

如图1-3所示的是4段语音信号的混合信号,用忙信号处理算法可以将源语音信号分离出来,虽然不知道源语音信号的类型。

50-50.010050010001500200025003000混合信号13500400045005000x 10-3amplitude-0.0150-50.020-0.020x 10-350010001500200025003000混合信号23500400045005000050010001500200025003000混合信号33500400045005000050010001500200025003000混合信号4sample3500400045005000图1-3 4段混合语音信号

如图只知道混合的语音信号,其他的未知,要分离出源语音信号就是语音信号盲分

离要做的工作,也是本次设计的主要目的。

1.3.2 图像处理领域

盲信号分离同样应用于二维数据,如图像滤波、图像增强等处理。在图像恢复和重构问题中,主要的任务就是从被污染的图像中恢复出图像的原来面目,消除获取图像时各种因素如相机抖动、镜头变形、传输噪声叠加等造成的图像质量问题,可用盲处理的方法获得比较满意的效果。

1.3.3 生物医信号处理学领域

在生物医学领域,盲信号处理可应用于心电图(ECG)、脑电图(EEG)信号分离、听觉信号分析、功能磁共振图像(FMRI)分析等。例如人们常常需要从肌电图中确定神经元细胞信号的触发模式,而EMG信号通常由多个特殊的传感器在人体表处测得,从信号

7

武汉理工大学《信息处理课综合训练与设计群》课程设计

源到传感器之间的信号传输介质参数是未知的,而人们之间各不相同。目前已经有一些学者将盲源分离技术成功地够应用于脑电图等信号的数据处理。

此外,盲分离技术还应用于阵列信号的处理领域。在阵列传感器中,各传感器接收到的混合信号,而源信号及混合特性完全未知,这是典型的盲信号处理应用问题。在军事领域中,近年来发展起来的雷达由于只接受信号而不发出任何信号受到广泛的重视,这种雷达的工作原理就是盲信号处理技术。

8

武汉理工大学《信息处理课综合训练与设计群》课程设计

2 Matlab语音信号的采集

2.1语音信号的采集方法

在Matlab环境中,主要可以通过以下几种方法驱动声卡,采集语音信号: 1.将声卡作为对象处理采集语音信号Matlab将声卡作为对象处理,其后的一切操作都不与硬件直接相关,而是通过对该对象的操作来作用于硬件设备(声卡)。操作时首先要对声卡产生一个模拟输入对象,给对象添加一个通道设置采样频率后,就可以启动设备对象,开始采集数据,采集完成后停止对象并删除对象。

2.调用wavrecord功能函数采集语音信号。wavrecord功能函数只适用windows95/98/N平台,它使用windows声音输入设备录制声音。

函数调用方式:wavrecord(N,fs,ch,nbits),其中N采集的样本数据量,fs是样本采集频率有8000Hz、11025Hz、22050Hz和44100Hz几个选项,默认值为11025Hz;ch是样本采集通道,1为单声道,2为双声道,默认值为单声道;nbits是每个样本的位数(或称解析度),double、single或int16、uint8。

3.运用audiorecorder对象采集语音信号audiorecorder(fs,nbits,ch)可以创设一个audiorecorder对象。fs是样本采集频率,为8000Hz、11025Hz、22050Hz和44100Hz之一,默认值为8000Hz;nbits是每个样本的位数,8位或16位,默认值为8位;ch:样本采集通道,1为单声道,2为双声道,默认值为1(单声道);audiorecorder对象创设后,就可以进行相应的录音、暂停、停止、播放以及数据读取等操作。

在这次的设计中,利用windows自带的录音机录制语音文件,图2-1是基于PC机的语音信号采集过程,声卡可以完成语音波形的A/D转换,获得WAVE文件,为后续的处理储备原材料。调节录音机保存界面的“更改”选项,可以存储各种格式的WAVE文件。

声音 麦克风 声卡 滤波 采样 A/D转换 Wav

图2-1 基于PC机的语音信号采集过程

9