基于matlab的语音识别系统的设计本科毕设毕业论文 联系客服

发布时间 : 星期六 文章基于matlab的语音识别系统的设计本科毕设毕业论文更新完毕开始阅读f8419990541810a6f524ccbff121dd36a32dc49b

河南理工大学毕业设计(论文)说明书

取数据时,前一帧与后一帧的交叠部分称为帧移。帧移与帧长之比一般取为0~0.5。在对语音信号进行短时分析的过程中,信号流的处理用分段或分帧来实现。一般每秒的帧数为33~100,视实际情况而定。分帧既可连续,也可采用交叠分段的方法,用可移动的有限长度窗口进行加权的方法来实现。

在10~20ms这样的时间段内,数字化后的语音信号的频谱特性和某些物理特征参量可近似地看作是不变地。这样就可以采用平稳过程的分析处理方法来处理了。这种时间以来处理的基本手段,一般是用一个长度有限的窗序列w(n)截取一段语音信号来进行分析,并让这个窗滑动,以便分析任意时刻附近的信号。其一般式为Qn?m????T[x(m)]?w(n?m),其中

?T[*]表示某种运算{x(m)}为输入信号序列。通帮采用最多的窗函数是矩形窗、汉宁窗(Hanning)和哈明窗(Hamming)。本文主要采用哈明窗,其公式为:

??2??m?1??0.54?0.46cos??,n?0~L (2-2) ?L?1??w(n)????0,n?其他其中L是窗长。通常认为在一个语音帧内,应含有1~7个基音周期。然而,不同人的基音周期变化范围很大,从女性儿童的2ms到老年男子的14ms(即基音频率为50~70Hz),所以L的选择比较困难。通常在l0kHz采样频率下,L折衷选择为100~200个采样点(即持续时间为10~20ms)。

2.3语音信号的时域分析

对信号分析最自然最直接的方法是以时间为自变量进行分析,语音信号典型的时域特征包括短时能量、短时平均过零率、短时自相关系数和短时平均幅度差。

2.3.1短时能量分析

对于信号x(n),短时能量定义为:

En?m???2

2??x?m?w?n?m????m?n?N?1??x?m?w?n?m??n2?x2?n?*h?n? (2-3)

式中,h(n)=w(n),N为窗长,En表示在信号的第n个点开始加窗函数时的短时能量。可以看出,短时能量可以看作语音信号的平方经过一个线性滤波器的输出,该线性滤波器的单位冲激响应为h(n),如图2.4所示。

图2.4短时能量的方框图表示

如果用xw表示x(n)经过加窗处理后的信号,窗函数的长度为N,则短时能量可表示为:

9

河南理工大学毕业设计(论文)说明书

n?N?1En?m?n (2-4)

?x?m?2w如图2.5所示为语音“0”时域波形图和语音“0”短时能量图。

图2.5语音信号“0”的短时能力函数

利用短时能量可以区分清音和浊音,因为浊音的能量比清音的能量大得多;其次可以用短时能量对有声段和无声段进行判定,对声母和韵母分界,以及对连字分界等。在语音识别系统中,一股也作为特征中的一维参数来表示语音信号能量的大小和超音段信息。

短时能量由于是对信号进行平方运算,因而认为增加了高低信号之间的差距,因此要采用短时平均幅度来表示能量的变化,其公式为:

Mn?m????x?m?w?n?m???x?m? (2-5)

wm?n?n?N?1如图2.6所示为“0”的短时平均幅度图。从图中可观察到,短时平均幅度对能量小的信号累计效果要比短时能量好。

10

河南理工大学毕业设计(论文)说明书

图2.6语音信号“0”的短时平均幅度

2.3.2短时平均过零率

短时平均过零率是指每帧内信号通过零值的次数。对于连续语音信号,可以考察其时域波形通过时间轴的情况。对于离散信号,它实质上是信号采样点符号变化的次数。在一定程度上短时过零率可以反映出频率的信息,在浊音段一般具有较低的过零率,而在清音段具有较高的过零率,这样就可以初步判断清音和浊音,但只是相对而言,没有精确的数值关系。短时平均过零率公式为:

1?Zn??sgn?x?m???sgn?x?m?1??w?n?m? (2-6) 2m???1n?N?1??sgn?xw?m???sgn?xw?m?1??2m?nSgn[*]是符号函数。为了解决低频的干扰,我们设立一个门限T,将过零率的含义修

改为跨过正负门限的次数。于是有:

zn?sgn?x?m??T??sgn?x?m?1??T?? (2-7) 1??????w?n?m??2m?????sgn?x?m??T??sgn?x?m?1??T????另外,可以将短时平均过零率和短时能量结合起来判断语音起止点的位置,即进行端

点检测。在背景噪声较小的情况下,短时能量比较准确,但当背景噪声较大时,短时平均过零率可以获得较好的检测效果。一次一般的识别系统,其前端的端点检测过程都是将这两个参数结合用于检测语音是否真的开始。如图2.7语音信号“0”的过零率,可为端点检测提供参考。

11

河南理工大学毕业设计(论文)说明书

图2.7 语音信号“0”的短时平均过零率

2.3.3短时自相关函数和短时平均幅度差函数

语音信号xw(n)的短时自相关函数Rn(k)的计算式如下:

Rn?k??N?km?0?x?m?x?m?1??0?k?K? (2-8)

nn这里K是最大的延迟点数。短时自相关函数具有一些性质,如它是偶函数假设序列具有周期性,则其自相关函数也是同周期的周期函数等。因此对于浊音语音可以用自相关函数求出语音波形序列的基音周期。

短时自相关函数是语音信号时域分析的重要参量。但是,计算自相关函数的运算量很大,其原因是乘法运算所需要的时间较长。利用快速傅立叶变换等简化计算方法都无法避免乘法运算。为了避免乘法,一个简单的方法就是利用差值,为此常常采用另一种与自相关函数类似作用的参量,即短时平均幅度差函数(AMDP)。

平均幅度差函数能够代替自相关函数进行语音分析,是基于这样一个事实:如果信号是完全的周期信号(设周期为Np。),则相距为周期的整数倍的样点上的幅值是相等的,差值为零。即:

d?n??x?n??x?n?k??0?k?0,?Np,?2Np,?? (2-9)

对于实际的语音信号,d(n)虽不为零,但其值很小。这些极小值将出现在整数倍周期

12