基于某MATLAB地语音信号时域特征分析报告 联系客服

发布时间 : 星期四 文章基于某MATLAB地语音信号时域特征分析报告更新完毕开始阅读7dede17425284b73f242336c1eb91a37f111329c

实用文档

实验题目 姓名 1.基于MATLAB的语音信号小组合否 时域特征分析 2.基于MATLAB分析语音信作 号频域特征 班级 信息安全 学 号 一、 实验目的 1. 本实验要求掌握时域特征分析原理,并利用已学知识,编写程序求解语音信号短时过零率、短时能量、短时自相关特征,分析实验结果,并能掌握借助时域分析方法所求得的参数分析语音信号的基音周期及共振峰。 2.本实验要求掌握傅里叶分析原理,会利用已学的知识,编写程序估计短时谱、倒谱,画出语谱图,并分析实验结果,在此基础上,借助频域分析方法所求得的参数分析语音信号的基音周期或共振峰。 二.实验环境 一台装cool edit pro2.1和MATLAB的计算机。 三、实验内容与步骤 实验原理:

实用文档

1.窗口的选择 通过对发声机理的认识,语音信号可以认为是短时平稳的。在5~50ms的范围内,语音频谱特性和一些物理特性参数基本保持不变。我们将每个短时的语音称为一个分析帧。一般帧长取10~30ms。我们采用一个长度有限的窗函数来截取语音信号形成分析帧。通常会采用矩形窗和汉明窗。图1.1给出了这两种窗函数在帧长N=50时的时域波形。 矩形窗21.81.61.41.210.90.80.70.6hanming窗w(n)10.80.60.40.20w(n)020sample40600.50.40.30.20.10020sample4060图1.1 矩形窗和Hamming窗的时域波形

矩形窗的定义:一个N点的矩形窗函数定义为如下 ?n?Nw(n)??1,00,其他 hamming窗的定义:一个N点的hamming窗函数定义为如下 ?0.54?0.46cos(2?Nn?1),0?n?Nw(n)=?0,其他? 这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图1.2):矩形窗的主瓣宽度小(4*pi/N),具有较高的频率分辨率,旁瓣峰值大(-13.3dB),会导致泄漏现象;汉明窗的主瓣宽8*pi/N,旁瓣峰值低(-42.7dB),可以有效的克服泄漏现象,具有更平滑的低通特性。因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。表1.1对比了这两种窗函数的主瓣宽度和旁瓣峰值。

实用文档

矩形窗频率响应0-20幅度/dB-40-60-8000.10.20.30.40.50.6归一化频率(f/fs)Hamming窗频率响应0.70.80.910幅度/dB-50-10000.10.20.30.40.50.6归一化频率(f/fs)0.70.80.91 图1.2 矩形窗和Hamming窗的频率响应 表1.1 矩形窗和hamming窗的主瓣宽度和旁瓣峰值 2.短时能量 窗函数 矩形窗 hamming 主瓣宽度 4*pi/N 8*pi/N 旁瓣峰值 13.3dB 42.7dB 由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为: En?m????[x(m)w(n?m)]??2?m?n?N?1?n[x(m)w(n?m)]2,其中N为窗长 特殊地,当采用矩形窗时,可简化为: En?m????x2(m) 图1.3和图1.4给出了不同矩形窗和hamming窗长的短时能量函数,我们发现:在用短时能量反映语音信号的幅度变化时,不同的窗函数以及相应窗的长短均有影响。hamming窗的效果比矩形窗略好。但是,窗的长短影响起决定性作用。窗过大(N 很大),等效于很窄的低通滤波器,不能反映幅度En的变化;窗过小( N 很小),短时能量随时间急剧变化,不能得到平滑的能量函数。在11.025kHz左右的采样频率下,N 选为100~200比较合适。 短时能量函数的应用:1)可用于区分清音段与浊音段。En值大对应于浊音段,En值小对应于清音段。2)可用于区分浊音变为清音或清音变为浊音的时间(根据En值的变化趋势)。

实用文档

3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。无信号(或仅有噪声能量)时,En值很小,有语音信号时,能量显著增大。 采样幅度10-102000400060008000sample1000012000140001600018000N=502000400060008000sample1000012000140001600018000N=1502000400060008000sample1000012000140001600018000N=2502000400060008000sample1000012000140001600018000N=3502000400060008000sample1000012000140001600018000N=4502000400060008000sample1000012000140001600018000采样幅度10-102000400060008000sample1000012000140001600018000N=502000400060008000sample1000012000140001600018000N=1502000400060008000sample1000012000140001600018000N=2502000400060008000sample1000012000140001600018000N=3502000400060008000sample1000012000140001600018000N=4502000400060008000sample1000012000140001600018000短时能量2001050010500201000201000短时能量短时能量短时能量短时能量短时能量421004200105001050010500短时能量短时能量短时能量短时能量 图1.3 不同矩形窗长的短时能量函数 图1.4 不同hamming窗长的短时能量函数 3.短时平均过零率 过零率可以反映信号的频谱特性。当离散时间信号相邻两个样点的正负号相异时,我们称之为“过零”,即此时信号的时间波形穿过了零电平的横轴。统计单位时间内样点值改变符号的次数具可以得到平均过零率。定义短时平均过零率: Zn?m?????sgn[x[m]?sgn[x(m?1)]w(n?m) x(n)?0sgnx(n)??1,?1,x(n)0其中sgn[]为符号函数,条件下,可以简化为 ,在矩形窗1Zn?2Nm?n?N?1?nsgn[x(m)?sgn[x(m?1)] 短时过零率可以粗略估计语音的频谱特性。由语音的产生模型可知,发浊音时,声带振动,尽管声道有多个共振峰,但由于声门波引起了频谱的高频衰落,因此浊音能量集中于3KZ以下。而清音由于声带不振动,声道的某些部位阻塞气流产生类白噪声,多数能量集中在较高频率上。高频率对应着高过零率,低频率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系。.