书签分享收藏举报版权申诉 / 14

立即下载加入VIP,免费下载

当前位置：首页 > IT计算机 > 电脑基础知识 > 武汉科技大学语音信号处理课程设计报告.docx

武汉科技大学语音信号处理课程设计报告.docx

文档编号：17864579
上传时间：2023-08-04
格式：DOCX
页数：14
大小：130.95KB

《武汉科技大学语音信号处理课程设计报告.docx》由会员分享，可在线阅读，更多相关《武汉科技大学语音信号处理课程设计报告.docx（14页珍藏版）》请在冰点文库上搜索。

武汉科技大学语音信号处理课程设计报告.docx

武汉科技大学语音信号处理课程设计报告

语音信号处理

课程考核报告

题目1:

9.不同窗长的修正自相关

题目2:

7.基于倒谱的基音检测

学号:

姓名:

班级:

2014年6月

----------------------------------------------------------------------------------------

评语：

1不同窗长的修正自相关3

1.1要求3

1.2原理分析3

1.3源代码4

1.4仿真图形5

1.5仿真分析6

2基于倒谱的基音检测6

2.1要求6

2.2原理分析6

2.3源代码7

2.4仿真图形9

2.5仿真分析10

3总结10

1不同窗长的修正自相关

1.1要求

绘制不同矩形窗长度的修正短时自相关函数。

1.2原理分析

对于语音来说，采用短时分析方法，语音短时自相关函数为

（1）

但是，在计算短时自相关时，窗选语音段为有限长度N，而求和上限为，因此当增加时可用于计算的数据就越来越少了，从而导致增加时自相关函数的幅度减小。

为了解决这个问题，提出了语音修正的短时自相关。

修正的短时自相关函数，其定义如下：

（2）

若令

，代入上式中得到

（3）

定义

则有

（4）

（5）

式中，K为k的最大值，即

。

由式（5）可知要使为非零值，必须使，考虑到，可得，故式（4）可以写成：

（6）

1.3源代码

fid=fopen（'test.txt','rt'）

b=fscanf（fid,'%f'）;

b1=b（1:

640）;

N=320;%设定矩形窗长为320

A=[];

fork=1:

320;

sum=0;

form=1:

N;

sum=sum+b1（m）*b1（m+k-1）;

end

A（k）=sum;

end

fork=1:

320

A1（k）=A（k）/A

（1）;%归一化A（k）

end

figure

（1）

subplot（3,1,1）

plot（A1）;

xlabel（'延时k'）

ylabel（'R（k）'）

legend（'N=320'）

axis（[0,320,-1,1]）;

b2=b（1:

320）;

N=160;%设定矩形窗长为160

B=[];

fork=1:

160;

sum=0;

form=1:

N;

sum=sum+b2（m）*b2（m+k-1）;

end

B（k）=sum;

end

fork=1:

160

B1（k）=B（k）/B

（1）;%归一化B（k）

end

figure

（1）

subplot（3,1,2）

plot（B1）;

xlabel（'延时k'）

ylabel（'R（k）'）

legend（'N=160'）

axis（[0,320,-1,1]）;

b3=b（1:

140）;

N=70;%设定矩形窗长为70

C=[];

fork=1:

70;

sum=0;

form=1:

N;

sum=sum+b3（m）*b3（m+k-1）;

end

C（k）=sum;

end

fork=1:

70

C1（k）=C（k）/C

（1）;%归一化C（k）

end

figure

（1）

subplot（3,1,3）

plot（C1）;

xlabel（'延时k'）

ylabel（'R（k）'）

legend（'N=70'）

axis（[0,320,-1,1]）;

1.4仿真图形

1.5仿真分析

假如使用短时自相关函数：

如果长基音周期用窄的矩形窗，将得不到预期的基音周期；但是如果是短的基音周期用长的矩形窗，自相关函数将对多个基音周期作平均计算，从而模糊语音的短时特性，这种结果是不希望出现的。

而采用短时的修正自相关函数由仿真图形可以看出，即使采用较窄的矩形窗不会出现上述问题，同时避免了短时自相关函数随k值增加而衰减不足的问题。

2基于倒谱的基音检测

2.1要求

基于倒谱图判断浊音的基音周期。

2.2原理分析

语音的倒谱是将语音的短时谱取对数后再进行IDFT得到的,所以浊音信号

的周期性激励反映在倒谱上是同样周期的冲激。

借此,可从倒谱波形中估计出基

音周期。

一般把倒谱波形中第二个冲激,认为即是对应激励源的基频。

下面给出一种倒谱法求基音周期的框图，如图1所示。

先计算倒谱.然后在

预期的基音周期附近寻找峰值。

如果倒谱的峰值超出了预先规定的门限，则输入

语音段定为浊音，而峰的位置就是基音周期的良好估值.如果投有超出门限的峰

值，则输入语音段定为清音，如果计算的是一个时变的倒谱，则可估计出激励源

模型及基音周期随时间的变化.一般每隔10－20ms，计算倒谱一次，这是因为在

一般语音中激励参数是缓慢变化的。

图1一种倒谱法求基音周期的实现框图

为了更好地估计共振峰的频率，通常还要进行平滑处理。

常见的平滑处理有线性平滑和中值平滑。

中值平滑是将相邻的几个数从大到小排列，（通常取5个或3个），取中间的数作为平滑后的值。

线性平滑则分别对这几个数进行加权并相加，加权系数之和为1。

2.3源代码

waveFile='qinghua.wav';

[y,fs,nbits]=wavread（waveFile）;

time=（1:

length（y））/fs;

frameSize=floor（40*fs/1000）;%帧长

startIndex=round（15000）;%起始序号（浊音取15000）

endIndex=startIndex+frameSize-1;%结束序号

frame=y（startIndex:

endIndex）;%取出该帧

frameSize=length（frame）;

frame2=frame.*hamming（length（frame））;%加汉明窗

rwy=rceps（frame2）;%求倒谱

ylen=length（rwy）;

cepstrum=rwy（1:

ylen/2）;%基音检测

LF=floor（fs/500）;%设置基音搜索的范围

HF=floor（fs/70）;

cn=cepstrum（LF:

HF）;

[mx_cepind]=max（cn）;%设置门限找到峰值位置

ifmx_cep>0.08&ind>LF

a=fs/（LF+ind）;%在round为15000情况下a=110.25

else

a=0;

end

figure

（1）;

plot（time,y）;title（waveFile）;axistight

ylim=get（gca,'ylim'）;

line（[time（startIndex）,time（startIndex）],ylim,'color','r'）;

line（[time（endIndex）,time（endIndex）],ylim,'color','r'）;

title（'语音波形'）;

figure

（2）;

subplot（2,1,1）;

plot（frame）;

title（'取出帧的波形'）;

subplot（2,1,2）;

plot（cepstrum）;

title（'倒谱图'）;

[x,sr]=wavread（'qinghua.wav'）;

meen=mean（x）;

x=x-meen;

updRate=floor（20*sr/1000）;%每20ms更新

fRate=floor（40*sr/1000）;%40ms一帧

n_samples=length（x）;

nFrames=floor（n_samples/updRate）-1;%Ö¡Êý

k=1;

pitch=zeros（1,nFrames）;

f0=zeros（1,nFrames）;

LF=floor（sr/500）;

HF=floor（sr/70）;

m=1;

avgF0=0;

fort=1:

nFrames

yin=x（k:

k+fRate-1）;

cn1=rceps（yin）;

cn=cn1（LF:

HF）;

[mx_cepind]=max（cn）;

ifmx_cep>0.08&ind>LF

a=sr/（LF+ind）;

else

a=0;

end

f0（t）=a;

ift>2&nFrames>3%中值滤波对基音轨迹图进行平滑

z=f0（t-2:

t）;

md=median（z）;

pitch（t-2）=md;

ifmd>0

avgF0=avgF0+md;

m=m+1;

end

else

ifnFrames<=3

pitch（t）=a;

avgF0=avgF0+a;

m=m+1;

end

k=k+updRate;

end

figure（3）

subplot（211）;

plot（（1:

length（x））/sr,x）;

ylabel（'振幅'）;

xlabel（'时间'）;

subplot（212）;

xt=1:

nFrames;

xt=20*xt;

plot（xt,pitch）

axis（[xt

（1）xt（nFrames）0max（pitch）+50]）;

ylabel（'基因频率/Hz'）;

xlabel（'时间'）;

2.4仿真图形

2.5仿真分析

仿真过程中，首先取出浊音部分的帧，然后进行倒谱分析，然后逐帧取基音，画出基音轨迹图。

为了更好地估计共振峰的频率，仿真中进行了平滑处理。

对于语音信号做倒谱图分析，能够分析出较为理想的语音信号基音周期。

3总结

在一个学期的“语音信号处理”学习中，我先后学习了语音信号的基本特性、时域分析、傅里叶分析、倒谱分析、线性预测分析、语音检测分析等一系列知识。

在过去的“信号与系统”和“数字信号处理”两门课程中，我们所学习的都是信号的理论分析知识，几乎没有将实际信号进行分析与处理。

而在语音信号处理的课堂上，我接触了大量实际信号分析的技巧与特性，在此过程中不仅加深了我对信号与系统和数字信号处理的理解，而且让我学习到语音信号的一系列处理技巧。

通过这一次的语音信号处理考核，更是将我所学的相关知识投入到实战之中，在这一个过程中我也学到了很多东西，在课堂上有很多没有注意或者没有理

解的知识点，通过实践得到了理解。

此外，在课堂上虽然进行了大量语音信号处理理论知识的学习，但是并未进行过任何基于MATLAB的仿真讲解，在完成考核程序的过程中，我上网查阅了大量的MATLAB语音仿真的相关资料，参考了很多仿真源程序，最终结合自己所学的知识完成了指定程序的设计。

总的来说，整个“语音信号处理”课程学习过后，我在语音信号处理方面学到了不少知识，在这次考核过程中将所学的内容投入了应用，从中收获颇多。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 武汉科技大学语音信号处理课程设计报告

冰点文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：武汉科技大学语音信号处理课程设计报告.docx
链接地址：https://www.bingdoc.com/p-17864579.html

武汉科技大学语音信号处理课程设计报告.docx

热门标签