19点低通滤波器器语音帧长为180点=22.5ms@8khz怎么算的

定点数与浮点数_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
定点数与浮点数
上传于||文档简介
&&D​S​P​的​定​点​数​与​浮​点​数
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
下载文档到电脑,查找使用更方便
还剩13页未读,继续阅读
你可能喜欢DSP的Q定标_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
DSP的Q定标
上传于||文档简介
&&在​定​点​D​S​P​芯​片​中​,​采​用​定​点​数​进​行​数​值​运​算​,​其​操​作​数​一​般​采​用​整​型​数​来​
​
​表​示​。​这​其​中​的​关​键​就​是​由​程​序​员​来​确​定​一​个​数​的​小​数​点​处​于6​位​中​
​
​的​哪​一​位​。​这​就​是​数​的​定​标​。
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
下载文档到电脑,查找使用更方便
还剩7页未读,继续阅读
你可能喜欢君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
语音信号处理
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口语音特征参数MFCC计算的详细过程
一、MFCC计算总体流程1.信号的预处理,包括预加重(Preemphasis),分帧(Frame Blocking),加窗(Windowing)。假设语音信号的采样频率fs=8KHz.由于语音信号在10-30m
一、MFCC计算总体流程
1.信号的预处理,包括预加重(Preemphasis),分帧(Frame Blocking),,加窗(Windowing)。假设语音信号的采样频率fs=8KHz.由于语音信号在10-30ms认为是稳定的,则可设置帧长为80~240点。帧移可以设置为帧长的1/2.
2.对每一帧进行FFT变换,求频谱,进而求得幅度谱。
3.对幅度谱加Mel滤波器组(Mel滤波器组设计问题)。
4.对所有的滤波器输出做对数运算(Logarlithm),再进一步做离散余弦变换DCT可得MFCC。
流程图如下所示:
二、实际频率与Mel频率的转换
Mel频率与实际频率的具体关系如下:
人耳的听觉特性与Mel频率的增长一致。与实际频率在1000Hz以下呈现线性分布,1000Hz以上呈现对数增长。
设计的过程如下:
假设语音信号的采样频率,帧长N=256,滤波器个数K=22
由此可得语音信号的最大频率为:
根据下面的公式:
可以求得出最大的Mel频率为:
由于在Mel刻度范围内,各个三角滤波器的中心频率是相等间隔的线性分布。由此,可以计算两个相邻三角滤波器的中心频率的间距为:
因此,各三角形滤波器在mel刻度上的中心频率可以表示为:
由上面的中心频率可以计算出对应的线性刻度上的频率。如下图所示:
下面采用Matlab设计Mel三角形滤波器如下:
//获取Mel三角滤波器的参数
fs为采样频率,filterNum为三角滤波器的个数
maxMelFreq = freq2mel(fs/2); %将线性频率转化为mel频率,得到最大的Mel频率
sideWidth=maxMelFreq/(filterNum+1);%求频带宽带,即Mel滤波器宽度
index=0:filterNum-1;%滤波器的中心
filterBankPrm=floor(mel2freq([index+1;index+2]*sideWidth)/fs*frameSize)+1;
filterBankPrm(end, end)= frameSize/2;
得到如下的三角形滤波器,横坐标对应于FFT中的点的下标:
注:这里选择的帧长为256点,然后FFT的点数也为256,由于是对称的,所以只取前面一半的点计算频谱。然后加入到三角滤波器中。
每一个三角形滤波器的中心频率c(l) 在Mel频率轴上等间隔分布。设o(l),c(l),h(l) 分别是第l 个三角形滤波器的下限,中心,和上限频率,则相邻三角形滤波器之间的下限,中心,上限频率的关系如下:c(l)=h(l-1)=o(l+1)
根据语音信号幅度谱求每个三角形滤波器的输出。
对所有的滤波器输出做对数运算,再进一步做离散余弦变换(DCT)即可得到MFCC。
由上公式可知,MFCC特征参数的长度与滤波器的个数无关。只与DCT有关。
% === 对幅度谱进行三角滤波过程
function tbfCoef = triBandFilter(fftMag, P, filterBankParam)
fstart=filterBankParam(1,:); %fftMag一帧数据的幅度谱
fcenter=filterBankParam(2,:);%滤波器的中心点,每列代表一个滤波器的中心频率
fstop=filterBankParam(3,:);
% Triangular bandpass filter.
for i=1:P %滤波器个数
for j = fstart(i):fcenter(i), %第i个滤波器起始频谱点和中心频谱点的输出
filtmag(j) = (j-fstart(i))/(fcenter(i)-fstart(i));
for j = fcenter(i)+1:fstop(i),
filtmag(j) = 1-(j-fcenter(i))/(fstop(i)-fcenter(i));
tbfCoef(i) = sum(fftMag(fstart(i):fstop(i)).*filtmag(fstart(i):fstop(i))'); %第i个滤波器的输出
tbfCoef=log(eps+tbfCoef.^2); %求得每个滤波器的对数输出,有多少个滤波器就有多少个输出,对应为每一帧
你最喜欢的语音信号800hz 19点fir低通滤波c语言?
例3.7 语音信号800Hz 19点FIR低通滤波C语言浮点程序#include &stdio.h&const int length = 180     /*语音帧长为180点=22.5ms@8kHz采样*/void filter(int xin[ ],int xout[ ],int n,float h[ ]); /*滤波子程序说明*//*19点滤波器系数*/static float h[19]={0..,-0...,-0.....257883,0....,-0.,-0....};static int x1[length+20];/*低通滤波浮点子程序*/void filter(int xin[ ],int xout[ ],int n,float h[ ]){int i,j;for(i=0;i&i++) x1[n+i-1]=for (i=0;i&i++){sum=0.0;for(j=0;j&n;j++) sum+=h[j]*x1[i-j+n-1];xout=(int)}for(i=0;i&(n-1);i++) x1[n-i-2]=xin[length-1-i];}/*主程序*/void main( ){FILE   *fp1,*fp2;int   frame,indata[length],outdata[length];fp1=fopen(insp.dat,&rb&);         /*输入语音文件*/fp2=fopen(outsp.dat,&wb&);         /*滤波后语音文件*/frame=0;while(feof(fp1)==0){frame++;printf(&frame=%d\n&,frame);for(i=0;i&i++) indata=getw(fp1);     /*取一帧语音数据*/filter(indata,outdata,19,h);         /*调用低通滤波子程序*/for(i=0;i&i++) putw(outdata,fp2);     /*将滤波后的样值写入文件*/}fcloseall( );             /*关闭文件*/return(0);}其中static float h[19]={0..,-0...,-0.....257883,0....,-0.,-0....};系数如何求出
10-01-03 &匿名提问
语音识别技术的前景和应用    在电话与通信系统中,智能语音接口正在把电话机从一个单纯的服务工具变成为一个服务的“提供者”和生活“伙伴”;使用电话与通信网络,人们可以通过语音命令方便地从远端的数据库系统中查询与提取有关的信息;随着计算机的小型化,键盘已经成为移动平台的一个很大障碍,想象一下如果手机仅仅只有一个手表那么大,再用键盘进行拨号操作已经是不可能的。语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作。语音技术的应用已经成为一个具有竞争性的新兴高技术产业。    语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%,对特定人语音识别系统的识别精度就更高。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。调查统计表明多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。    可以预测在近五到十年内,语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。人们也将调整自己的说话方式以适应各种各样的识别系统。在短期内还不可能造出具有和人相比拟的语音识别系统,要建成这样一个系统仍然是人类面临的一个大的挑战,我们只能一步步朝着改进语音识别系统的方向一步步地前进。至于什么时候可以建立一个像人一样完善的语音识别系统则是很难预测的。就像在60年代,谁又能预测今天超大规模集成电路技术会对我们的社会产生这么大的影响。通过打电话进入银行系统的。记者看到,如果线路通畅、发音清晰,那么利用这种方法来识别用户的身份,其准确性可以达到100%。“当然,即便仅仅是在技术上让任何一种识别方法做到完美无暇,都是非常困难的,但是,如果两种识别方法配合使用,如声音识别与密码配合使用,那么其可靠性将会大大提高。”   除了上述声音口令技术被银行等金融系统用于识别用户身份外,PERSAY于2002年开发出了识别通话者身份的自由通话技术——FreeSpeech。该技术产品通过生物语音识别技术,可以向有关部门提供电话另一端说话者的准确身份,确保通话的有效性,为通话双方提供便利。阿莱-雷兹告诉记者,FreeSpeech的用途非常广泛,比如,当通话人需要向政府有关部门汇报情况和了解信息,用户需要在服务商那里更改个人资料(信用卡号、服务期限等)和更新合同等等,首先需要确认的是通话人的身份,如果通话人的身份不能得到确认,那么,就无法使用电话这种便捷的方法去解决问题。   FreeSpeech具有的技术特点包括,不受语言和口音差异限制,准确性高,具有干线与支线同等的音频获取能力,提供网络服务APIs,与CTI和CRM应用兼容,提供网络管理服务等。   2004年,PERSAY又为情报和执法部门研制出了一种可以根据电话,来追踪通话人的技术产品———S.P.I.D(说话者身份)。这一技术利用有线和无线通讯网络,可以使政府执法部门从成千上万的通话者中,鉴别出正在追踪目标的通话声音,从而找到追踪目标。该技术在2005年通过了美国国家标准和技术研究所的鉴定,被认为是一种不受通话内容限制、准确率高的通话人身份识别技术。 语音识别的应用——目前世界各国都加快了语音识别应用系统的研究开发,并已有一些实用的语音识别系统投入商业运营。在美国语音识别系统的销售额逐年上升,由于使用了语音识别系统,为企业赢得了巨额收入。——比较典型而成功的语音识别系统有AT&T于1992年开发的VRCP系统。该系统是有五个单词(collect,person,third number,operator和calling card)的非特定人小词汇量语音识别系统,现已应用于AT&T通信网上,可以实现自动话务员协助式呼叫,代替话务员完成五种呼叫类型,即——●collect call——受话人付费电话,命令字col1ect——●person-person-call——定人呼叫,命令字person——●third-party-billing-call——第三方付费电话,命令字third number——●operator-assisted call——话务员协助呼叫,命令字operator——●credit card call——信用卡呼叫,命令字calling card——为使用户使用方便,系统配有语音提示告诉用户如何使用。该系统所具有的关键词检测技术可从句子中查找到五个命令字中的一个,从而使用户在讲话时更加自然,如可以讲“collect call please”,整个系统的正确识别率超过99%。——此外,已经实用的系统还有AT & T 800语音识别服务系统,NTT ANSER语音识别银行服务系统,Northen Telecom股票价格行情系统,使得原本手工操作的工作用语音就可方便地完成。——从语音识别技术的发展可以看出,科学技术推动了社会发展,满足人们的需求,社会需求也反过来推动科学技术发展。多媒体时代的来临,迫切要求解决自动语音识别的难题,必然推动语音识别理论和应用研究的进展。估计在本世纪最后几年至二十一世纪初,语音识别技术将会在理论上和应用上都取得突破性进展。到那时,我们将体会到语音识别带来的种种便利。
请登录后再发表评论!

我要回帖

更多关于 mp3 8khz 下载 的文章

 

随机推荐