-
-
基于语音静音段特征的手机来源识别方法
... 99.23%和99.00%。另外,与语音段MFC特征和梅尔倒谱系数(MFCC)特征进行了对比,实验结果证明所提特征具有更加优越的性能。
-
-
Python提取频域特征知识点浅析
... 系统中,人们都会用到频域特征。梅尔频率倒谱系数(MFCC),首先计算信号的功率谱,然后用滤波器和离散余弦变换的变换来提取特征。本文重点介绍如何提取MFCC特征。
首先创建有一个Python文件,并导入库文件: from scipy.io import wavfile from python_speech_features import mfcc, logfbank import matplotlib.pylab as plt1、首先创建有一个Python文件,并导入库 ...
-
基于FPGA的关键词识别系统实现(一)
摘要:随着微电子技术的高速发展,基于片上系统SOC 的关键词识别系统的研究已成为当前语音处理领域的研究热点和难点.运用Xilinx 公司ViterxII Pro 开发板作为硬件平台,结合ISE10.1 集成开发环境,完成了语音帧输出.MFCC.VQ和HMM等子模块的设计;提出了一种语音帧压缩模块架构,有效实现了语音帧信息到VQ 标号序列的压缩,实现了由语音帧压缩模块和HMM模块构建的FPGA关键词识别系统.仿真实验结果表明,该 ...
-
基于FPGA的关键词识别系统实现(二)
... VQ 编号.因此本文提出了帧压缩模块的架构,该模块主要包括帧输出模块.MFCC 特征参数提取模块.VQ 矢量量化模块,以及计数器.接口逻辑等逻辑电路.
...
-
用于腹腔镜扶持器控制的特定人语音识别算法
提出了一种基于融合i-vector特征的长短时记忆(LSTM)循环神经网络模型,用于腹腔镜扶持器语音控制,在小训练样本下实现对特定医生语音中的短时、孤立词指令的识别。该模型以LSTM循环神经网络作为基础模型,以梅尔频率倒谱系数(MFCC)作为输入特征参数,将i-vector特征作为LSTM循环神经网络的深层输入信息,与神经网络中LSTM层后的深层特征信息进行拼接,达到参数融合的目的,实现对特定主刀医生语音指令的准确识别以及对非主刀医生语音指令的拒识别,为腹腔镜操作提供安全智能 ...
-
基于MatlabGUI的语音感知照明系统仿真设计
Matlab拥有丰富的工具箱以及内置函数,本文在简要介绍语音识别的基础上,介绍了一种基于Matlab GUI语音感知的照明控制系统设计思想,同时给出实现方法,达到了人与计算机零距离交流的目的。主要功能有语音信号的特征提取、训练、识别与功能指示等。端点检测依靠能量与过零率的双门限检测法,可以减少数据量与处理时间;特征提取采用Mel频率倒谱系数(MFCC),识别采用改进的DTW模板匹配,提高了识别效率。本文设计的控制系统能成功实现语音识别,并根据语音内容执行命令,同时显示识别结果,精准实时控制模拟家居照明。
-
基于听觉特性的声纹识别系统的研究
声纹识别技术,形象的说法就是说话人识别技术。它是根据人在说话时产生的波形,以及波形中反映人类心理和生理的特征参数来判断说话人的身份的技术。本文所研究的是与文本有关的说话人确认系统。比较了基于声道的线性预测倒谱系数(LPCC)和基于听觉特性的MEL频率倒谱系数(MFCC)参数特征,得出MFCC对环境存在更高的鲁棒性。并运用了隐形马尔可夫模型(HMM)在MATLAB上实现了语音数字的识别仿真。本实验系统的识别率达到了90%,验证了HMM模型识别的准确性。
-
一种改进的特定人语音识别系统及算法研究
针对传统特定人语音识别过程中存在的算法复杂、所占存储空间大等问题,提出了一种改进的基于动态时间规整算法(DTW)的特定人语音识别系统。在对参数提取方法进行详细对比之后,提取美尔频率倒谱系数(MFCC)作为本系统的语音识别参数,有效的解决了人耳响应不同信号灵敏度不同的问题。利用MATLAB环境下语音工具箱Voice Box实现了对若干数字的孤立词识别,识别速度提高了约30%,识别成功率达到95%以上。仿真结果证明,该系统在算法简单,识别成功率高,是一种简单有效的语音识别方法。
-
一种用于枪声的多级检测识别技术
声音无处不在,声音的检测与识别一直是声音研究领域的重要内容。其中公共场所环境中的突发声音的检测一直是一个难题,本文提出了一种利用短时能量和短时平均过量率以及MFCC和DTW对枪声等特定声音的多级检测算法。实验结果表明,本算法具有较低的计算复杂度,易于实现,而且检测的漏检率和误检率都很理想。
-