Go To English Version 超过100万源码资源,1000万源码文件免费下载
  • 基于听觉模型的说话人语音特征提取 基于听觉模型的特性,仿照MFCC参数提取过程,提出了一种基于Gammatone滤波器组的说话人语音特征提取方法。该方法用Gammatone滤波器组代替三角滤波器组求得倒谱系数,并且可以调整Gammatone滤波器组的通道数和带宽。将该方法所求得的特征在高斯混合模型识别系统中进行仿真实验,实验结果表明,该特征在一定情况下优于MFCC特征在系统的识别率,同时在Gammatone滤波器组通道数较高或滤波器带宽较小的情况下,系统具有较高的识别率。
  • 基于FPGA的关键词识别系统实现(一) 摘要:随着微电子技术的高速发展,基于片上系统SOC 的关键词识别系统的研究已成为当前语音处理领域的研究热点和难点.运用Xilinx 公司ViterxII Pro 开发板作为硬件平台,结合ISE10.1 集成开发环境,完成了语音帧输出.MFCC.VQ和HMM等子模块的设计;提出了一种语音帧压缩模块架构,有效实现了语音帧信息到VQ 标号序列的压缩,实现了由语音帧压缩模块和HMM模块构建的FPGA关键词识别系统.仿真实验结果表明,该 ...
  • 基于FPGA的关键词识别系统实现(二) ... VQ 编号.因此本文提出了帧压缩模块的架构,该模块主要包括帧输出模块.MFCC 特征参数提取模块.VQ 矢量量化模块,以及计数器.接口逻辑等逻辑电路.    ...
  • 语音识别中DTW改进算法的研究 动态时间规整DTW是语音识别中的一种经典算法。对此算法提出了一种改进的端点检测算法,特征提取采用了Mel频率倒谱系数MFCC,并采用计算量相对较小的改进的动态时间规整算法实现语音参数模板匹配,能够实现孤立词、特定人、小词汇量的语音识别,并用Matlab进行了算法仿真。试验结果表明,改进后的算法能够有效地提高系统对语音的识别率。
  • 基于DTW的0-9语音识别 语音识别,先进行端点检测,采用双门限法,然后提取MFCC特征,再利用DTW算法,实现孤立词数字0-9的识别
  • matlab说话人识别 用 matlab开发的说话人识别算法。用到了GMM,DTW等分类算法,还用到了MFCC特征抽取算法等
  • 语音识别算法原理文档整理-x_语音识别用到的算法 语音算法原理介绍 MFCC提取过程 声音是模拟信号声音的时域波形只代表声压随时间变化的关系不能很好的代表声音的特征因此必须将声音波形转换为声学特征向量目前有许多声音特征提取方法如梅尔频率倒谱系数MFCC线性预测倒谱系数LPCC多媒体内容描述接口MPEG7等其中MFCC是基于倒谱的更符合人的听觉原理因而是最普遍最有效的声音特征提取算法在提取MFCC前需要对声音做前期处理包括模数转换预加重和加窗 模数
  • 语音识别算法的现状教学文案.ppt 语音识别算法的现状;混沌神经网络 小波混沌神经网络 神经网络和遗传算法 动态优化神经网络 K均值和神经网络集成 HMM与自组织神经网络的结合 正交基函数对向传播过程神经网络 HMM和新型前馈型神经网络 ;特征空间随机映射 SVM多类分类算法 特征参数归一化 多频带谱减法 独立感知理论 分段模糊聚类算法VQ-HMM 优化的竞争算法 ;双高斯GMM特征参数 MFCC和GMM MFCCs和PNN SBC
  • 采用LSTM方法进行语音情感分析-代码详解 目录 摘要: 数据集描述: 模型构建 结果分析 结束 相关链接: 摘要: 语音情感分析就是将音频数据通过MFCC(中文名是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients))加载为特征向量形式,然后将其输入进入 ...
  • 对python中Librosa的mfcc步骤详解 1.对语音数据归一化 如16000hz的数据,会将每个点/32768 2.计算窗函数:(*注意librosa中不进行预处理) 3.进行数据扩展填充,他进行的是镜像填充(”reflect”) 如原数据为 12345 -》 填充为4的,左右各填充4 即:5432123454321 即:5432-12345-4321 4.分帧 5.加窗:对每一帧进行加窗, 6.进行fft傅里叶变换 librosa中fft计算,可以使用.net中的System.Numerics MathNet.Numerics. ...