-
-
python实现说话人识别实验与开发
... for test
audio_record.py
record audio from micro phone
count_days.py
count days between two date. 20110805 20160903
mfcc_feature.py
extract mfcc feature from wav files
SGD.model*
the trained model on train set , and the accurate is 70%
util.py
...
-
sidekit使用说明.rar
SIDEKIT旨在提供执行说话人识别所需的整个工具链。
可用的主要工具包括:声学特征提取(LPCC、MFCC、VAD、CMS、CMVN),模型(GMM、PLDA)等的使用参数
-
read_wav.rar
C++读取WAV音频文件音频数据,网上很难找到开源的C或C++的读WAV音频文件的源码,特别是还带将频音数据规范化的函数的源码,此代码是绘音频波形图、MFCC、哼唱识别的基础。
-
-
基于PAD模型的级联分类情感语音识别
针对声学特征(韵律特征和MFCC特征)对情感语音的分类识别性能不理想的问题,提出了一种将声学特征与情感语音PAD数据相结合的级联分类方法用于情感语音识别。首先提取情感语音的声学特征,对特征分别单独识别与组合识别,对比建立最优特征集合。然后将声学特征组合与情感语音PAD数据相结合,分两步逐级地判断出输入语音所属的情感类型。该方法在TYUT2.0情感语音数据库上得到了较好的结果,情感分类识别率相较于传统声学特征的分类识别率提高了15.4%.
-
abstract_Gemmeke.pdf
... 识别方面,本文采用了基于隐马尔可夫模型(HMM)的识别方法,采用鲁棒性较好的 Mel 频率倒谱系数(MFCC)作为特征参数。我们通过维特比算法(Viterbi)对其进行解码,来找出最有可能产生这个输出状态的序列。
-
FPGA-bluetooth-car-master.zip
设计了一个小车自动行驶控制系统.该系统以一个基于流水线结构CORDIC算法设计的双核FFT处理器为基础,实现语音信号的频谱分析,并通过提取MFCC语音特征,与模板库中数据指令进行对比,进而产生控制信号,最终由FPGA控制的无线通讯模块来实现对小车常用基本操作的语音控制.系统在DE2实验开发平台上进行下载测试,结果表明该系统可实时地完成对语音指令的响应,同时系统具有硬件结构简单、实时性好、可靠性高等特点,可广泛应用于语音识别控制领域.
-
语音信号处理与提取.zip
本论文中把语音进行数字化。在对其进行传输、存储和识别。本论文中按照预处理、特征提取、训练和识别等四个方面的方法来对语音信号进行重点处理。而这其中预处理与特征提取是最为重要的。为了完成以上处理,本人运用了MATLAB R2014a开发工具以及GUI用户界面开发和数据计算能力。使用VQ模型作为训练辩别的方法,利用MFCC提取特征,使用k-means算法建立码库,最后完成说话人识别小型的系统。
-
-
论文研究 - 基于MFCC和HMM的阿拉伯语语音识别系统
语音识别使机器可以通过识别和理解过程将语音信号转换为文本。 提取特征,预测最大可能性并生成输入语音信号的模型被认为是配置自动语音识别系统(ASR)的最重要步骤。 本文利用MATLAB建立了一个自动阿拉伯语语音识别系统,并从19位阿拉伯语母语使用者中记录了24个阿拉伯语单词Consonant-Vowel Consonant-Vowel Consonant-Vowel(CVCVCV),每个说话者说出同一单词3次(共1368个单词) )。 为了测试该系统,通过将语音信号划分为约0.25秒的帧和0.10秒的偏移 ...
-