基于定点DSP的实时语音命令识别模块 - 源码 - 源码 - 免费下载

基于定点DSP的实时语音命令识别模块

文件大小： 131k

源码售价： 10 个金币积分规则积分充值

资源说明：本系统的目的是在廉价定点数字信号处理器（DSP）芯片上实现语音识别。在微机平台，一般采用隐含Markov模型（HMM）进行语音识别，该算法在识别阶段计算量较少，适应性强，但是需要大量的前期训练工作。由于DSP系统存储资源有限，计算速度也比较慢，大运算量的前期训练是无法在有限的DSP资源上独立完成的，因此系统采用了动态时间弯折算法（DTW），以解决模板匹配中时间不定长的问题。本文主要探讨的是如何在定点数字信号处理器（DSP）上实现实时语音命令识别系统，特别是基于廉价的定点DSP芯片ADSP2181。系统设计的关键在于处理资源有限且计算速度较慢的情况，因此选择了动态时间弯折算法（DTW）替代通常在微机平台使用的隐含马尔可夫模型（HMM）。 HMM是语音识别领域常用的算法，它在识别阶段计算量小，适应性强，但需要大量的预训练工作。由于DSP的存储资源和计算能力限制，HMM的前期训练无法在DSP上直接完成。相比之下，DTW算法能够解决模板匹配中的时间不定长问题，更适合在资源有限的环境中应用。系统硬件部分主要由ADSP2181 DSP芯片、AD73311编码解码器、27C512程序存储器和AT29C020模板及语音存储器组成。ADSP2181是核心组件，具备较高的指令执行效率。AD73311作为模拟前端，提供高质量的模数/数模转换，并通过串行口与DSP连接。27C512用于存储程序，AT29C020则用于存储语音模板和实际语音数据。系统还包含必要的复位、电源监控和输出电路，形成一个基础的语音识别模块，可以通过扩展接口增加键盘、LCD显示等功能，构建完整的控制器。在软件层面，系统首先进行语音信号的端点检测，通过短时能量和过零率来确定语音的开始和结束，以过滤噪声。接着，语音信号经过抗混迭滤波器、采样和量化，提取特征参数。考虑到实时性和计算效率，系统选择线性预测倒谱系数（LPCC）和Mel频率倒谱系数（MFCC）作为识别参数，其中LPCC因其计算快速和精度可控而被优先选用。在ADSP2181上实现的定点算法使得LPCC可以在720μs内计算完成，满足实时性要求。此外，系统还实现了语音的编码与回放，采用ADPCM和GSM编码算法以降低存储需求和码率，同时保持音质清晰。总结来说，该系统通过优化算法和硬件设计，成功在定点DSP上实现了实时语音命令识别，克服了资源限制，提高了识别效率，降低了系统成本。这在嵌入式应用和低功耗设备中具有重要的实用价值。

部分文件列表（点击文件名可查看文件内容）

					
									本源码包内暂不包含可直接显示的源代码文件，请下载源码包。