基于DSP的语音识别计算器电路设计

语音识别技术是人机最自然、最简洁的交流方式，它就是让机器能够自动识别并理解说话人要表达的意思，将语音信号转变为正确的文本或者命令的高科技技术。根据实际的应用，语音识别可以分为：特定人与非特定人的识别、孤立词与连续词的识别、中小词汇量与无限词汇量的识别。考虑到成本及使用范围因素，本文中应用的是基于tms320vc5509 dsp的非特定人、孤立词、小词汇量的语音识别系统。通过实际测试，使用该dsp的语音识别系统有着较高的实时性、识别率，基于该系统的计算器对实时数字计算有较高准确性，基本能解决特殊群体和特殊地点使用计算器困难的情况。
语音识别过程主要包括语音信号前处理、特征提取、模式匹配等部分。语音信号输入之后，预处理和数字化是进行语音识别的前提条件。特征提取是进行语音信号训练和识别必不可少的步骤，采用的是提取每帧的mel系数的倒谱参数作为语音信号的特征值。模板匹配算法目前有 dtw 算法、hmm隐马尔科夫模型、ann人工神经网络等。本文采用hmm隐马尔科夫模型的方法，提取出的特征值存入参考模式库中，用来匹配待识别语音信号的特征值。匹配计算是进行语音识别的核心部分，由待识别人的语音经过特征提取后，与系统训练时产生的模板进行匹配，在说话人辨认中，取与待识别语音相似度最大的模型所对应的语音作为识别结果。
系统硬件结构
图 2为系统硬件结构框图。此系统的核心器件是ti公司的tms320vc5509定点dsp。在本系统中，它不仅是语音识别的核心，还负责计算器的运算部分。tms320vc5509是系统的运算处理单元，具有2个乘法器（mac），4个累加器（acc）；40位、16位的算术逻辑单元（alu）各一个，这大大增强了dsp的运算能力；指令字长不只单一的16位，可扩展到最高48位，数据字长16位；可通过usb接口对tms320vc5509烧写程序而不必借助仿真器。正是基于这些优点，选择该器件可节省开发资金，减小电路板面积。dsp与tlv320aic23的接口电路如图3所示。
tlv320aic23采集语音信号电路模块
tlv320aic23是tl公司的一款低成本、低功耗的音频编解码器（codec），在本系统中负责采集语音信号。它与本系统相关的性能参数有：支持8～96 khz可调采样率；可调1～5db的完整缓存放大系统等。图4是tlv320aic23的电路图。
am29lv800b存储器又称闪存（flash），它具有在线电擦写、低功耗、大容量等特点，其存储容量为8mbit。上电后，dsp从外部flash加载并执行程序代码，使系统能够脱机运行。在本系统中，它主要用来存储程序代码、语音模型、以及压缩后的语音数据。
hy57v641620 同步动态存储器（sdram），容量为4 m×16 bit。作为ram的扩展，它大大增强了dsp的存储与运算能力。在系统初始化的时候，用来装载放在flash中的声学模型。这样在语音识别的过程中可以通过片外的sdram来访问声学模型，比直接访问flash来获取声学模型数据要快。lcd显示器用来实时显示经过语音识别后的数字、运算符号，并在得到需要显示最终结果的提示后显示答案。

谷歌调整硬件业务，Fitbit高管离任，AR团队裁员
烽火FitData大数据发展之路
物联网的发展趋势是将更多的处理能力转向网络边缘
芯片领域两大主角 FPGA和GPU
采用启扬智能IMX6UL开发板的泵站远程监控系统
基于DSP的语音识别计算器电路设计
富士通开发出可自动选择最佳通信协议技术
关于贝叶斯概念进行形式化的建模和推理
COM Express Type 7引脚排列为设计提供灵活性
OPPO无线降噪耳机印度发布售价约799元，网友心痒了！
六大数据分析小米发展和现状
镶嵌红宝石的单电相机哈苏HV套机38000元怎么样？
Snapdragon 8 Gen 4将成为高通首款3nm手机芯片
基于物联网的预测性维护如何帮助优化生产流程
冰箱封条上长霉菌之后不用愁只需这个小妙招就能解决
华为熊伟:LTE网络承担起5G时代基础网重任
四旋翼无人机的飞行原理及控制方法
MIPS 连接和嵌入式外设解决方案
如何提升板式换热器的传热效率，一些方法的介绍
苹果手表的表现亦未达预期，可穿戴智能设备“爆点”尚且遥远