语音识别芯片很多人感觉到神奇,但是有些人也感觉到没有什么。其实不然里面包含有大奥秘,因为语音识别芯片属于微计算机范畴。语音对于我们人类感觉很简单但是对于计算机来讲是相当复杂的一系列数学公式。因为我们人类从半岁开始就有人不停的在他身边讲话。时间长自然学会的过程。人类在学习语言刚开始的时候根本不理解是什么意思。例如当小孩吃的东西的时候我们大人教小孩说要吃。久而久之他就只当感觉饿的时候就说吃就可以大人就理解是什么意思。就相当于我们训练动物一样。例如我们训练一只狗跟他说趴下,然后我们就拿出食物放到地上不断的用手点拿个食物,于是狗就会趴下吃东西。其实动物根本不知道我们说的是什么只知道当我们讲出这个时候就做出相应的动作。计算机也是一样的,但是计算机是没有智商的,他的理解是全靠我们写入芯片的软件来实现。一般语音识别芯片采用两种算法一种是DTW和HMM识别模型。更高级的则是采用神经网络模型。但是这种模型复杂度高运算量大不在我们研究的范畴。其实计算机最擅长的就是做对比了。但是我们人类一般每次讲话的语调或语速都会稍微不同,不可能完全相同。但是计算机要求的是要完全相同才能对比出结果。哪该怎么办呢视乎是一个很难解决的难题。其实也不难。我们语音识别一般是通过麦克风把语音信号转换成数字信号,然后我们在把数字信号转换为频谱信号。最后按照DTW对比算法跟采集的标准库进行比较。DTW模型就是利用二维距离技术法进行对比。