TTS所用的关键技术就是语音合成。早期的TTS一般采用专用的语音芯片实现,主要用在家用电器或儿童语音玩具中。早期的TTS语音芯片存在一些问题,例如:发音生硬,对多音字容易判读错误,导致发音错,是使用者造成误解。而现在随着科技技术的发展,深圳奥尔伟业TTS语音芯片则是采用真人发音,软件辅助修改的算法,让语言的自然度大大提高。这个是怎么做到的呢?
首先是找专业的,普通话发音标准的人进行汉字的发音采集。然后将这个语音库存入语音语音芯片。
其次芯片在根据输入的文字去自动判别语气,语调,还有多音字的识别。对源语音库的波形进行声调和幅度的调整,生成波形输出的语音芯片的语音专用DA最终推动喇叭生成声音
而基于微机应用的TTS一般用纯软件实现,主要包括以下几部分:
●文本分析-对输入文本进行语言学分析,逐句进行词汇的、语法的和语义的分析,以确定句子的低层结构和每个字的音素的组成,包括文本的断句、字词切分、多音字的处理、数字的处理、缩略语的处理等。
●语音合成-把处理好的文本所对应的单字或短语从语音合成库中提取,把语言学描述转化成言语波形。
●韵律处理-合成音质(Qualityof Synthetic Speech)是指语音合成系统所输出的语音的质量,一般从清晰度(或可懂度)、自然度和连贯性等方面进行主观评价。清晰度是正确听辨有意义词语的百分率;自然度用来评价合成语音音质是否接近人说话的声音,合成词语的语调是否自然; 连贯性用来评价合成语句是否流畅。
要合成出高质量的语音,所采用的算法是极为复杂的,因此对机器的要求也非常高。算法的复杂度决定了目前微机并发进行多通道TTS的系统容量。
深圳奥尔伟业【音乐IC供应商】www.dphero.com。