使计算机、带有人机交互的电器、仪表等能像人一样开口“说话”是科技工作者多年的研究目标。语言是人与人交流信息的一种手段,文语转换TTS(Text To Speech)是自动将输入文字转换成语音输出,并尽量使输出的语音效率流畅、自然的一类技术。
TTS系统主要需解决两个问题:
①文本分析,即语言学分析。该任务是将以文本广度输入的字符串转换成语言学的表述;
②语音合成。即根据语言学的内在表述信息合成语音。
TTS系统中的语音合成方法分为时域和频域两大类:频域方法主要有LPC参数合成及其振峰合成两种,其实质是在工程上实现语音生成模型,进而在终端特性上模拟发音器官。在目前阶段,频域方法形成的发音尚不自然,且需要的计算量很大,不适宜在低端的嵌入式芯片上使用。波形编辑法是将较短的数字音频段(即合成基元)拼接并进行段音平滑后生成连续语流的方法。这种方法占用的存储空间大,但计算量小、计算速度快,而且合成语音自然度较高,显然比较适合于芯片性能较弱的嵌入式系统方面的应用。
采用波形编辑法的嵌入式TTS系统由于成本低、性能完善、自然度高,随着波形修改算法的不断提出以及微处理器和非易失性存储介质功能的不断增强,正日益受到人们的关注。本系统即采用时域波形编辑技术,采集GB2312汉字编码字符集中所有字符发音作为原始材料,通过使用改进的游程编码算法压缩生成可适用于当前FLASH存储器的语音库,并采用多重查找表设计及预存储命令字技术有效地加快语音库的寻址速度,在基于Atmel公司的AT89S52单片机上成功实现了一个TTS语音系统,经测试取得了令人满意的效果。该系统应用简便,具有很小的尺寸和很低的功耗及通用的串行接口,可以广泛用于有关的汉语语音应用系统中。
来源:维库开发网