
正在准备做STM32软件TTS语音合成的实现方法研究,请有经验的大侠谈下思路,感兴趣的一起探讨下。0 \* L) I4 ]; w" H! ?; N 目前基本思路: 1、基于完整的汉字语音库含特殊字符,WAV格式,大概30MB左右。 问题是采用无声调的库,还是阴平(ˉ)、阳平(ˊ)、上声(ˇ)、去声(ˋ)四个声调的库?容量不同,处理方式不同,分析声调的算法是个大问题。 2、GB2312标准汉字编码字符库,这个没难度。 3、基于GB2312的汉字读音表拼音查询,根据汉字编码到这个表里去查找对应的拼音。/ s0 R$ h P% k) s8 } 问题是文本到拼音的查找算法,怎样的算法会让效率和资源占用达到最优状态,需要进一步研究。9 q- k4 l! I, n$ h 4、从文字找到拼音了,简单的做法就是把一句话的所有拼音从WAV文件中找到然后拼接播放,或者直接挨个播放每个字符的WAV文件。 具体实现方法要等调试的时候看效果。 总结如果不分析声调,只机械的拼接语音字符还是比较容易实现的,具体到声调和语境感觉就复杂了,有待进一步具体研究。: x4 E3 |5 ]6 \ D+ `3 a 以上共商 7 ^+ w4 V' _& r/ @! T 另外说一下,搜遍网络目前还没有找到STM32软件做TTS的具体案例。 |