STM32软件语音合成的实现方法研究

[复制链接]

sealevel 发布时间：2021-2-8 16:47

技术帖
文章封面:	-
文章简介:	-

正在准备做STM32软件TTS语音合成的实现方法研究，请有经验的大侠谈下思路，感兴趣的一起探讨下。
目前基本思路：
1、基于完整的汉字语音库含特殊字符，WAV格式，大概30MB左右。
   问题是采用无声调的库，还是阴平（ˉ）、阳平（ˊ）、上声（ˇ）、去声（ˋ）四个声调的库？容量不同，处理方式不同，分析声调的算法是个大问题。
2、GB2312标准汉字编码字符库，这个没难度。
3、基于GB2312的汉字读音表拼音查询，根据汉字编码到这个表里去查找对应的拼音。
   问题是文本到拼音的查找算法，怎样的算法会让效率和资源占用达到最优状态，需要进一步研究。
4、从文字找到拼音了，简单的做法就是把一句话的所有拼音从WAV文件中找到然后拼接播放，或者直接挨个播放每个字符的WAV文件。
   具体实现方法要等调试的时候看效果。
总结如果不分析声调，只机械的拼接语音字符还是比较容易实现的，具体到声调和语境感觉就复杂了，有待进一步具体研究。
以上共商

另外说一下，搜遍网络目前还没有找到STM32软件做TTS的具体案例。