你的浏览器版本过低,可能导致网站不能正常访问!
为了你能正常使用网站功能,请使用这些浏览器。

使用PWM实现语音播放

[复制链接]
y369369 发布时间:2021-4-23 16:16
使用PWM实现语音播放
事实上大部分MCU都可以实现语音播放

# v  A$ j# n! Y
下面是一段音频数据的波形
5 i4 a; f. u3 {- T* ~3 l1 R. A  D6 ^
1.1.png
  b% P' o0 y. {3 P/ b5 G
局部放大图:
& I  F, n8 G$ {% l6 i4 _, f+ _# G
1.2.png
& V7 {5 K1 ~4 n6 f8 f
以一定的速度采样(ADC)这些波形进行存储,就是音频数据了,所以播放就是按原来采样的速率再用DAC输出对应的数据即可。

3 y  q7 T4 \) ?9 a. e! h
这里的音频有两个主要的参数,采样速率和采样位数。

) Q$ x- z# q3 P: ?. K! `7 `* _
采样速率:指1s中采样多少个数据点,比如1s种采集16000个点,那么采样率就是16KHz。采样速率越高,越能抓到频率较高的声音,比如CD的采样率就是44.1KHz,确保人耳能听到的声音都会被抓到。
$ P8 K  a; S2 {1 ?' R& x: X: Y( B$ x* M
采样位数:指音频幅度最大值与最小值分为了多少阶,比如满幅度是3.3V,如果是8Bit位数,那么每一阶就是3.3V/256 = 12.89mv,采样位数越高,声音细节越好。所以采样速率和位数越高,声音还原越逼真,但存储的数据量也越大,一首三四分钟的歌曲,如果不采用编码按原始波形数据存储,数据量有好几十兆大小,这涉及到音频编码的问题,这里不展开讲了,有兴趣的同学可以找相关资料。

+ i' ]- z3 ]% z- _( ^
接下来看怎么播放,最简单的当然是把采样(ADC)的数据按原样输出(DAC)了。但我们有些芯片本身不带有DAC,所以只能用PWM代替DAC,PWM即脉冲宽度调制。这里只需要把DAC的幅度值转换成PWM的占空比即可,例如16KHz 8Bit的声音转换成16Khz 256阶占空比的PWM。但有一个问题,如果用16KHz的PWM播放语音,声音是可以播放,但有一个16Khz的谐波存在,这个声音会被人耳听到,所以需要更高频率的PWM,数据还是按照16Khz更新。
( e& b7 M8 d$ a
我这里使用32KHz的PWM,用16KHz 8Bit PCM格式的音频数据,8Bit的数据对应一个Byte,16KHz采样,1秒种占用存储空间就是16K Byte,F429有2MByte的Flash存储空间,理论上可以存储2048K/16K= 128秒的音频。
. \, |* X' y0 e' J9 t2 C
下面是用NucleoF429实现音频播放的具体过程:
6 J& l/ S5 R6 u  x6 H- c) w
一、配置PWM

, F! N; S0 O/ L" O5 {
1、用STM32CubeMx建立工程,配置两个定时器TIM1和TIM2,TIM用于PWM产生,TIM2用于16KHz数据更新。
: C; D* z1 O% x8 p3 g# W
1.3.png
& S8 V& T, L: }: O! ^& E
TIM1选择PWM互补输出(单通道也可以),将PE8和PE9复用为PWMN和PWMP。

) Z% y5 ~* C' T8 [- O( e) K
TIM1在APB2总线上,TIM2在APB1总线上

9 q0 z) P0 G( J! C0 f+ M: h2 t; _
1.4.png

' U) b1 W( Z) _# X9 R
所以TIM1和TIM2的时钟频率分别为180M和90M,系统时钟用HSE输入的8MHz。
3 v5 U) s( d  g2 W! L+ l$ z1 L. f4 {
1.5.png
' Z+ j1 M1 K- G. P
将TIM1设置为32KHz,即31.25us。8Bit占空比,一个LSB为31.25us / 256 = 0.1220703125us = 8.192MHz,TIM1180M / 8.192M = 21.97265625,这里取整数22。所以实际的PWM频率为1/(180 / 22) *256 =  31.289us = 31.96KHz

* |$ X5 p& |- P
1.6.png
3 [& E( D( H8 q+ O& p* ^3 F
TIM2 为90MHz,45分频后为2MHz即0.5us,周期125即62.5us = 16KHz。

- R2 v1 v5 k3 r' k" d4 s0 i: L. t
1.7.png
' O4 d$ a& f9 q( N; n
NVIC开启TIM2中断。生成工程名和目录后生成Keil工程。
" K, z: C6 o& [4 Q; x* D* U$ G5 D
二、播放语音
1、先编译后,编写TIM中断服务程序。
1.8.png

, P! }! n* q6 J% q9 h5 Z
完成后,开启TIM2中断和PWM,(PWM是互补输出,需要单独开启各个通道)
7 W5 u/ N* Y$ ]8 S
1.9.png

- x9 c6 k. I' \' r) x( E
用逻辑分析仪测量输出波形。
7 y8 Q( I7 g/ C  Y+ s# ?  s5 t7 ~
1.10.png

" j% V$ j. w, _# r8 s3 ?' z+ g# F; ?
如图所示,TIM1 PWM为31.96KHz,TIM2为62.5us即16KHz,结果正确。
2 ]7 @* H5 h: p
接下来处理音频:
这里使用的音频是PCM格式,是未进行压缩编码的原始数据,可以直接给PWM输出。

2 j% M5 C4 \+ O: L& L9 N
音频处理的软件有许多,只要能把格式转为PCM即可,下面是我用Cool Edit这款软件做的音频格式转换。
) v) r8 S9 E' r. C  T! m
选择菜单 文件-->批量转换

! Z/ ?$ N2 [% t* J, N
1.11.png

5 E/ ]6 ~* G7 }' p5 [3 n
选择新的采样率和采样位数。
: d* W9 q8 o) l
1.12.png
, B/ r, G1 `9 S5 D
选择PCM格式。设置输出目录后运行批处理完成转换。
( D- }' F6 z4 h1 {) l& L" a
1.13.png

8 d/ Q' B$ v) [; S* x$ w
完成后的音频文件用WinHeX这个软件打开。

! [* d6 T7 n- L' O; N' Z, O
1.14.png

! Q" n3 B& g2 X$ O" E/ i
图中红框中的44个Byte为PCM格式的文件头信息,后面的的数据为音频数据,数据全选后利用WinHex的可选格式复制
$ C5 g% ~7 t5 K' E
1.15.png
: [( x& B; w/ }
将数据以C数组的形式导出,在工程目录下新建.h文件,将复制的文件粘帖到.H文件并在工程中Include进来,定义起始和结束地址,数组的大小即为文件结束地址,数组用const修饰,可以将数据存储到Flash中。
6 ^0 u- K+ f1 y2 Z* ]) W. }
1.16.png
  R" g" _- O  I- b1 W
在TIM2中,以16KHz的速度更新PWM数据即可实现音频播放。
3 N0 A; g! f$ z' O7 E
1.17.png

1 i6 _( U* ^. N2 W
编译工程,下载到NucleoF429板子上,在PE8或PE9上接一个喇叭即可听到声音。

$ P/ j% d+ e; u, l% |: Z# N0 q1 Q" C
以上用的音频采样是16K 8Bit,要想提高音质,提高采样和Bit数即可,音量可以用外接三极管或功放放大,音频数据也可以用ADC采集后存储到SPI Flash后播放,实现录音回放。
. F% j1 l7 W" t; A
为了方便阅读,附件中包含了此文的PDF文档,Source Code也在附件中,可以直接下载到Nucleo运行。

, D, b9 F% l+ x: h( q. m$ F
文章出处: ARM中文社区
" R9 X( M+ r6 G* Q# O1 a
收藏 评论0 发布时间:2021-4-23 16:16

举报

0个回答

所属标签

相似分享

关于意法半导体
我们是谁
投资者关系
意法半导体可持续发展举措
创新与技术
招聘信息
联系我们
联系ST分支机构
寻找销售人员和分销渠道
社区
媒体中心
活动与培训
隐私策略
隐私策略
Cookies管理
行使您的权利
关注我们
st-img 微信公众号
st-img 手机版