你的浏览器版本过低,可能导致网站不能正常访问!
为了你能正常使用网站功能,请使用这些浏览器。

使用PWM实现语音播放

[复制链接]
y369369 发布时间:2021-4-23 16:16
使用PWM实现语音播放
事实上大部分MCU都可以实现语音播放

9 v: B' R) R( r5 P3 M3 M, J
下面是一段音频数据的波形
* a# ?$ `" z, v3 B0 V; X) q
1.1.png
: }$ O, S1 \* f# S! n! S
局部放大图:
, y/ t: M* G1 `
1.2.png

& }! P! y: k0 X6 {5 A
以一定的速度采样(ADC)这些波形进行存储,就是音频数据了,所以播放就是按原来采样的速率再用DAC输出对应的数据即可。

: S7 R; X+ c( O+ e  M
这里的音频有两个主要的参数,采样速率和采样位数。

  J( ^6 H& F* ]$ \, \9 k  k
采样速率:指1s中采样多少个数据点,比如1s种采集16000个点,那么采样率就是16KHz。采样速率越高,越能抓到频率较高的声音,比如CD的采样率就是44.1KHz,确保人耳能听到的声音都会被抓到。

! O& @- H. O8 W9 r* O1 N
采样位数:指音频幅度最大值与最小值分为了多少阶,比如满幅度是3.3V,如果是8Bit位数,那么每一阶就是3.3V/256 = 12.89mv,采样位数越高,声音细节越好。所以采样速率和位数越高,声音还原越逼真,但存储的数据量也越大,一首三四分钟的歌曲,如果不采用编码按原始波形数据存储,数据量有好几十兆大小,这涉及到音频编码的问题,这里不展开讲了,有兴趣的同学可以找相关资料。
" x  x' ]; Q# n! ^
接下来看怎么播放,最简单的当然是把采样(ADC)的数据按原样输出(DAC)了。但我们有些芯片本身不带有DAC,所以只能用PWM代替DAC,PWM即脉冲宽度调制。这里只需要把DAC的幅度值转换成PWM的占空比即可,例如16KHz 8Bit的声音转换成16Khz 256阶占空比的PWM。但有一个问题,如果用16KHz的PWM播放语音,声音是可以播放,但有一个16Khz的谐波存在,这个声音会被人耳听到,所以需要更高频率的PWM,数据还是按照16Khz更新。
2 ?5 |* K* M: z* k' K, R
我这里使用32KHz的PWM,用16KHz 8Bit PCM格式的音频数据,8Bit的数据对应一个Byte,16KHz采样,1秒种占用存储空间就是16K Byte,F429有2MByte的Flash存储空间,理论上可以存储2048K/16K= 128秒的音频。

- U9 C3 z( q, W' o- T& F
下面是用NucleoF429实现音频播放的具体过程:

# u1 C: Q6 Y& \; I& ~% O) V1 l9 X
一、配置PWM
; B7 @0 Y- J2 W" [* u9 P; V
1、用STM32CubeMx建立工程,配置两个定时器TIM1和TIM2,TIM用于PWM产生,TIM2用于16KHz数据更新。

% r4 }( y. b4 P0 t& {
1.3.png

7 [4 V! M2 D' s5 y
TIM1选择PWM互补输出(单通道也可以),将PE8和PE9复用为PWMN和PWMP。

9 N, n+ c" f3 D+ {  l/ B
TIM1在APB2总线上,TIM2在APB1总线上
5 Y1 E" a2 B, y: G2 b  `3 I
1.4.png

! I  {+ `( V+ @
所以TIM1和TIM2的时钟频率分别为180M和90M,系统时钟用HSE输入的8MHz。
6 \% \2 ^6 D" b+ g) O- M
1.5.png
- ~1 {3 p4 f+ p. [
将TIM1设置为32KHz,即31.25us。8Bit占空比,一个LSB为31.25us / 256 = 0.1220703125us = 8.192MHz,TIM1180M / 8.192M = 21.97265625,这里取整数22。所以实际的PWM频率为1/(180 / 22) *256 =  31.289us = 31.96KHz

8 l  r3 }  U2 E7 g
1.6.png
7 [* \5 |9 U* \9 A: [
TIM2 为90MHz,45分频后为2MHz即0.5us,周期125即62.5us = 16KHz。
) f6 u( V7 u$ R% O4 ^8 j; \
1.7.png
3 S7 {! k. T5 }3 ~( s
NVIC开启TIM2中断。生成工程名和目录后生成Keil工程。
: W# p' F8 K% r6 x1 V6 @
二、播放语音
1、先编译后,编写TIM中断服务程序。
1.8.png

3 X' @. M: @4 w
完成后,开启TIM2中断和PWM,(PWM是互补输出,需要单独开启各个通道)

4 |9 ]. V9 ?; o1 [: U! W! V; Z
1.9.png
: r* ^% Y+ ~; @: X
用逻辑分析仪测量输出波形。
+ ]/ N7 L# r# c+ {
1.10.png

5 A5 P4 `( G) B2 J$ H4 M/ ]$ i
如图所示,TIM1 PWM为31.96KHz,TIM2为62.5us即16KHz,结果正确。

2 b: B5 B( Y6 a/ M2 |( D
接下来处理音频:
这里使用的音频是PCM格式,是未进行压缩编码的原始数据,可以直接给PWM输出。

( k/ D- a" Z$ |
音频处理的软件有许多,只要能把格式转为PCM即可,下面是我用Cool Edit这款软件做的音频格式转换。
* h0 y& W" b3 q( m  h
选择菜单 文件-->批量转换
) V0 }; Y' F: x% I: f  i
1.11.png
; @: g' M$ f  B8 O0 V. ^
选择新的采样率和采样位数。
5 s2 X  b" E: F/ U
1.12.png
- Y  ~1 m5 ]- @8 y9 ^9 H
选择PCM格式。设置输出目录后运行批处理完成转换。
# |/ j* r1 y3 T8 ^0 _: [$ t) p6 P2 P
1.13.png

" `% O2 p, P& D) W: A, q0 C
完成后的音频文件用WinHeX这个软件打开。
! W5 j3 A4 K5 R! D  ~5 Y* K
1.14.png

- d& W$ X  e6 c! j" g
图中红框中的44个Byte为PCM格式的文件头信息,后面的的数据为音频数据,数据全选后利用WinHex的可选格式复制

/ \: O4 P" G7 i1 M. c
1.15.png

; j3 y6 o8 W: s9 L0 q
将数据以C数组的形式导出,在工程目录下新建.h文件,将复制的文件粘帖到.H文件并在工程中Include进来,定义起始和结束地址,数组的大小即为文件结束地址,数组用const修饰,可以将数据存储到Flash中。

$ g! Y: N4 j& r  d* z3 z7 m, m- ^
1.16.png

2 j5 e$ w! ?, c5 A9 |4 k- [
在TIM2中,以16KHz的速度更新PWM数据即可实现音频播放。

4 p9 y0 B5 [: ~
1.17.png
5 L9 z" l3 g% ~9 q0 M% Y
编译工程,下载到NucleoF429板子上,在PE8或PE9上接一个喇叭即可听到声音。

/ o2 y) s# M8 K  ]# W+ }
以上用的音频采样是16K 8Bit,要想提高音质,提高采样和Bit数即可,音量可以用外接三极管或功放放大,音频数据也可以用ADC采集后存储到SPI Flash后播放,实现录音回放。

7 t: Q( x& m4 ]5 f. a' {
为了方便阅读,附件中包含了此文的PDF文档,Source Code也在附件中,可以直接下载到Nucleo运行。

* u4 C; C; E- R  j% C
文章出处: ARM中文社区

/ r  z/ K' \( q( r- H1 B
收藏 评论0 发布时间:2021-4-23 16:16

举报

0个回答

所属标签

关于
我们是谁
投资者关系
意法半导体可持续发展举措
创新与技术
意法半导体官网
联系我们
联系ST分支机构
寻找销售人员和分销渠道
社区
媒体中心
活动与培训
隐私策略
隐私策略
Cookies管理
行使您的权利
官方最新发布
STM32N6 AI生态系统
STM32MCU,MPU高性能GUI
ST ACEPACK电源模块
意法半导体生物传感器
STM32Cube扩展软件包
关注我们
st-img 微信公众号
st-img 手机版