你的浏览器版本过低,可能导致网站不能正常访问!
为了你能正常使用网站功能,请使用这些浏览器。

使用PWM实现语音播放

[复制链接]
y369369 发布时间:2021-4-23 16:16
使用PWM实现语音播放
事实上大部分MCU都可以实现语音播放

: p- l$ e; V  w" n% _
下面是一段音频数据的波形

& I# B3 O0 d( k* G0 \' V5 k
1.1.png
8 U- |) p  s6 G* ~1 ~+ j5 G; y0 Q6 M( K
局部放大图:

" i( P: y) }- l0 i) B3 O8 m
1.2.png
4 u4 E8 X0 x4 x  e* a: R
以一定的速度采样(ADC)这些波形进行存储,就是音频数据了,所以播放就是按原来采样的速率再用DAC输出对应的数据即可。
2 U, g3 Y% `' j! ~# r4 h' I
这里的音频有两个主要的参数,采样速率和采样位数。
+ m( R( t; r+ n$ r! B' R& O
采样速率:指1s中采样多少个数据点,比如1s种采集16000个点,那么采样率就是16KHz。采样速率越高,越能抓到频率较高的声音,比如CD的采样率就是44.1KHz,确保人耳能听到的声音都会被抓到。
" c* y# i0 B- m8 y' @
采样位数:指音频幅度最大值与最小值分为了多少阶,比如满幅度是3.3V,如果是8Bit位数,那么每一阶就是3.3V/256 = 12.89mv,采样位数越高,声音细节越好。所以采样速率和位数越高,声音还原越逼真,但存储的数据量也越大,一首三四分钟的歌曲,如果不采用编码按原始波形数据存储,数据量有好几十兆大小,这涉及到音频编码的问题,这里不展开讲了,有兴趣的同学可以找相关资料。

% L" b: C' M! ~
接下来看怎么播放,最简单的当然是把采样(ADC)的数据按原样输出(DAC)了。但我们有些芯片本身不带有DAC,所以只能用PWM代替DAC,PWM即脉冲宽度调制。这里只需要把DAC的幅度值转换成PWM的占空比即可,例如16KHz 8Bit的声音转换成16Khz 256阶占空比的PWM。但有一个问题,如果用16KHz的PWM播放语音,声音是可以播放,但有一个16Khz的谐波存在,这个声音会被人耳听到,所以需要更高频率的PWM,数据还是按照16Khz更新。

! t) h& {; H( I
我这里使用32KHz的PWM,用16KHz 8Bit PCM格式的音频数据,8Bit的数据对应一个Byte,16KHz采样,1秒种占用存储空间就是16K Byte,F429有2MByte的Flash存储空间,理论上可以存储2048K/16K= 128秒的音频。

, J6 ]* [7 \+ P& L
下面是用NucleoF429实现音频播放的具体过程:

; _7 h7 A4 ?/ u
一、配置PWM
. r; [0 u! D# G( J  u7 A& ^
1、用STM32CubeMx建立工程,配置两个定时器TIM1和TIM2,TIM用于PWM产生,TIM2用于16KHz数据更新。

1 H! m+ R. f5 L
1.3.png

9 P% p+ q1 v! B' C3 M- f
TIM1选择PWM互补输出(单通道也可以),将PE8和PE9复用为PWMN和PWMP。

' O5 @7 |; a+ V2 a- E) {- S( d
TIM1在APB2总线上,TIM2在APB1总线上

* S6 ~# d: x2 c3 N! s1 U
1.4.png
1 g/ `4 ~4 U8 e( v% @2 ~( i
所以TIM1和TIM2的时钟频率分别为180M和90M,系统时钟用HSE输入的8MHz。

2 R. z: ?* [6 t. {+ b
1.5.png
$ H6 _& J( E# x4 Z/ i: s8 A
将TIM1设置为32KHz,即31.25us。8Bit占空比,一个LSB为31.25us / 256 = 0.1220703125us = 8.192MHz,TIM1180M / 8.192M = 21.97265625,这里取整数22。所以实际的PWM频率为1/(180 / 22) *256 =  31.289us = 31.96KHz
  M- S- i" t, r* C* L( {. ^
1.6.png

' W' _( X/ {' h' z; ], o8 u
TIM2 为90MHz,45分频后为2MHz即0.5us,周期125即62.5us = 16KHz。

# _4 h. x4 d( Z' `4 }$ k) t) J9 @
1.7.png
# e" L7 k3 k2 \. \, Y9 O# p% ?
NVIC开启TIM2中断。生成工程名和目录后生成Keil工程。
/ Y, I& t0 E0 O$ p# n) V
二、播放语音
1、先编译后,编写TIM中断服务程序。
1.8.png

. X& ^" \4 f. d$ D
完成后,开启TIM2中断和PWM,(PWM是互补输出,需要单独开启各个通道)

7 L1 c: j3 {/ L. S, X+ t
1.9.png

  _0 e# k$ G7 _8 `" y- Z. N
用逻辑分析仪测量输出波形。

5 O: |8 E2 n) j- s2 T+ u! r! h- u
1.10.png
. h' G$ J4 P( q! i8 B
如图所示,TIM1 PWM为31.96KHz,TIM2为62.5us即16KHz,结果正确。
) a, p" V/ H5 y
接下来处理音频:
这里使用的音频是PCM格式,是未进行压缩编码的原始数据,可以直接给PWM输出。

3 J! p0 _( {. y
音频处理的软件有许多,只要能把格式转为PCM即可,下面是我用Cool Edit这款软件做的音频格式转换。

2 u9 J2 j5 f6 ~# J4 ?
选择菜单 文件-->批量转换

% M* E& `3 e5 N% i- _8 m
1.11.png
1 r& x5 g: E; F1 u$ u' {
选择新的采样率和采样位数。
0 R. Q) l. k" t: ^
1.12.png
9 |" U; Y- B' D* A) v* z: `' S
选择PCM格式。设置输出目录后运行批处理完成转换。
6 E0 S5 _) H; e9 P8 h7 {
1.13.png
! w. Q! L- P% O; P3 e' @' T
完成后的音频文件用WinHeX这个软件打开。

1 K& l: L* i  u, h: B) K! z3 ]' e
1.14.png

2 D; Y: P5 n( w, }/ s# u
图中红框中的44个Byte为PCM格式的文件头信息,后面的的数据为音频数据,数据全选后利用WinHex的可选格式复制

: J1 \* P9 m; l1 l
1.15.png

# p, w# S5 g5 o6 A5 S7 Q
将数据以C数组的形式导出,在工程目录下新建.h文件,将复制的文件粘帖到.H文件并在工程中Include进来,定义起始和结束地址,数组的大小即为文件结束地址,数组用const修饰,可以将数据存储到Flash中。

3 X  z1 ^0 [8 p
1.16.png

. V# _, _$ d# @( W' m' D/ A
在TIM2中,以16KHz的速度更新PWM数据即可实现音频播放。

1 k! G7 r! P! R" B5 Z3 I1 @
1.17.png
0 ?  L) M+ p; z4 B3 T
编译工程,下载到NucleoF429板子上,在PE8或PE9上接一个喇叭即可听到声音。

$ ^% e4 V4 u# o4 Z) {8 R& B5 s
以上用的音频采样是16K 8Bit,要想提高音质,提高采样和Bit数即可,音量可以用外接三极管或功放放大,音频数据也可以用ADC采集后存储到SPI Flash后播放,实现录音回放。

3 I; x6 n# t, i0 j
为了方便阅读,附件中包含了此文的PDF文档,Source Code也在附件中,可以直接下载到Nucleo运行。

* c/ Y$ f* W  [5 z
文章出处: ARM中文社区

9 n! o* h% R; P1 ~8 p- H. _  @
收藏 评论0 发布时间:2021-4-23 16:16

举报

0个回答

所属标签

相似分享

关于意法半导体
我们是谁
投资者关系
意法半导体可持续发展举措
创新与技术
招聘信息
联系我们
联系ST分支机构
寻找销售人员和分销渠道
社区
媒体中心
活动与培训
隐私策略
隐私策略
Cookies管理
行使您的权利
关注我们
st-img 微信公众号
st-img 手机版