
1.1 初学者重要提示5 ^. _5 S/ o$ x 关于学习方法问题,可以看附件章节A。' r: X3 d# f# f 这几年单片机的性能越来越强劲,DSP芯片的中低端应用基本都可以用单片机来做。 当前单片机AI也是有一定前景的,ARM一直在大力推进,很多软件厂商和研究机构也在不断的努力。通过此贴可以了解下:单片机AI的春天真的来了,ARM最新DSP库已经支持NEON 1.2 STM32H7的DSP功能介绍6 ]6 S3 J9 h0 C# V8 u; k, B4 i5 B+ J STM32H7是采用的Cortex-M7内核,而DSP功能是内核自带的,下面我们通过M7内核框图来了解下: 3 N/ ?& u; Y0 G4 p8 H' n, p ![]() 重点看如下两个设计单元: # l- i2 C/ l' b DSP DSP单元集成了一批专用的指令集(主要是SMID指令和快速MAC乘积累加指令),可以加速数字信号处理的执行速度。/ O+ H2 |) b1 E' ]1 Y 3 }+ @* N& f6 f- o' M+ e/ o FPU Cortex-M7内核支持双精度浮点,可以大大加速浮点运算的处理速度。8 C# @2 I6 d( F$ P + n* u. R$ C" v1 J5 ?6 \ g' v 下面是Cortex-M3,M4和M7的指令集爆炸图:' h0 \6 [- x& {2 q, `3 ]2 D ) J/ v" f& [4 S1 O) r3 W- ^ ![]() 通过这个图,我们可以了解到以下几点:4 J8 c4 W4 Q/ n1 n5 ^ M4和M7系列有相同的DSP指令集。 M7相比M4系列要多一些浮点指令集。 同时这里要注意一个小细节,浮点指令都是以字符V开头的。通过这点,我们可以方便的验证是否正确开启了FPU(MDK或者IAR调试状态查看浮点运算对应的反汇编是否有这种指令)。 3 U+ I1 \9 ]# S8 W8 v * }( ~8 H j+ f+ | 不同M内核的DSP性能比较: + _- W* X% s) w9 z, Q ![]() . h5 r$ f4 Q' K Cortex-M7内核的DSP性能最强。; Q: |: f* D" [( d: K Cortex-M3,M4和M33是中等性能,其中M3最弱。9 Q$ w4 @4 m# {9 x( v8 D# b5 A Cortex-M0,M0+和M23性能最弱。# a* ~* N# m' q/ I5 G7 D% P 1.3 Cortex-M7内核的DSP和专业DSP的区别 M核的DSP处理单元与专业DSP的区别:, t9 J0 e' |0 O2 L" n" q 8 Q4 _' u$ Q) G% N. }" \3 y5 y ![]() J+ }9 \( |. u3 ~ 1.4 ARM提供的CMSIS-DSP库 为了方便用户实现DSP功能,ARM专门做了一个DSP库CMSIS-DSP,主要包含以下数字信号处理算法:6 _* w1 H, o' v BasicMathFunctions 提供了基本的数据运算,如加减乘除等基本运算,以_f32结尾的函数是浮点运算,以_q8, _q15, _q31,结尾的函数是定点运算,下面是部分API截图: ![]() FastMathFunctions7 V" k7 [, e5 ~) u 主要提供SIN,COS以及平方根SQRT的运算。3 u- T8 W9 r. H! l! M( Q: ~ ![]() ComplexMathFunctions 复杂数学运算,主要是向量,求模等运算。下面是部分API截图: ![]() FilteringFunctions 主要是滤波函数,如IIR,FIR,LMS等,下面是部分API截图:! C) o6 v/ i; G6 b0 @6 \ 5 ^+ ~4 B3 j b! N: ?1 p6 B ![]() - f: m4 H& _% m. c1 W5 ~- ` MatrixFunctions 主要是矩阵运算。* E) `1 R( `! I& G9 C/ o) J ![]() 8 N& I) b: f8 A6 b9 n+ s TransformFunctions 变换功能。 包括复数FFT(CFFT),复数FFT逆运算(CIFFT),实数FFT(RFFT),实数 FFT 逆运算,下面是部分API截图: ![]() ControllerFunctions2 Y: o. @( \8 z, H3 I- K8 F 控制功能,主要是PID控制函数和正余弦函数。 7 e$ v) D, I' r y$ W% T, k9 [ ![]() / s9 j8 H) T4 {: _4 s( a3 E7 c' u2 a StatisticsFunctions* H2 S2 f0 p7 [ 统计功能函数,如求平均值,最大值,最小值,功率,RMS等,下面是部分API截图。8 @0 c" q. \. j$ F8 F# g# V ![]() SupportFunctions, M( a8 M) W* Z# n 支持功能函数,如数据拷贝,Q格式和浮点格式相互转换。 ![]() ( W! ~: l/ q4 c( v5 p: U3 ~( n, d CommonTables- s C+ T# h! V0 S4 i, Z arm_common_tables.c 文件提供位翻转或相关参数表。 ![]() ) a% T) P' ~2 Q5 m1 e 1.5 TI提供的32位定点DSP库IQmath( t2 g3 P; a4 E( G 初次使用这个定点库,感觉在各种Q格式的互转、Q格式数值和浮点数的互转处理上更专业些,让人一目了然。0 T1 e6 v6 Y8 G; k. B) F) t7 K 所以本次教程也会对IQmath做个介绍并配套一个例子。% N0 ]+ P( t& V; u1 N7 P+ l 8 i/ N9 U# e0 l1 d 1.6 ARM DSP软件替代模拟器件的优势 我们日常生活中用到DSP的地方很多,以生活中的设备为例:! b- H0 e; y1 H, _; E! } ![]() * |/ a$ G" u( [4 M" s8 X) U& `, | 通过ARM DSP软件替换模拟组件可以降低成本,PCB的面积和设计时间,同时提高灵活性和适应性。 - o) _; L& H) p$ B$ a 降低BOM成本+ A" X, \9 Z: {' X% U) b 将模拟电路转换为软件的最明显的好处是材料清单成本(BOM)减少。 # M/ i7 s8 |( b. B$ [- W& h 提高设计灵活性 使用模拟滤波器来不断调节电路以获得最佳性能时,这种情况并不少见。较小的电路板修改会导致新的电气特性突然改变寄生电容或电感,从而导致模拟电路达不到预期。将模拟电路转换为DSP算法不仅可以消除这种风险,还可以根据软件的需要进行调整,且更具灵活性。 减少产品尺寸 降低BOM成本具有额外的好处,也允许开发人员减少其产品的尺寸。 缩短设计周期时间 _) C/ Q7 j% S& t9 X 将模拟电路转换为软件有助于缩短设计周期。这有几个原因:1 z1 _9 M6 I' ?, L5 s3 f1 c a 首先,有很多工具可供软件设计人员模拟和生成替换模拟电路所需的DSP算法。这通常比通过电路仿真和测试调整电路所需的时间快得多。 其次,如果需要进行更改,可以在软件中进行更改,这可以在几分钟内完成,而不必重新调整电路板或进行硬件修改。9 u1 E0 |, F: ?5 J 现场适应性 在某些产品中,设计者很难预料用户在现场所遇到的各种情况。使用DSP算法,设计者甚至用户都可以进行实时调整,以适应现场条件,而无需进行大量硬件修改。. d2 p' i1 H; M1 m" B; T 用数字信号处理算法替换模拟电路有很多好处。需要设计者在实际应用中权衡利益,选择最合适的方案。 1.7 Matlab安装 Matlab是学习DSP过程中非常重要的辅助工具,也是需要熟练掌握的,本教程的第2章到第5章进行了入门介绍。 ! d$ d0 Y$ m& d6 f 1.8 总结! _+ b5 l0 u: }. ]2 ^ 本期教程主要是做一些入门性的介绍,下期教程将开始实战。3 w8 C: w2 @+ G4 v |
NUCLEO-H723ZG开发板试用 ——串口点灯测试
兔哥的杂谈【002】——如何性价比更高地去编译STM32
【Wio Lite AI视觉开发套件】+简单刷个屏
工程师笔记 | STM32H7 RAMECC功能及应用
stm32使用定时器触发dma传输,启动dma没反应的几种情况的解决方法
【Wio Lite AI视觉开发套件】+cube.ai与食物识别
【STM32H7S78-DK】汽车仪表系统
【STM32H7S78-DK】基于 rtthread 适配 lcd 驱动移植 lvgl
【STM32H7S78-DK评测】TouchGFX (QR Code)二维码生成器
【STM32H7S78-DK】rtthread 增加 psram 内存管理