
STM32H7的Cache与Buffer& g5 D4 |, e( r* J7 D' r2 [2 F TCM和Cache的区别1 a& J# p' f% v' b' G …使用lwip用到了mpu,对于内存管理产生了很多的疑问,需要统一解决一下,不然用起来总有些不安。$ n& V' T8 @1 I$ Z+ v 7 Q2 ]% @/ C0 a4 r3 h" c STM32H7使用的内存不是连续的,而是被划分为多段。5 r/ j2 m8 w: Y& y$ x7 Q / Y2 E8 Y: v9 ^ J3 Y# Y: ^( K1 X7 f, s
TCM内存段是和CPU同频率的,不需要也不能用Cache。用好TCM的优先级应该排在用好Cache的前面。& ]; j. G3 j- z& W& p& Y( z Cache处于核心里面,作为低速内存加速器使用,获得增益最大的是位于AXI总线上的比如内部Flash、内部SRAM、通过FMC或者QSPI控制器连接的外部sram。Cache使得低速Sram获取与高速TCM差不多的速度。使用Cache加速很有意义,不然400M的cpu变200M,相当于H7变F4,选择H7的cpu将变得没有意义。3 R( T% `1 w& O, e) o ![]() 内存类型 内存类型分为Normal以及Device和Strongly-ordered, ![]() # R T6 ]8 P) ], s+ P" A) L1 u ![]() & L* B3 l; b! [3 y. n# t - u+ f1 y- B- }! y5 ^ Write-buffer是什么?: [8 |9 ]' u4 z3 g! t$ Y Device和Strongly-Ordered类型时候提到了write-buffer,它属于cpu核心,cache经常与write-buffer一起使用,使用writer-buffer的目的是将处理器和cache从较慢的对主存的写操作中脱离出来。, A3 W& ?! b6 n Write buffer可以缓存8个word的数据和4个独立的地址,可以enable或者disable使用ARM核心控制寄存器 W的bit3。同时还要受到内存管理页表的一个bit控制,所以使用Write-Buffer,MMU必须已经使能(控制寄存器的bit0)。MMU-Memory Management Unit& a/ U0 A: o% a# F+ I3 x* `* l 通常情况下的配置都是主内存允许bufferable,但是I/O 空间 unbufferable 当CPU执行一个写操作时,根据配置情况执行写入操作。6 F. V7 Q- O& i' h" {& U7 f5 _ + u7 Z4 |' @0 M; Q/ W( C) w ![]() , Y7 j4 Z# u- E) C ![]() 如果程序中使用DMB and DSB,处理器会等到write-buffer内指令完成,再进行后续指令操作,如果过程中发生中断,中断返回后继续write-buffer清空等待。 DMB或者DSB被称为 显式限制操作 explicit barrier。- v4 Q! }6 n, h' W " K, S5 o+ R! W* w; J- x7 e2 P, Z ![]() 9 l+ r E! p* G; U _ Memory Attrabute8 W( W9 e/ }& T9 N& J/ n Normal模式下可以设定的几种 . C7 B8 G0 e" [1 o0 e ![]() Shareable属性 共享属性设计的意义在于,多个bus master读写情况下需要cache保持同步,对于CortexM7,只有L1-Cache,如果设置了Shared相当于non-cacheable。 ![]() 7 d+ }" B! a3 s# t" t 内核操作函数 f/ w' q, O8 h6 v7 C" ? 内核操作函数包含以下几种,主要包含两种操作:clean和invalidate。 clean:将cache中的信息写到sram,相当于用cache信息覆盖sram; invalidate:使cache失效,相当于用sram信息覆盖cache; 二者为相反的操作。 ![]() 3 W; i7 a. F8 p4 }- f9 T" t ![]() $ r2 v' z4 }; M7 g% k- P' R, S 内存对齐问题 使用cache时,dma的buffer必须32byte对齐,不然可能会出现问题。比如下面的情况:
如果DMA的buffer只有16字节,DMA读取操作后,DMA控制器将接收到的数据写到了sram里面,然后进入DMA接收中断函数,cpu把成功读取的标识bool变量写为true,实际上写操作只是写在D-Cache里面,暂时没有写到sram。 v7 m, }. S+ [5 _- N5 `( o ![]() 如果此时cpu需要读取dma内容,需要对Dcache进行invalid操作,32个字节将一起更新,bool变量旧值0将覆盖新值1。cpu读不到中断函数写的bool变量信息。 ( v7 q5 J5 B2 v* Z ![]() 可见: clean操作或者Invalidate操作都可能丢东西,使用上需要注意。经验是如果一段内存用来写dma外设,就不要读它,保证随时都可以clean;同样如果一段内存用来接收DMA外设传入信息,就不要用cpu写它,保证随时都可以invalidate。 ![]() , r( x: w: @. r 9 N2 [2 d: P, f2 E% q: G |
【Wio Lite AI视觉开发套件】+移植TensorFlow Lite
STM32H745I-DISCO脉冲宽度调制(PWM)
STM32H745I-DISCO串口通信,输入输出
拷打cubemx【002】——自定义还需基于芯片的工程
STM32硬件结构学习
STM32中BOOT的作用
STM32H7的TCM,SRAM等五块内存基础知识
STM32H7的TCM,SRAM等五块内存基础知识
简单了解一下STM32H7的BDMA
有奖预约 | STM32H7R7基于RT-Thread RTOS的智能终端GUI解决方案