你的浏览器版本过低,可能导致网站不能正常访问!
为了你能正常使用网站功能,请使用这些浏览器。

【经验分享】STM32H7的Cache与Buffer

[复制链接]
STMCU小助手 发布时间:2021-12-26 17:22
STM32H7的Cache与Buffer
TCM和Cache的区别

…使用lwip用到了mpu,对于内存管理产生了很多的疑问,需要统一解决一下,不然用起来总有些不安。

STM32H7使用的内存不是连续的,而是被划分为多段。

  1. MEMORY
  2. {
  3.         DTCMRAM (xrw)     : ORIGIN = 0x20000000, LENGTH = 128K //高速段,cpu独享
  4.         RAM_D1 (xrw)      : ORIGIN = 0x24000000, LENGTH = 512K
  5.         RAM_D2 (xrw)      : ORIGIN = 0x30000000, LENGTH = 288K
  6.         RAM_D3 (xrw)      : ORIGIN = 0x38000000, LENGTH = 64K
  7.         ITCMRAM (xrw)     : ORIGIN = 0x00000000, LENGTH = 64K //高速段,cpu独享
  8.         FLASH (rx)        : ORIGIN = 0x8000000, LENGTH = 128K
  9. }
复制代码

TCM内存段是和CPU同频率的,不需要也不能用Cache。用好TCM的优先级应该排在用好Cache的前面。
Cache处于核心里面,作为低速内存加速器使用,获得增益最大的是位于AXI总线上的比如内部Flash、内部SRAM、通过FMC或者QSPI控制器连接的外部sram。Cache使得低速Sram获取与高速TCM差不多的速度。使用Cache加速很有意义,不然400M的cpu变200M,相当于H7变F4,选择H7的cpu将变得没有意义。

20201019190212727.png


内存类型
内存类型分为Normal以及Device和Strongly-ordered,
I5LW_ZQ_SY3W%I@][7RY56T.png


20201019190230823.png



Write-buffer是什么?
Device和Strongly-Ordered类型时候提到了write-buffer,它属于cpu核心,cache经常与write-buffer一起使用,使用writer-buffer的目的是将处理器和cache从较慢的对主存的写操作中脱离出来。
Write buffer可以缓存8个word的数据和4个独立的地址,可以enable或者disable使用ARM核心控制寄存器 W的bit3。同时还要受到内存管理页表的一个bit控制,所以使用Write-Buffer,MMU必须已经使能(控制寄存器的bit0)。MMU-Memory Management Unit
通常情况下的配置都是主内存允许bufferable,但是I/O 空间 unbufferable
当CPU执行一个写操作时,根据配置情况执行写入操作。



20201019190300772.png


如果程序中使用DMB and DSB,处理器会等到write-buffer内指令完成,再进行后续指令操作,如果过程中发生中断,中断返回后继续write-buffer清空等待。

DMB或者DSB被称为 显式限制操作 explicit barrier。

20201019190244953.png


Memory Attrabute
Normal模式下可以设定的几种

UXF0GF8D%6@3RQT%LAI76.png


Shareable属性
共享属性设计的意义在于,多个bus master读写情况下需要cache保持同步,对于CortexM7,只有L1-Cache,如果设置了Shared相当于non-cacheable。

20201019190314464.png


内核操作函数
内核操作函数包含以下几种,主要包含两种操作:clean和invalidate。
clean:将cache中的信息写到sram,相当于用cache信息覆盖sram;
invalidate:使cache失效,相当于用sram信息覆盖cache;
二者为相反的操作。

2020101919032876.png


20201019190336970.png



内存对齐问题
使用cache时,dma的buffer必须32byte对齐,不然可能会出现问题。比如下面的情况:

  1. typedef struct
  2. {
  3.     __attribute__ ((aligned (32))) uint8_t rx_buffer[BUFFER_SIZE];//用于buffer
  4.     bool rx_xfer_done;                                     //用于记录dma已经被正确传输
  5. }st_dma_xfer

  6. void XDMAC_Handler(void)
  7. {
  8.     uint32_t dma_status;
  9.     dma_status = xdmac_channel_get_interrupt_status(XDMAC, XDMA_CH_RX);
  10.     if (dma_status & XDMAC_CIS_BIS)
  11.     {
  12.       g_st_dma_xfer.rx_xfer_done = true;
  13.       SCB_InvalidateDCache_by_Addr((uint32_t*)g_st_dma_xfer.rx_buffer, DMA_TRANSFER_SIZE);
  14.     }
  15. }
复制代码


如果DMA的buffer只有16字节,DMA读取操作后,DMA控制器将接收到的数据写到了sram里面,然后进入DMA接收中断函数,cpu把成功读取的标识bool变量写为true,实际上写操作只是写在D-Cache里面,暂时没有写到sram。

20201019190359602.png


如果此时cpu需要读取dma内容,需要对Dcache进行invalid操作,32个字节将一起更新,bool变量旧值0将覆盖新值1。cpu读不到中断函数写的bool变量信息。

20201019190409891.png


可见:
clean操作或者Invalidate操作都可能丢东西,使用上需要注意。经验是如果一段内存用来写dma外设,就不要读它,保证随时都可以clean;同样如果一段内存用来接收DMA外设传入信息,就不要用cpu写它,保证随时都可以invalidate。

2020101919042042.png



收藏 评论0 发布时间:2021-12-26 17:22

举报

0个回答

所属标签

相似分享

官网相关资源

关于
我们是谁
投资者关系
意法半导体可持续发展举措
创新与技术
意法半导体官网
联系我们
联系ST分支机构
寻找销售人员和分销渠道
社区
媒体中心
活动与培训
隐私策略
隐私策略
Cookies管理
行使您的权利
官方最新发布
STM32N6 AI生态系统
STM32MCU,MPU高性能GUI
ST ACEPACK电源模块
意法半导体生物传感器
STM32Cube扩展软件包
关注我们
st-img 微信公众号
st-img 手机版