你的浏览器版本过低,可能导致网站不能正常访问!
为了你能正常使用网站功能,请使用这些浏览器。

基于STM32 DCMI 的带宽与性能经验分享

[复制链接]
STMCU小助手 发布时间:2023-8-2 16:47
1. 引言
随着市场对更高图像质量的需求不断增加,成像技术持续发展,各种新兴技术(例如3D、计算、运动和红外线)的不断涌现。如今的成像应用对高质量、易用性、能耗效率、高集成度、快速上市和成本效益提出了全面要求。为了满足这些要求,STM32 MCU 内置的数字照相机接口(DCMI),能够高效连接并行照相机模块。
6 N0 G- n& c  Y$ N
对于使用STM32 DCMI 开发相机应用的客户,经常有以下问题:STM32 DCMI 最大支持的像素时钟是多少?STM32F4/F7/H7/U5 能支持1280×720 的相机分辨率吗?最大的帧率是多少?如何判断所设计的应用产生的带宽是否能充足?相机输出是选择8 位、10位、12 位、还是14 位?* d1 l! y  \" N6 L" H) P! E3 i: \
针对这些问题,本文档从DCMI 使用的几个方面,介绍了STM32 DCMI 在连续抓取模式下带宽的估算,以及提升性能需要注意的事项。客户在设计相机应用时可以参考。
7 K6 _  X7 h$ y; g
2. STM32 DCMI
STM32 数字照相机接口(DCMI)采用同步并行数据总线。它可以轻松集成并适应相机的特殊应用要求。DCMI 可连接8、10、12 和14 位CMOS 照相机模块,并支持多种数据格式:8/10/12/14 位逐行视频、YCbCr4:2:2 逐行视频、RGB565 逐行视频、JPEG 等。像素最大支持16 位色深。9 X1 o4 O4 |6 ~) s$ P. s
/ O% x6 g# `& P# L
2.1. STM32 智能架构中的DCMI( T, c4 T1 s$ A% k( N* E, h
DCMI 应用需要用帧缓冲区来存储采集的图像。必须根据图像大小和传输速度使用合适的目标存储区。在某些应用中,必须连接外部存储器(SDRAM),以便提供较大的数据存储空间。对于支持DMA2D(Chrom-ART Accelerator™控制器)的STM32 系列,也可以用它做色彩空间转换(例如RGB565 至ARGB8888),或使用DMA 从一个存储区到另一个存储区的数据转移。
$ r, h3 V7 K: F* ~7 ]
下面图1 是STM32F2x7 系列智能架构中DCMI 的例子。这里DCMI 通过AHB2 外设总线连接到AHB 总线矩阵。DMA2 主控访问DCMI,将DCMI 接收到的图像数据传输到内部RAM 或外部SDRAM 中,具体目标位置取决于应用。
8 @( w& L2 O/ B* h" w  u3 a; N4 G

( n2 n) L1 t$ M7 @! k! j2 U$ l& p6 w! p

, W$ v) o+ d- j: R0 i4 v6 u 微信图片_20230802164620_2.png
: w& A; ]% s3 T+ E
, D  K  S3 U# M9 c3 f$ D0 R" B+ c' {
) F" j; f5 I2 A, N" C
图1. STM32F2x7系列智能架构中的DCMI从设备AHB2外设4 l) E+ D7 \! j! n1 f
; N, e8 h7 h% {6 O( F7 y) w8 X- u
( V$ j3 e6 A. ?6 `6 I
2.2. DCMI 最大像素时钟频率
6 y, p# H4 A  U1 s* [4 CSTM32 DCMI支持的像素时钟频率,与AHB时钟频率比值必须小于0.4。具体的像素时钟频率最大值要查询所用STM32的数据手册。下面表1中列出了部分STM32系列DCMI最大像素时钟频率及相关可用资源的信息。如需更详细信息,请参考相应的参考手册/数据手册。
6 h$ k5 M6 }& _
7 G! f/ f( ~* t* n
8 j2 A, ]2 }  J! g. [5 w- W
微信图片_20230802164620_1.png 6 W- ^2 _8 X3 y% r3 y

2 ]" ^4 s. K" g# @. z% z$ v
) L: k; D* I8 D& Q+ O5 Y
表1. DCMI及相关可用资源2 W' _) K1 O, ]( g+ ^, V% V8 n; }

6 p8 d4 O; o1 i2 U
1 k  V% m* _) O  f
2.3. DCMI 支持的图像分辨率4 w& K; a; N) M
STM32 DCMI仅对输入像素时钟频率有硬件限制(DCMI_PCLK / fHCLK 最大0.4),对图像的分辨率没有限制。DCMI连续抓取模式下,图像分辨率会影响帧率(帧率的大小会影响视频的流畅度)。在固定的像素时钟频率下,高分辨率图像的带宽需求较高,对应的帧率则会下降。或者说,在相同的图像分辨率下,提高帧率需要相应地提高像素时钟频率。例如下表2(摘自三星S5K5CAGA CMOS Image Sensor的数据手册)所示,大家可以从中了解S5K5CAGA的像素频率、图像分辨率、帧率的关系(非RGB888,16位色深)。另外,图像分辨率主要通过设置相机的输出格式进行修改。9 Z& |! h% S9 d, `
! `" ?, D# R! {

) {, A& e) Z. X8 o' P! p6 ^) q+ m 微信图片_20230802164620.png
8 l  |( B: |( C; j1 l# H; U" r/ E7 |$ F7 R

+ f; R4 ]8 @0 w; I$ M& i表2. S5K5CAGA YUV/RGB565像素时钟频率与帧率对于中高分辨率的图像,一般采用双缓冲区或多缓冲区模式。这个主要原因是因为DCMI使用的DMA计数寄存器SxNDTR使用了16位用于计数。最大0xFFFF,即 65535 ,单位为32位Word,当图像分辨率超过65535 Words(262140字节)时,则要使用双缓冲区或多缓冲区模式。双缓冲区地址由DMA_SxM0AR/DMA_SxM1AR设定。多缓冲区时,则需要动态交替DMA_SxM0AR/DMA_SxM1AR,使之指向图像缓冲区的不同存储位置,相当于分块存储。" ?& A0 w5 B# r+ F
# ~1 D% b1 r  M6 g% t! M
2 `" L$ z: Q6 v  I8 {- \4 }
2.4. DCMI 带宽与性能
) l) M3 v+ v2 \" v# Y0 ?& P使用DCMI的相机应用,使用连续抓取模式,功能往往是由相机连续输出所摄图像数据流到STM32,STM32 DCMI捕获视频流后,再输出到屏幕显示(如监控)或做图像数据处理、传输等。如果相机输出的是高像素高色深高帧率的视频流,DCMI在接收过程中,如不能及时处理,DCMI FIFO即会产生溢出错误(Overrun),进而导致图像数据丢失,帧率下降等问题。
$ I7 q" f' K' K( v8 c# S) e
8 R- T3 }$ {( r

. g5 N2 A6 z' N$ I2.4.1. DCMI 带宽与性能
6 m' G) ^; B: l, h6 `DCMI带宽计算公式为:带宽 = 分辨率 * 色深 * 帧率。以三星S5K5CAGA为例,如表2中第1行数据(这里相机采用RGB565,16位/像素,8位输出格式),则QXGA输出的带宽需求 =(2048 * 1536)* 2 * 6 ≈ 38MBps。像素时钟为40MHz,8位输出,每2个CLK传输1个像素数据,对应的最大输出能力为40 MBps。则QXGA在40MHz的像素时钟频率下是可以以6帧/秒的帧率输入到DCMI的。DCMI捕获图像数据流,再由DMA传输到图像缓冲区,该例中,图像缓冲区(帧缓冲区)的大小为:2048 * 1546 * 2 ≈ 6.3 MByte。高像素高色深的图像,对应的图像缓冲区较大。当MCU内置的SRAM不能满足DCMI图像缓冲区需求时,则需要用外部SDRAM来存储。例如STM32F469 MCU(见表1,第6行数据),其FSMC支持的最大频率为90MHz,宽度32位,则SDRAM的带宽 = 90 * 4 = 360 MBps,能够满足DCMI带宽的需求。一般,DCMI图像缓冲区中的数据是需要再次传输或由CPU进行计算处理的,理论上DCMI输入的带宽需求最大不应超过SDRAM的带宽的50%。这里需要注意SDRAM可能存在多个主控(如CPU、DMA、LTDC等)的访问,如遇到SDRAM性能瓶颈问题,可考虑下列方面进行优化:(1)将各主控设备访问的存储器尽量分开,以减少竞争访问;(2)将CPU访问的SDRAM Bank 与DCMI图像缓冲区的Bank分开;(3)将DCMI图像缓冲区区域设为不可缓冲,CPU 访问的区域则可以设为可缓冲。对于性能,另外一个重要因素是总线竞争问题。DCMI DMA申请的AHB总线访问(即使在使用FIFO的情况下)并非长Burst的访问。如果AHB总线上存在其它长Burst访问(最大1KByte),会造成DMA延迟访问DCMI,令其不能及时将DCMI FIFO中的数据传输出去。可以认定:DCMI需要传输数据时的总线繁忙是造成 其FIFO 溢出错误的根源。解决办法除了直接为设备分配不同SDRAM之外(将长Burst访问放在其他SDRAM),还可以考虑在内部SRAM增设DCMI LineBuffer,化零为整,巧妙避开AHB 长Burst 访问造成的DCMI延迟问题。数据流如下:(1)DCMI(经DMA)=> 内部SRAM(LineBuffer) ;(2)内部SRAM(LineBuffer)=> 外部SDRAM(图像Buffer)。由LineBuffer 到SDRAM的数据中转传输请求,可使用DCMI IT_LINE 中断(行结束)触发。这里MCU如果是STM32F7/H7系列,还可使用MDMA 充分发挥A**线的优势,但要注意LineBuffer 最好是8字节的倍数(64位总线)。/ S& {% U! q8 [. i3 }

) I5 E* p2 c: ]0 a

  B. h- G8 k/ D, G2.4.2. DCMI 图像大小调整功能
9 R6 k, W7 b& V1 V; L% _当考虑了上面的措施,仍无法满足应用对高分辨率需求时,用户可以通过设置相机,修改相机输出分辨率,配合DCMI调整图像大小功能,找到合适的折中方案。DCMI提供的相关功能如下:(1)窗口裁剪:使用寄存器DCMI_CWSTRT指定起始坐标;使用寄存器DCMI_CWSIZE指定窗口大小。(2)图像数据调整(详见寄存器DCMI_CS中LSM/BSM等位域):- 行选择:可选择2选1,行数减半;- 数据选择:字节流上可进行2选1、4选1已经4选2 (注意:对于RGB565格式, 只能4选2可选,2选1及4选1会造成色彩数据错乱)。, _1 C+ \# q6 t: c3 O4 @0 v
5 Z! W+ X  L5 ~3 x9 r/ L* w) C

5 b& C: l( x- @$ L1 Q/ m$ N" @% x
2.5. DCMI 10/12/14数据线输入
DCMI 支持最多14条数据线(D13 - D0),如果将DCMI配置为接收10、12或14位数据,DCMI将用2个像素时钟周期捕获一个32位数据。以12位数据宽度为例,DCMI在第1个像素时钟捕获12位LSB(忽略D[13 :12]),存于DCMI_DR寄存器低16位字中低12位,高4位(D[15 :12)清零;第2像素时钟捕获的12位LSB则存于DCMI_DR高16位字的低12位,高4位(DCMI_DR的[31 : 28])清零。另外相机也必须配置为10/12/14位输出。具体情况则由应用决定。

, s$ C* X, n9 |/ m0 V! n
3.小结
本文通过介绍STM32 DCMI支持的最大像素时钟频率,支持的图像分辨率及与帧率的关系,进而引出DCMI带宽与性能提升的注意事项。另外附带了DCMI图像大小的调整及10~14数据线的简介,为用户遇到相关问题时提供思路参考。
2 g. F, `( h1 ]) E
1 x" u2 g# y0 X+ C* U( v% [) s: {
6 }, U1 K3 u5 ^/ S7 \# L6 i

. q6 a0 q5 s  e$ d8 t* t转载自: STM32单片机
0 K: U; M; m% X. m! r6 R) K! q如有侵权请联系删除- H; Q; E% |7 d- b9 f* R- B

' C; d) A$ a- x) [2 F! Q( p
收藏 评论0 发布时间:2023-8-2 16:47

举报

0个回答
关于意法半导体
我们是谁
投资者关系
意法半导体可持续发展举措
创新和工艺
招聘信息
联系我们
联系ST分支机构
寻找销售人员和分销渠道
社区
媒体中心
活动与培训
隐私策略
隐私策略
Cookies管理
行使您的权利
关注我们
st-img 微信公众号
st-img 手机版