你的浏览器版本过低,可能导致网站不能正常访问!
为了你能正常使用网站功能,请使用这些浏览器。

【经验分享】STM32H7 启动过程及bootloader跳转详解

[复制链接]
STMCU小助手 发布时间:2021-12-24 18:00
最近公司开发的一个项目使用到STM32H7系列芯片,由于该系列芯片内部flash只有128k,为了方便产品的远程升级,需要开发对应的升级协议及bootloader引导程序。由于片内flash容量不够,需要采用外挂flash的方式存储应用程序,片内flash单纯作为bootloader引导程序存储空间。为了节省成本采用单QSPI flash外挂BANK2作为应用程序外部存储。
; G3 x0 n$ C# q1 b6 L  m4 J( C# {  I
20210114225354296.png

- s: f9 \- P- e5 L4 C  }: C
! X' M6 ]& W" G; A$ C  v1.STM32H7启动流程
: f5 u8 P6 W% y3 rIAR工程建立后,系统默认生成的启动文件为startup_stm32h750xx.s,默认生成工程一般在EWARM目录下- Q1 x! }/ p4 |
9 e& Q- o; n# \. S

  1. $ S2 m3 N8 S) V1 J% |& b
  2.         MODULE  ?cstartup  b* M0 n9 U! T
  3. & q% M9 F; v6 s
  4.         ;; Forward declaration of sections.
    " d, P+ b; ^4 m0 |
  5.         SECTION CSTACK:DATA:NOROOT(3)
    % x, Q" c7 m, H, p' n/ c, m3 v% ^

  6. + T& c$ i4 {* T
  7.         SECTION .intvec:CODE:NOROOT(2)
    0 n; ]5 P* x5 n3 g5 U
  8. ) ^  Q8 |3 o, v
  9.         EXTERN  __iar_program_start
    . M% h; |- R5 F& |0 i. r& S
  10.         EXTERN  SystemInit
    # S1 j2 h# _: q
  11.         PUBLIC  __vector_table
    4 M/ O+ Q6 J) j. ]: K* O" Z
  12. ) u: o% R$ c/ i& f
  13.         DATA
    / f- ^2 q$ V0 `
  14. __vector_table/ y. L- Q$ n( j8 o3 V
  15.         DCD     sfe(CSTACK)
    4 ^2 X1 j, [2 }$ O& k
  16.         DCD     Reset_Handler                     ; Reset Handler$ h8 h$ n! W* R! }- ^
  17. 1 z  \, ]& l  Y
  18.         DCD     NMI_Handler                       ; NMI Handler
复制代码

  [9 v& a4 G: F8 B定义了一个 CSTACK 的段,然后在启动代码中先声明这个段  v7 v! P0 T3 [
# O( @- [: L: H; X  k" k* R
定义 .intvec 段,中断向量独立在一个叫 .intvec 的段当中,这个段是 4字节对齐(2^2)所以用 DATA 来首先处理向量的入口地址为 4的倍数,然后放向量表
" |8 h6 i2 x$ _
& e& n- x6 M/ @* t  z. y; A) ODATA 进入DATA模式
: {- }5 _9 M" v! M' I" a/ e; p7 u$ \
DCD sfe(CSTACK) 通过 SFE 运算得到改段的结束地址(注意这个运算是在link的时候完成,链接文件为xxxx.icf,比如:stm32h750xx_flash.icf)7 D* k$ N! a5 a2 p- o
$ y  q3 a4 h, x: l
文件剩下为定义中断向量表。8 ?( X+ l" n3 @5 \5 v+ K& G, G; k

! T  i2 @6 Q9 T5 E$ z
  1. ;; Default interrupt handlers.
    7 J- A6 {7 ?& }
  2. ;;; _# C* v' a" b# b% y
  3.         THUMB
    - K  }; A/ q. {
  4.         PUBWEAK Reset_Handler  _. T# a$ E0 Q" s  i1 ?8 t; c9 a
  5.         SECTION .text:CODE:NOROOT:REORDER(2)
    2 u1 R' a. ?- H  e. w
  6. Reset_Handler
    3 r4 C# S5 e. T: `

  7. " U5 F( V! G$ M7 P
  8.         LDR     R0, =SystemInit
    6 w6 T5 U( Q# I
  9.         BLX     R00 O7 n+ u6 Z4 j' y& J* v
  10.         LDR     R0, =__iar_program_start& ]8 W% U6 K7 r6 e5 K  D/ I; V0 w
  11.         BX      R0* w. k* T. r) N4 j! a

  12. 3 a: T# l& Z8 v( `3 l8 U
  13.         PUBWEAK NMI_Handler0 ~$ @/ B% J2 X
  14.         SECTION .text:CODE:NOROOT:REORDER(1)
复制代码

7 G/ @+ T% U  o# uTHUMB 进入THUMB模式(THUMB-2指令集): C2 O/ X+ e5 M% \) n4 O7 f. ?5 J" g

2 i; |# s$ |0 W# F' g2 b9 D9 Y启动文件先使用PUBWEAK 指令声明Reset_Handler为弱定义
, l2 a0 f; W) @6 O( x% m
* [$ a8 z+ z0 NSECTION .text:CODE:NOROOT:REORDER(2) 从.text段开始( y0 b% s7 i+ Y/ M# \: g
" F" f4 T8 j8 j8 Z4 G, `
LDR R0, =SystemInit 将SystemInit指针地址赋值给R0
+ _# z6 ^1 w& Q, y7 d- [# E( k+ V' t) s& V9 j
SystemInit 函数一般由STM32 库提供,对于STM32 HAL库,该函数一般位于system_stm32h7xx.c文件中0 L- \9 ?3 ?' D* q+ M# x2 z
- T: k: V. m# r# [* R" N* f
20210114230836389.png
) ~! O$ F& y$ p0 D
# E" u; H% K2 a% e- z
  1. void SystemInit (void)
    $ M. ?$ l3 _' R- O6 B, \
  2. {
    " U3 d" u! x1 B  d1 \4 G5 w
  3. #if defined (DATA_IN_D2_SRAM)2 T9 b" g0 V- B) n, h
  4. __IO uint32_t tmpreg;
    , {8 \8 I8 x" ]1 n
  5. #endif /* DATA_IN_D2_SRAM */" }2 _% D9 j; }  ]
  6. 9 v3 O: U" U9 Z6 E6 Q
  7.   /* FPU settings ------------------------------------------------------------*/3 w) }9 J$ T( X, B7 y
  8.   #if (__FPU_PRESENT == 1) && (__FPU_USED == 1)0 t' i5 k6 ^2 V: Y
  9.     SCB->CPACR |= ((3UL << (10*2))|(3UL << (11*2)));  /* set CP10 and CP11 Full Access */. l3 J" `" q" ]1 {7 {# {. r
  10.   #endif& f/ f- `* A" j- p! q( H; M! Z
  11.   /* Reset the RCC clock configuration to the default reset state ------------*/
    ( \* y! B2 @3 k* P6 v
  12.   /* Set HSION bit */
    + g( H+ k6 R8 h: h3 x+ U5 }5 b
  13.   RCC->CR |= RCC_CR_HSION;
    , U+ V- y( B# x3 E; Y- c

  14. ; H+ U. V. K$ i! H5 U5 @4 D" f
  15.   /* Reset CFGR register */  |. A' H. y. N5 I( S; \  J
  16.   RCC->CFGR = 0x00000000;
    8 l" n9 `4 I8 ?$ O
  17. ......* ^$ O, t, c/ z& d0 n! ~8 I$ ^
  18.   /* Configure the Vector Table location add offset address for cortex-M7 ------------------*/
    $ ]2 l6 U& e8 o3 F  ~2 A+ h7 ^
  19. #ifdef VECT_TAB_SRAM" z6 ]3 P. d7 F4 L% \
  20.   SCB->VTOR = D1_AXISRAM_BASE  | VECT_TAB_OFFSET; /* Vector Table Relocation in Internal AXI-RAM */7 L9 j. R& l& f% j7 d
  21. #else
    9 b# t4 t1 v( `" R" n- X+ X( _: f
  22.   SCB->VTOR = FLASH_BANK1_BASE | VECT_TAB_OFFSET; /* Vector Table Relocation in Internal FLASH */
    ! q% z# \0 {4 K& V" V1 N" y# j- M  V
  23. #endif
    8 @1 h7 g" B. {" N! i

  24. ' B$ I& C. L8 q4 O9 j: X5 d
  25. #endif /*DUAL_CORE && CORE_CM4*/
    8 W: Z! Z& t. t/ H( j2 c( D& U

  26. $ `6 `% a) I$ N+ A" i$ [) l; N& ~
  27. }
复制代码

! _, |; W5 v0 I8 C* e) ]SystemInit 函数完成系统时钟、RAM、中断向量表地址的初始化。
  @$ D( Q. p! N- o7 T4 V% |
6 w% A7 _2 B" _9 J1 w
  1. BLX     R0 跳转到*R0*中的地址,执行SystemInit 并返回
复制代码
  1. LDR     R0, =__iar_program_start //将__iar_program_start地址赋值给R0
复制代码
7 v* v* p( I+ r5 @: U
__iar_program_start 函数一般都IAR系统提供,,我们可以在IAR工程中Option进行修改. T; E- C9 }& D* d$ o
+ i* _' V8 L# ]' R* y! F
如果想具体了解__iar_program_start干了那些事情,可以参考《在main()之前,IAR都做了啥?》; n* \0 i0 w. _0 [' I

4 l' h8 G, T2 U& Q$ I# V) D" U启动文件主要完成如下工作,即程序执行过程:6 V1 b# L  v8 W' v5 r* w
6 F5 G" ~! Y; v8 N" e" R9 \
- 设置堆栈指针SP = __initial_sp。
6 ?5 l  J$ F# r: F4 I/ w8 [2 r# C  F7 D3 S, o; m
- 设置PC指针 = Reset_Handler。. |- j" [1 R$ l. z
# j( I/ y" w# R
- 设置中断向量表。
6 Q; n5 X/ m, q3 e, J4 @1 j( K( E5 j
$ |1 M( R; k( O) q  \" b- 配置系统时钟。, P) C# I8 e1 w6 x1 r* a
# M. g- m9 y& ^6 |0 B/ w
- 配置外部SRAM/SDRAM用于程序变量等数据存储(这是可选的)。
) D5 ^) j: E4 F- y; [7 G8 [, O% f* y0 I
- 跳转到C库中的 __main ,最终会调用用户程序的main()函数。
% V3 b* x$ d+ R# y; q4 Z% H! l
+ R1 r1 ^* w' c7 E5 Y2.XIP技术
1 a1 \$ l3 {+ S/ G5 b" \. iXIP,executed in place,本地执行。操作系统采用这种系统,可以不用将内核或执行代码拷贝到内存,而直接在代码的存储空间直接运行。采用这样的技术既可以节省可用内存又可以减少加载的时间。应用程序可以直接在flash闪存内运行,不必再把代码读到系统RAM中。flash内执行是指nor flash 不需要初始化,可以直接在flash内执行代码。但往往只执行部分代码,比如初始化RAM.比如在arm处理器中,Nor flash就存放了引导系统启动的Bootloader,不过大小比较小(仅2M空间)。
. Z( ^- Y7 W; V; x; U
20210114225737419.png
7 D) B% ]0 s, z

5 h# ]0 X- `* l  C+ H" ]$ ^1 K& f但是,Flash的存储器访问周期要比RAM大得多,在使用XIP技 术后可能会降低程序的运行速度,不过由于CPU的指令预取机制以及Cache机制,实际使用起来并不会明显降低应用程序的运行速度。3 e: e: l3 {9 v! a" N

7 u% g$ m$ p$ ?1 d; H3 P. u( I7 _# j
20210114225835865.png

$ Q1 |; d4 o2 p
5 @6 Q& h1 D& |. [& G4 K而右边的图,是针对Nor Flash的,这个很明显,CPU可以像读内存一样,直接跟Nor flash交互,即可以直接从Nor Flash中取指令,然后交给译码模块和执行模块进行执行,可以说,相比较Nand flash,Nor flash的操作对于CPU来说,简直就像是面对面一样。! {3 O! {# c: P/ T0 ~6 ?. ?

* {, P0 i9 W4 D- q' u  ?6 p' P/ w- n进一步, 为什么Nor Flash可以实现XIP,而Nand flash就不行呢?5 K8 y2 T5 O' g" G8 c# q: U

% o: k3 M. m' a- G' \4 j) r有一个概念:嵌入式系统中代码的执行方式:
! g# ]6 D) _% e  N$ @: v9 N9 }# u1 Y
(1)完全映射:嵌入式系统程序运行时,将所有代码从非易失存储器(Flash、ROM等)复制到RAM中运行。$ W) ~% X1 P; ?, n6 _
* M: i, u2 {% M1 n
(2)按需分页:只复制部分代码到RAM中,这种方法对RAM中的页进行导入/导出管理,如果访问位于虚存中但不在物理RAM中会产生页错位,这时才将代码和数据映射到RAM中。9 p/ W. K& A0 i) ]" v) d

! q: p" T; b% k2 L0 a! y" o(3)XIP:在系统启动时,不将代码复制到RAM,而是直接在非易失性存储位置执行,RAM中只存放需要不断变化的数据部分,如下图
/ _' I# i+ }" h% `
( d" I1 R( w9 m% Y
20210114225911954.png
. ~* W/ R9 c5 N$ J% [
' |. ?  m) X/ y. q; ^! q4 Z1 A9 ^
如果非易失性存储器(Flash)的读取速度与RAM相近,则XIP可以节省复制和解压的时间,Nor flash和rom的读取速度比较看(约100ns),比较适合XIP,而Nand flash的读取操作是基于扇区的,速度相对很慢(us级),因此不适合实现XIP系统,不过Nand flash的写速度比Nor的快,更适合做存储和下载系统。6 E+ ~. H. Q- U0 q0 |

% t7 T' _1 N% S) k) o解释二:* D/ W" \. L9 F2 q
两种芯片的结构不同
3 |- Q2 M8 P- O9 \; WNOR flash之所以可以片内执行,就是因为他符合CPU去指令译码执行的要求。CPU送一个地址出来,Nor flash就能给出一个数据让CPU执行,中间不需要额外的处理操作。5 h% h4 U/ H2 N" F% f3 J
NAND flash不一样是因为nand flash有地址,数据,命令共用IO口的问题,cpu把地址发出来之后,并不能直接得到数据,还需要控制线的操作才能完成。就是他没有专用的SRAM接口。7 R* T2 A& S  `/ u! d" _
6 v8 g$ ?8 M0 p
解释三:$ v8 M% j/ P$ `' ?1 l9 T) `: w' p
芯片内执行主要是是看芯片可不可以线性存储代码(假如硬件支持芯片接口),只要能保证芯片的存储空间是线性的(也就是无坏块),都可以片上执行,在读取Flash时候,容易出现“位翻转(bitconvert),在Flash的位翻转(一个bit位发生翻转)现象上,NAND的出现几率要比NorFlash大得多。这个问题在Flash存储关键文件时是致命的,所以在使用NandFlash时建议同时使用EDC/ECC等校验算法。 ”5 I, x$ B: ^: ?8 O: v9 `+ {7 w; q
, i: Q/ C9 \* ?! i- `4 Q( V
但是,如果能保证不出错,也还是可以进行XIP,可以在其上执行代码的:8 G4 x3 V% e0 O  w( q& d
“所谓XIP,就是CODE是在FLASH上直接运行. NANDFLASH只是不适合做XIP,但并不是不能做XIP“& A5 [0 Z: ]) K( b, r' l
要一段CODE能够正确的运行,要保证它的CODE是连续的,正确的.
0 V9 a( D) \, Q$ |1 k  s) ]由于一些电气特性的原因,NOR FLASH能够做到这一点,不存在坏道或坏块,所以能够做XIP.. a! B  h1 _5 j! h3 m) B
而对于NAND FLASH, 它只保证它的BLOCK 0是好的,其他的块并不保证,虽然出错的几率比较低,但还是有出错的可能,所以CODE可能无法连续正确地执行.
! L% @$ G9 f, T' w" v
$ s8 S' e% p- b% _+ ~; d# T8 x但只要你有额外的保障措施,比如说在执行CODE之前去做一次ECC校验,来确保CODE是连续正确的.那你也可以做XIP. 有人这么做了,而且也证明是成功的/ b3 r( f% v- K; d" S7 W0 x9 Z
0 D8 E4 A! K" v6 M6 G5 U; u
由于芯片外挂的是W25Q16 为NOR flash,支持XIP,并且STM32H7系列芯片QSPI FLASH支持内存映射模式。STM32H7芯片可以将W25Q16芯片内的应用程序映射到地址0x90000000,虚拟为芯片内部内存进行执行。由于产品为了节省成本没有采用QSPI 双flash模式,执行效率会再降低一点。经过测试从bootloader跳转到应用程序,起来需要经过约2.6s左右。具体中断执行效率还需进行进一步测试。) y, A( e( G& F( ^' i
QSPI执行速度对比图/ h: c1 Y& J2 X1 s4 ^) L* h; b. v

9 {( R( `3 b4 I$ r' u
20210114230031779.png
& l2 C3 C. v: _  i
8 |8 o! H) Y- `; ^+ I& Z+ o
3.启动文件修改
* h; }2 d4 U( a对于bootloader程序,程序再芯片内部128k flash中执行,程序默认启动执行地址为0x8000000,无需修改IAR 的link链接配置文件。
. e6 v5 j7 S# l% d5 ]; P对于应用程序,需将IAR 的link链接配置文件****.icf文件中的__ICFEDIT_intvec_start__ 地址,__ICFEDIT_region_ROM_start__地址,__ICFEDIT_region_ROM_end__地址进行修改,具体可以通过IAR options->Linker->Config,里面进行修改# Z4 a* u$ z6 S  ~5 S
) N* |# R) Z" k) a. p
20210114225558558.png

" h1 I$ k# Y: J) `* |9 Q' N: r$ @& A4 Q
20210114225618875.png
8 Y# l, [3 W1 ?# {6 b! l
5 b4 O8 Y. W4 `9 ]5 F/ b
修改完成后,查看IAR配置后的icf文件,具体内容如下
! }3 J7 a" P+ V. \* \3 B9 J
6 Y* l) i: p5 {9 k$ {7 h+ Z) E9 {
  1. /*###ICF### Section handled by ICF editor, don't touch! ****/
    ; x3 @! C6 I/ P( F0 V# J
  2. /*-Editor annotation file-*/
    . C* p4 x; z! f) C  x+ \6 n6 ~
  3. /* IcfEditorFile="$TOOLKIT_DIR$\config\ide\IcfEditor\cortex_v1_0.xml" */
    7 Q3 A' D7 l# E5 X6 ~
  4. /*-Specials-*/& t1 D7 L1 G0 F* ~, Y# }
  5. define symbol __ICFEDIT_intvec_start__ = 0x90000000;: z1 w# G! n# j3 {5 {  V) H
  6. /*-Memory Regions-*/8 S2 m# e( e$ Y
  7. define symbol __ICFEDIT_region_ROM_start__     = 0x90000000;; L. I% V: c8 i; c
  8. define symbol __ICFEDIT_region_ROM_end__       = 0x90100000;  T( z, m+ U+ `7 ?5 }$ O
  9. define symbol __ICFEDIT_region_RAM_start__     = 0x20000000;% _: y* Q% S) K
  10. define symbol __ICFEDIT_region_RAM_end__       = 0x2001FFFF;/ D3 W6 M* ]# e7 \/ y) H" E+ z
  11. define symbol __ICFEDIT_region_ITCMRAM_start__ = 0x00000000;0 F& @/ Q2 m/ _8 Z- c7 g/ [
  12. define symbol __ICFEDIT_region_ITCMRAM_end__   = 0x0000FFFF;
复制代码
  A' T1 C) v; c5 D! [/ s1 O$ y3 x
4.bootloader程序与应用程序设计! r% N3 S$ w2 @8 e
对于bootloader而言,主要的任务有一下点:
. B2 E2 _6 j" W, G3 r( i& f) v5 c4 H* `* N- Z
1、接受和处理上位机下发的更新程序,并将其写入到外部flash备份区  r' R. s# C, V

8 u2 w8 Z3 I. \& T9 q2、对更新到外部备份区的程序拷贝到应用区
. R* f6 M0 L6 T! r% s
' R+ \2 h8 g( q& n3、初始化QSPI为内存映射模式,引导程序启动,跳转到应用程序& O, W5 V/ ?8 ^2 I# a0 K: r* \/ L

' Q) u/ w% ]/ `' Z/ M: u5 u- Z
2021011423012391.png
3 f: u4 G1 o- p4 _* u

# ~/ x* R' m; \0 w: l
20210114230131258.png
( A( B+ ^" E, @

# ~% @3 E, r( a3 P我们将STM32H7整个内部128k flash分配为bootloader程序存储区。装置上电,首先从内部flash 地址0x8000000进行启动,具体执行流程如下图所示:
# e2 f7 W5 {, q- d( W5 g3 w% R7 B2 d! O* B# R
20210114230154821.png

- A1 m2 P. a0 f9 |/ ?( I) u$ R
) Y- ~) H8 P& P8 F" Y
7 Z; h2 O9 U4 w. w. K# L& i* r2 A$ s# ?- k9 i; b2 B7 i
; V/ J. U+ T* C9 ^, i4 _- f4 \

: [9 N& ]2 v; q9 e/ P4 d, O, H
收藏 评论0 发布时间:2021-12-24 18:00

举报

0个回答

所属标签

相似分享

官网相关资源

关于
我们是谁
投资者关系
意法半导体可持续发展举措
创新与技术
意法半导体官网
联系我们
联系ST分支机构
寻找销售人员和分销渠道
社区
媒体中心
活动与培训
隐私策略
隐私策略
Cookies管理
行使您的权利
官方最新发布
STM32N6 AI生态系统
STM32MCU,MPU高性能GUI
ST ACEPACK电源模块
意法半导体生物传感器
STM32Cube扩展软件包
关注我们
st-img 微信公众号
st-img 手机版