你的浏览器版本过低,可能导致网站不能正常访问!
为了你能正常使用网站功能,请使用这些浏览器。

【经验分享】STM32H7 启动过程及bootloader跳转详解

[复制链接]
STMCU小助手 发布时间:2021-12-24 18:00
最近公司开发的一个项目使用到STM32H7系列芯片,由于该系列芯片内部flash只有128k,为了方便产品的远程升级,需要开发对应的升级协议及bootloader引导程序。由于片内flash容量不够,需要采用外挂flash的方式存储应用程序,片内flash单纯作为bootloader引导程序存储空间。为了节省成本采用单QSPI flash外挂BANK2作为应用程序外部存储。
! E, I+ V- j# ?0 U% _" C2 d' l6 q( l
20210114225354296.png

7 B) v3 v3 T4 {6 k9 ^" Y* p/ c3 ^3 f: ]
1.STM32H7启动流程
3 m! `7 E* S+ d8 t  ~( V' XIAR工程建立后,系统默认生成的启动文件为startup_stm32h750xx.s,默认生成工程一般在EWARM目录下
( c4 M6 S  ?4 C" G6 k& j3 B" W8 _6 @4 ]6 s% d4 T2 J

  1. ; t2 J1 D( H- v# D% Y
  2.         MODULE  ?cstartup5 w( P5 x! x4 h9 p
  3. ) c% f7 i  w/ H
  4.         ;; Forward declaration of sections.5 W+ S6 ^/ A; w- V+ Y: U
  5.         SECTION CSTACK:DATA:NOROOT(3)
    4 o' @# o/ M( Q
  6. 0 y1 [  o( e& m6 \( y/ x6 x7 m
  7.         SECTION .intvec:CODE:NOROOT(2)4 z) q7 K1 `2 z% x! n

  8. 0 \0 }' ?9 V6 z
  9.         EXTERN  __iar_program_start
    " g/ S0 E: L+ g* s; D& m, f
  10.         EXTERN  SystemInit: `- i! y, @! E8 R7 N: A1 _
  11.         PUBLIC  __vector_table
    % P3 E6 p( M* p

  12. 9 m9 T5 A/ Y/ @
  13.         DATA
    : X& @- ?2 G+ L
  14. __vector_table# E1 p. X" A8 f1 u
  15.         DCD     sfe(CSTACK)
    7 t' C) ?+ N& j4 s
  16.         DCD     Reset_Handler                     ; Reset Handler! l8 B+ l0 u4 h$ Q8 X: K) W

  17. * S" q  f( b8 t* a7 d' s
  18.         DCD     NMI_Handler                       ; NMI Handler
复制代码
6 D, q, j7 ^/ O! s8 s
定义了一个 CSTACK 的段,然后在启动代码中先声明这个段
! z. |+ H) \: q) J; }. L4 Z; }9 O" f
定义 .intvec 段,中断向量独立在一个叫 .intvec 的段当中,这个段是 4字节对齐(2^2)所以用 DATA 来首先处理向量的入口地址为 4的倍数,然后放向量表+ e( [, p) i% e) K4 q  g

) Z: z0 |/ H! s) ~3 lDATA 进入DATA模式
( b1 i3 [$ k# ]* _7 r! ?2 g: o* H- Z  c  v7 C/ _
DCD sfe(CSTACK) 通过 SFE 运算得到改段的结束地址(注意这个运算是在link的时候完成,链接文件为xxxx.icf,比如:stm32h750xx_flash.icf)) u. I  L) F+ b/ V

, E3 T' |7 W' N' T文件剩下为定义中断向量表。
1 l& g! n. L2 _7 a4 E: x( R7 d5 j) ?$ X+ C9 q
  1. ;; Default interrupt handlers.: ^9 I6 L$ \4 w& r* T: @
  2. ;;
    1 a3 V3 Y, q- J: A* `( O
  3.         THUMB. j- W) h/ a* l1 |. ^9 s9 M
  4.         PUBWEAK Reset_Handler5 K# g$ d2 A+ L7 v
  5.         SECTION .text:CODE:NOROOT:REORDER(2)
    $ E0 q9 A; N) C, [+ J( J
  6. Reset_Handler
    / [, W" m3 g7 f* Y) w7 ^
  7.   D) M4 |% T; \( [
  8.         LDR     R0, =SystemInit5 p( N1 X5 x; P8 E) z& I
  9.         BLX     R0
    8 U8 @+ o, l! l0 u1 S0 E
  10.         LDR     R0, =__iar_program_start
    * ~+ s4 W* n: B% u
  11.         BX      R0- n) B2 P5 D& S8 g0 y
  12. 4 y7 o2 B+ O( J( ?* A* T
  13.         PUBWEAK NMI_Handler
    ! u4 z: m7 V# P: o  c, L
  14.         SECTION .text:CODE:NOROOT:REORDER(1)
复制代码

! z& X, p. U$ C/ D* Q3 \6 HTHUMB 进入THUMB模式(THUMB-2指令集)
9 _- g* d# o! q2 L( ^& A9 b7 f' Z1 d9 ^8 z" ^
启动文件先使用PUBWEAK 指令声明Reset_Handler为弱定义/ _% H; H& P+ Z8 W% R$ v. M

  Q8 I- I4 V. e. v' A* J5 WSECTION .text:CODE:NOROOT:REORDER(2) 从.text段开始! B$ h1 o! r, B* R" j9 T4 `
1 a- e4 c$ ~; i5 j+ q7 t  J. ^
LDR R0, =SystemInit 将SystemInit指针地址赋值给R06 A; `" B) Z* m9 h

) W2 r: I  o( _: s. p. V; |  Z/ WSystemInit 函数一般由STM32 库提供,对于STM32 HAL库,该函数一般位于system_stm32h7xx.c文件中; E& m2 K- {' I; J

2 q+ S; T! ?  `) l" P' n; x
20210114230836389.png
6 G8 p, `/ j2 ?; n

4 @4 ^) k2 t1 Y3 z% p8 U. F8 r
  1. void SystemInit (void)
    6 g* c% B  n) C; s  b9 h$ {
  2. {, Y* l: {$ e: O& }' A- D+ |
  3. #if defined (DATA_IN_D2_SRAM)4 P0 }; O0 A+ L% z" h! z: K9 Y$ S" P% E
  4. __IO uint32_t tmpreg;$ p" \1 ^- P/ ?+ X: m' M* }$ g
  5. #endif /* DATA_IN_D2_SRAM */
    & y! ?+ L/ Y: y( l8 O: Z

  6. ! G  l* }- m1 |! D9 P
  7.   /* FPU settings ------------------------------------------------------------*/
    $ q* C. ]8 E3 Q, Y; E% k) _) t
  8.   #if (__FPU_PRESENT == 1) && (__FPU_USED == 1)4 \; J0 ^9 n' o4 {+ u0 X+ L
  9.     SCB->CPACR |= ((3UL << (10*2))|(3UL << (11*2)));  /* set CP10 and CP11 Full Access */
    ( R. [7 V: Z5 D
  10.   #endif
    0 D9 z/ N% A8 _3 P
  11.   /* Reset the RCC clock configuration to the default reset state ------------*/6 h2 m2 t' G& d' \" F7 R; x5 `
  12.   /* Set HSION bit */
    + I" u' t' q% N4 J8 D/ t2 {
  13.   RCC->CR |= RCC_CR_HSION;) K) S+ h& y" I
  14. 3 z4 m5 z$ n8 t& K
  15.   /* Reset CFGR register */
    - L% W6 @3 i7 e/ L# X+ [
  16.   RCC->CFGR = 0x00000000;
    * O( d6 [4 R) a* m3 s5 V
  17. ......5 I% u, F" ?3 h- |7 E6 w  p
  18.   /* Configure the Vector Table location add offset address for cortex-M7 ------------------*/0 o8 n$ C  [  u) x
  19. #ifdef VECT_TAB_SRAM% Z- Y/ z; N3 j8 [! w
  20.   SCB->VTOR = D1_AXISRAM_BASE  | VECT_TAB_OFFSET; /* Vector Table Relocation in Internal AXI-RAM */' |7 e  T1 r; v* n) |% |/ |
  21. #else
    8 ~! F0 g0 H9 G( T: }! K
  22.   SCB->VTOR = FLASH_BANK1_BASE | VECT_TAB_OFFSET; /* Vector Table Relocation in Internal FLASH */" }& N! E% b- l! V2 t0 |
  23. #endif
    ( [# H. a+ M3 }

  24. % I7 a1 R" K1 L3 }2 f& x* ~
  25. #endif /*DUAL_CORE && CORE_CM4*/
    - L+ [& j, r; o

  26. 4 K9 N" m. B2 y2 _+ C
  27. }
复制代码
7 S& Z" o$ o: i( T2 `
SystemInit 函数完成系统时钟、RAM、中断向量表地址的初始化。+ ~/ ]6 V; m: W% I0 _# ~

/ E- j! t& n, _9 B
  1. BLX     R0 跳转到*R0*中的地址,执行SystemInit 并返回
复制代码
  1. LDR     R0, =__iar_program_start //将__iar_program_start地址赋值给R0
复制代码

! S% W0 D7 }" a$ b6 L0 T__iar_program_start 函数一般都IAR系统提供,,我们可以在IAR工程中Option进行修改1 p8 E3 r! Q4 u7 w2 Y
/ O' h/ g1 l/ ~! D
如果想具体了解__iar_program_start干了那些事情,可以参考《在main()之前,IAR都做了啥?》1 D2 H' b% s9 @; d5 `2 U

) t5 E) D4 T( f! u  A5 K" j启动文件主要完成如下工作,即程序执行过程:
, D8 N5 Q8 X1 ]
* A& a) w( U, g! b( ]! l+ z1 x- l) l8 X- 设置堆栈指针SP = __initial_sp。% |& }  I6 i1 K* A5 @

) y) _0 n  p; n" \6 b- 设置PC指针 = Reset_Handler。
/ d1 q/ S( X# s8 `- R5 ?3 J' m1 q3 [8 r& o+ H# O
- 设置中断向量表。! n4 ^8 h" A& Q0 `% [2 Q% g# O/ X
" A: I1 w" P$ _' Y7 t
- 配置系统时钟。
: n4 U* }# G4 D6 I3 @( c4 x* ~& h
4 @1 ^* [; g2 |- 配置外部SRAM/SDRAM用于程序变量等数据存储(这是可选的)。
7 d1 _, Z9 r! ?- ^% A2 p+ }! ~9 P5 _' ^. O
- 跳转到C库中的 __main ,最终会调用用户程序的main()函数。: ]2 v2 a: a, J3 Q0 E) z3 g; X' m

# M! t# `3 Q4 R2 I5 E2.XIP技术
9 O" B+ O$ L6 _' ZXIP,executed in place,本地执行。操作系统采用这种系统,可以不用将内核或执行代码拷贝到内存,而直接在代码的存储空间直接运行。采用这样的技术既可以节省可用内存又可以减少加载的时间。应用程序可以直接在flash闪存内运行,不必再把代码读到系统RAM中。flash内执行是指nor flash 不需要初始化,可以直接在flash内执行代码。但往往只执行部分代码,比如初始化RAM.比如在arm处理器中,Nor flash就存放了引导系统启动的Bootloader,不过大小比较小(仅2M空间)。
; R) v1 o8 o4 |; P
20210114225737419.png

& W7 ]( d: z' }/ d( _. E7 ^3 o+ J8 |, w7 s
但是,Flash的存储器访问周期要比RAM大得多,在使用XIP技 术后可能会降低程序的运行速度,不过由于CPU的指令预取机制以及Cache机制,实际使用起来并不会明显降低应用程序的运行速度。3 ]8 Q# t: I! O; \5 I! z4 S
% t4 H. G% O9 }
20210114225835865.png

0 I: }1 x$ P6 f  B) w! ?
6 S2 y! c  C( P9 {1 F- ]& m而右边的图,是针对Nor Flash的,这个很明显,CPU可以像读内存一样,直接跟Nor flash交互,即可以直接从Nor Flash中取指令,然后交给译码模块和执行模块进行执行,可以说,相比较Nand flash,Nor flash的操作对于CPU来说,简直就像是面对面一样。1 p( [: R- e; }4 n
; G2 g9 i1 @+ u/ @) V% I. R# S
进一步, 为什么Nor Flash可以实现XIP,而Nand flash就不行呢?
: F1 \! t: }. e7 _3 w, i9 M$ T3 T# x3 k  I2 N$ G5 d, ]
有一个概念:嵌入式系统中代码的执行方式:
. p6 V$ S/ Z0 e4 n5 o5 ~) e( D5 g: z& |+ o1 ]; F
(1)完全映射:嵌入式系统程序运行时,将所有代码从非易失存储器(Flash、ROM等)复制到RAM中运行。
, Y, X" r" M- g% L0 k/ a
4 T' C- [) }! ]7 M& ~(2)按需分页:只复制部分代码到RAM中,这种方法对RAM中的页进行导入/导出管理,如果访问位于虚存中但不在物理RAM中会产生页错位,这时才将代码和数据映射到RAM中。
2 d7 ~% p( d9 v- x& \8 M1 ?9 Z& ?. ]
(3)XIP:在系统启动时,不将代码复制到RAM,而是直接在非易失性存储位置执行,RAM中只存放需要不断变化的数据部分,如下图
4 I/ F+ C) F9 g9 _( X" z0 q; O8 p9 ]  b4 G! j
20210114225911954.png
4 ]+ N; Q+ i6 K

/ x3 @; h# S! P4 S如果非易失性存储器(Flash)的读取速度与RAM相近,则XIP可以节省复制和解压的时间,Nor flash和rom的读取速度比较看(约100ns),比较适合XIP,而Nand flash的读取操作是基于扇区的,速度相对很慢(us级),因此不适合实现XIP系统,不过Nand flash的写速度比Nor的快,更适合做存储和下载系统。
! ~  Q8 U  @6 }. i2 b6 C/ O; Q' z
+ O9 B) c: N. e解释二:8 u* q  Z: S+ }
两种芯片的结构不同5 \' o6 e  T# t9 V; V
NOR flash之所以可以片内执行,就是因为他符合CPU去指令译码执行的要求。CPU送一个地址出来,Nor flash就能给出一个数据让CPU执行,中间不需要额外的处理操作。- L, e/ H5 `/ k
NAND flash不一样是因为nand flash有地址,数据,命令共用IO口的问题,cpu把地址发出来之后,并不能直接得到数据,还需要控制线的操作才能完成。就是他没有专用的SRAM接口。1 }0 K$ G  m, M2 g7 }
7 r! I, d$ i# K6 W* E' ~( e3 K
解释三:
+ k0 m4 L* B0 ]" a4 ?! p芯片内执行主要是是看芯片可不可以线性存储代码(假如硬件支持芯片接口),只要能保证芯片的存储空间是线性的(也就是无坏块),都可以片上执行,在读取Flash时候,容易出现“位翻转(bitconvert),在Flash的位翻转(一个bit位发生翻转)现象上,NAND的出现几率要比NorFlash大得多。这个问题在Flash存储关键文件时是致命的,所以在使用NandFlash时建议同时使用EDC/ECC等校验算法。 ”4 s$ K  ]* x: ~6 L/ o; q

& y2 U# y' c3 H但是,如果能保证不出错,也还是可以进行XIP,可以在其上执行代码的:
0 ]; C8 P% K" q& }9 `' z# t“所谓XIP,就是CODE是在FLASH上直接运行. NANDFLASH只是不适合做XIP,但并不是不能做XIP“! Q# K6 n  B( [  u
要一段CODE能够正确的运行,要保证它的CODE是连续的,正确的.- N. R. O% ^6 Q- j# \- g
由于一些电气特性的原因,NOR FLASH能够做到这一点,不存在坏道或坏块,所以能够做XIP.
2 j3 E6 @4 K+ w* r! f* H( v而对于NAND FLASH, 它只保证它的BLOCK 0是好的,其他的块并不保证,虽然出错的几率比较低,但还是有出错的可能,所以CODE可能无法连续正确地执行.
6 g1 a5 [: f4 ]9 }8 @- I5 G+ u
; g( t9 t8 |/ e+ N: {" ^# M但只要你有额外的保障措施,比如说在执行CODE之前去做一次ECC校验,来确保CODE是连续正确的.那你也可以做XIP. 有人这么做了,而且也证明是成功的
% ]. v( K$ V6 Y' h: n* U  e! ]0 M  p2 |8 R. K
由于芯片外挂的是W25Q16 为NOR flash,支持XIP,并且STM32H7系列芯片QSPI FLASH支持内存映射模式。STM32H7芯片可以将W25Q16芯片内的应用程序映射到地址0x90000000,虚拟为芯片内部内存进行执行。由于产品为了节省成本没有采用QSPI 双flash模式,执行效率会再降低一点。经过测试从bootloader跳转到应用程序,起来需要经过约2.6s左右。具体中断执行效率还需进行进一步测试。) t+ K7 S' B" ?5 }& k' y0 V8 n
QSPI执行速度对比图8 n6 p: G: X9 D# T: p3 ?' z

6 d- ]& ]$ b! c6 ?, C+ c% O
20210114230031779.png
" {9 v1 |( U0 q" g" l
. B9 S( f9 x7 v; q2 U# D
3.启动文件修改
% _3 u, G0 z. n对于bootloader程序,程序再芯片内部128k flash中执行,程序默认启动执行地址为0x8000000,无需修改IAR 的link链接配置文件。$ R% L; N1 _* e- e! F% N
对于应用程序,需将IAR 的link链接配置文件****.icf文件中的__ICFEDIT_intvec_start__ 地址,__ICFEDIT_region_ROM_start__地址,__ICFEDIT_region_ROM_end__地址进行修改,具体可以通过IAR options->Linker->Config,里面进行修改. n# j) v+ \, ]" a( N) {
7 A6 J; w3 t+ X9 E; X  |' w
20210114225558558.png
! R5 E$ R7 T7 P. z: @& H
0 P% y/ c; y9 x+ |# P$ Y
20210114225618875.png

+ _4 I( g' |3 ]+ X$ T# h6 n/ V. I- Y# D, |/ X
修改完成后,查看IAR配置后的icf文件,具体内容如下& _  K1 a$ z8 r$ J! ~. F0 m/ c
+ f3 `8 ~3 e& C
  1. /*###ICF### Section handled by ICF editor, don't touch! ****/
    8 D* r$ K2 a& Z, |7 C( U* Z& Y7 l
  2. /*-Editor annotation file-*/0 s8 d9 v$ K6 ^- }) D; i
  3. /* IcfEditorFile="$TOOLKIT_DIR$\config\ide\IcfEditor\cortex_v1_0.xml" */
    ( |! u+ ^' G2 F
  4. /*-Specials-*// V4 d+ j& H+ S  f, v6 H
  5. define symbol __ICFEDIT_intvec_start__ = 0x90000000;& @4 a+ F  J9 P+ }3 U) N
  6. /*-Memory Regions-*/
    9 G6 ]" b- q! \
  7. define symbol __ICFEDIT_region_ROM_start__     = 0x90000000;1 ~+ b/ e7 W4 H7 N7 ]0 I6 [
  8. define symbol __ICFEDIT_region_ROM_end__       = 0x90100000;' q' m% u/ Y9 ~
  9. define symbol __ICFEDIT_region_RAM_start__     = 0x20000000;
    / W1 G. _$ u8 f
  10. define symbol __ICFEDIT_region_RAM_end__       = 0x2001FFFF;
    + J" t3 E9 B7 m7 R9 U
  11. define symbol __ICFEDIT_region_ITCMRAM_start__ = 0x00000000;
    ' S) h; X" Z0 {1 i5 g' U. {  W
  12. define symbol __ICFEDIT_region_ITCMRAM_end__   = 0x0000FFFF;
复制代码
5 S3 z/ O/ H6 U2 s5 N# q; e- n: K$ C
4.bootloader程序与应用程序设计3 u  G3 g4 r; m6 H& i& j. T
对于bootloader而言,主要的任务有一下点:
2 N; U2 g9 }2 j" [4 V6 n/ C4 F! L! {' i: Y
1、接受和处理上位机下发的更新程序,并将其写入到外部flash备份区
5 Y, n9 g2 S: G- I7 V0 V% {0 o% p$ ^# v) ]6 c
2、对更新到外部备份区的程序拷贝到应用区+ C4 K1 O2 x4 m+ H) R$ I

; C: e$ x2 `2 a4 j, u: s1 z4 Q0 b3、初始化QSPI为内存映射模式,引导程序启动,跳转到应用程序
4 H9 r% W6 D# |2 j+ f0 Z8 x! _5 c- C6 l; ?) [% F, J( {
2021011423012391.png

1 c/ c! c. N0 o7 \/ D1 ]( |. \+ q% G* w* c
20210114230131258.png
. y2 m; w" V; |; j) A& S

$ @. I7 a6 ~$ q# g# O$ W5 J+ G我们将STM32H7整个内部128k flash分配为bootloader程序存储区。装置上电,首先从内部flash 地址0x8000000进行启动,具体执行流程如下图所示:5 {9 S1 L0 h: W& P4 V# u) g
9 g5 O5 j+ [. R- V, y( U& V
20210114230154821.png
9 @: P( G  j# W/ v  R

4 e" y7 _1 O7 ?/ \. b/ n' k& p- [/ l) Q
' d; p/ ^7 X8 Z, W' v
6 m+ c0 K6 ^9 a, E' B
7 l6 P+ y% ?8 @- {( T" x
收藏 评论0 发布时间:2021-12-24 18:00

举报

0个回答

所属标签

相似分享

官网相关资源

关于
我们是谁
投资者关系
意法半导体可持续发展举措
创新与技术
意法半导体官网
联系我们
联系ST分支机构
寻找销售人员和分销渠道
社区
媒体中心
活动与培训
隐私策略
隐私策略
Cookies管理
行使您的权利
官方最新发布
STM32N6 AI生态系统
STM32MCU,MPU高性能GUI
ST ACEPACK电源模块
意法半导体生物传感器
STM32Cube扩展软件包
关注我们
st-img 微信公众号
st-img 手机版