你的浏览器版本过低,可能导致网站不能正常访问!
为了你能正常使用网站功能,请使用这些浏览器。

Keil MDK 编译器 AC5 和 AC6 优化选项重要内容和区别

[复制链接]
STMCU-管管 发布时间:2020-12-3 12:43
Keil MDK 编译器 AC5 和 AC6 优化选项重要内容和区别
/ r/ D4 f+ k( A' Q

. R' P$ b7 k+ B7 C使用过Keil MDK (Arm Compiler 6)编译器V6版本的读者应该发现了一个问题,V6版本速度比V5版本编译速度快很多。
: l4 R( e6 j6 B( z1 m! _
' m3 @% T8 _6 k7 w- y

, p; A) \& S) @( O7 v(说明:是V6版本编译器,不是V6版本MDK)
+ I$ Q  y  p) R. q8 I/ k0 ~
8 ?4 p0 |8 U4 |0 _1 n那你发现了Arm Compiler V6和V5有什么区别吗? 集成在MDK中的优化选项又有哪些区别?# K5 \, e! u( `5 {; D2 l

, h# H" k' b: G2 H8 v0 q一、关于Arm Compiler 6
" G5 Y) j" S. E) i% Z+ _) i$ R/ }' Y/ a" a( Q! V% G8 k# V
/ K1 i# m9 s2 i
Arm Compiler 6(简称AC6)是用于Arm处理器的编译工具链,目前最新版本:Arm Compiler  V6.14。: w3 s$ w0 A8 ~  H2 `3 y
, q5 W4 n' f1 L7 g) a
6 x: M% n( s1 k5 ?1 h! Y
用于编译Coterx-M处理器的编译器很多,Arm Compiler就是其中一个,常用于Keil MDK、 Arm Development Studio(DS-5)中,还可用作独立工具链安装。% a" L, q. _9 L; k; z0 O% H' {
11.png
当然,除了Arm Compiler,针对Coterx-M的编译器还有很多,比如:GNU Compiler、 IAR Compiler、 CCS Compiler等。
6 T& w- I, j0 w% w  D  H; ?& g$ a# {" e* R
Arm Compiler 6工具链包括:
6 S+ X& S( s9 v% h- `; Z$ L' {armclang:基于LLVM和Clang技术的编译器和集成汇编器。* i7 R3 b, B4 z  N, V
armasm:armasm语法汇编代码的旧版汇编程序。将armclang集成汇编程序用于所有新的汇编文件。
' |( d( j' x* J9 b4 [armar:使ELF目标文件集可以一起收集。
0 X. W8 n/ N6 l8 V0 harmlink:将对象和库组合在一起以生成可执行文件的链接器。& M. j( ^& O7 j# J. t
fromelf:镜像转换程序和反汇编程序。6 h, Q- b: @9 a% {/ {, E( H' u
Arm C libraries:嵌入式系统的运行时支持库。
# v; g! ?, \# Y& G1 P* Q2 M$ `Arm C ++libraries:基于LLVM libc++项目的库。8 k2 T, l+ P- o  G* D. W4 P% m" C* b7 v
12.png
ARM Compiler 5(和更早版本)使用armcc编译器,而ARM Compiler 6将armcc替换为armclang,armclang基于LLVM,它具有不同的命令行参数、指令等,因此算是一个新的编译器。1 D/ r" D  |9 Q8 P& A: M% K

) i( x, _* S: P5 O7 F更多参考内容和地址:
0 S8 I3 Z. ?% Z& [; I5 D编译器Clang会代替GCC吗?4 e9 q. o$ o+ f2 @' e
7 g# z4 U. f$ g4 f5 G- U2 I6 F" C

: w1 V! P6 W2 p3 y" T, ?http://www2.keil.com/mdk5/compiler/6/
5 T: W8 w; Z# c2 `https://developer.arm.com/tools-and-software/embedded/arm-compiler/downloads/version-6- v& O; A) L! v/ h2 F

) O1 K$ ^# a) G" E$ a
! o% j- h' x+ D% K  ^4 M7 d0 J
二、AC5和AC6
/ \$ l& x; d0 U  ?! ]4 \: r, M' M" K0 w" U2 {4 S
+ m+ P+ _, }( u( u* j
Arm Compiler 5(AC5)算是用的比较多的一代编译器,在Keil MDK V4版本及V5早期的版本都是使用AC5。
+ d$ }" F, ?% u2 O5 m: T7 E
- X, }* P  A( w/ L5 u2 W% f- |在2015年的时候,AC6发布了,并在随后新版本的MDK中集成了AC6,直到现在最新版本的MDK集成了AC6.13(可以修改版本):2 Z) _$ h3 ~( I5 U4 ?# |
13.png
AC6相比AC5优势
9 x" |# v1 e6 V; ^) |9 Q% }$ S* b% Q8 v/ S; L

' s/ }* M; ^0 |8 O3 iAC6相比之前版本的编译器做了很多改动,大家最为直观的感受就是编译速度提高了很多,还有代码大小。% r$ z1 b' d+ x4 f. f2 j8 `
% m' p% o0 _# R5 Z
当然除了速度和大小,还有其他很多优势,比如:支持C ++ 14标准、使用TrustZone for Armv8-M为设备创建安全和非安全代码、兼容基于GCC创建的源代码,也就是GCC可以编译的源码它也能编译。. \6 S  H/ J  R4 ^! |
3 b+ b/ m, f* z( i% W
这是官方提供的代码大小对比:
0 J/ f' y1 p/ G2 Q
14.png
AC5升级到AC62 n6 @. n9 r% {& S
+ ]9 p: q8 M3 E& w
+ u8 p: Z' d7 o
AC5和AC6是不同的编译器,兼容性方面还是有差异,需要迁移。这个迁移过程官方提供有文档:
0 k% s  Q3 O6 p* p4 n$ l9 E6 j( H: o
; G( ]+ R) }! H5 _

( f5 H9 a( ~: e! bhttps://developer.arm.com/docs/100068/0614/migrating-from-arm-compiler-5-to-arm-compiler-6
2 }& W5 J: q+ `) ?* d
4 r+ S2 z8 a5 x当然,也可以参看我之前分享的文章:, L( \& t2 x0 r$ t* [* z" Y

: r$ Q" \) w8 m/ z( i# [
  B) _2 ?* f5 r
MDK-ARM编译器从V5升级到V6需要做哪些工作?
1 i6 L  e  ~. i/ G
$ M/ R9 X  T3 A! ?三、Keil MDK 优化选项. q+ P, s' M9 B( g% t

4 U; b+ \" o: y. t+ o2 h

7 l. ~* k: ]: a! y在Keil MDK中,相比AC5,使用AC6会增加几个优化选项:代码大小、速度、平衡等。0 K4 i, F) n( c5 Q  U
) F/ H# H+ E  y1 k' Q- D: m. b
优化选项包含:
* K( `0 ^& G& `$ |6 @
15.png
优化级别-O0: q( C6 P5 J) k) m% c4 E& k$ a! {

9 U" E4 }. U5 w. N

# Y3 r* }0 o7 x) B% X) E-O0禁用所有优化。此优化级别是默认设置。使用-O0 结果可以加快编译和构建时间,但比其他优化级别生成的代码要慢。与-O0其他优化级别相比,代码大小和堆栈使用率明显更高 。生成的代码与源代码紧密相关,但是生成的代码量更大,包括无用的代码。
! K1 c" G; I2 i8 w5 X4 J& e7 S
8 h; z) A* c8 d; G/ G
2 B  ~$ Y: z7 Q
优化级别-O1/ k: h" v, F4 U9 G. y3 G3 @
-O1在编译器中启用核心优化。此优化级别提供了良好的调试体验,并具有比-O0更好的代码质量,堆栈使用率也提高了。Arm建议使用此选项以获得良好的调试体验。
8 Y/ M, N. U7 S, u* r7 O: R
$ w9 s  e' C- z3 o

# P3 F! M3 I# [! i: v' m/ s* A' ^-O1与-O0相比,使用时的区别是:: K+ f) |) R' s2 O* m
3 F- T- |/ n& S% y. \

8 D& |0 G7 g" }+ D: h$ _启用优化,这可能会降低调试信息的完整度。
# E1 g& A- e$ k9 G9 b+ f4 O
! h/ ]0 w0 O: J- ]- L( g
, r+ j& t& j* n
启用了内联和尾调用,这意味着回溯可能无法提供打开功能激活的堆栈。
4 ^' w" L. e% ^1 y
6 a6 u1 z& C% e3 d- c

7 U& P% q- W6 h" y4 o: Y不会调用没有使用,或没有预期调用的函数,代码量更小。. _' Y' C$ C" u/ G- a

% l7 z2 I1 Y' @3 z0 U% u5 v

) t1 W1 p% T: t$ \0 o变量的值在不使用后可能在其范围内不可用。例如,它们的堆栈位置可能已被重用。。
0 a& {3 x2 y' A2 G  j# p5 w6 q' a% K  g( U/ P

" ^2 Q% s. I! X, ~2 @优化级别-O2# n( ~, P3 T5 S8 U- p
-O2与-O1相比,有更高的性能优化。增加了一些新的优化,并更改了优化的启发式方法。这是编译器可能生成矢量指令的第一个优化级别。它还会降低调试体验。
! {1 ?: j2 K7 \4 u- }( J- u
2 g. L2 k, ?! S9 M
& c" n/ w; L- A. Z
-O2与-O1相比使用时的差异是:0 b4 g& ]! U7 n4 h0 x  Q3 K4 k

- U1 y- @/ y8 U. V$ t
, V% [1 \2 Z5 z' Q# P# V) R
编译器认为内联调用站点可获利的阈值可能会增加。
% @% n+ r7 s# E: Z+ c1 ^7 r! c* ^3 a5 N+ J" A/ B

+ o7 S( d$ Q; F执行的循环展开数量可能会增加。2 N7 ^& t- q$ V  P; ^: F: k) |
3 h3 l3 W: j) {1 h% J' B0 ]

2 y! \" n. V( M5 M8 x可以为简单循环和独立标量运算的相关序列生成矢量指令。
  O  ?: @/ m- F' S2 E5 j% U6 \! S
6 P% j& t2 _/ s3 k8 i

4 Q3 {+ j2 M7 V/ a* O可以使用armclang命令行选项禁止创建矢量指令-fno-vectorize。
* i1 x2 ^$ Y9 t0 l3 R& F' d' o8 y% x$ r

& ~  ^+ U/ V; a* T& ~2 q优化级别-O3
  p  a+ D4 p2 I* [/ h! ?7 H! D- C) t- `-O3与-O2相比,有更高的性能优化。此优化级别允许进行需要大量编译时分析和资源的优化,并且与-O2相比更改了优化的启发式方法。-O3指示编译器针对生成的代码的性能进行优化,而忽略生成的代码的大小,这可能会导致代码大小增加。
0 l+ W  Y) d" l2 K) Z9 g! T# h8 i1 J4 D  t

1 y& N& h: u1 B5 B" l8 {( w-O3与-O2相比使用时的差异是:! U  O# l" e7 W+ K1 b) ?' h  ^

1 b& q0 S; C. Y9 }' ^$ Y
1 v4 F! I* y; O: e% |
编译器认为内联调用站点是有利可图的阈值增加。
. o- x- n! C, K& l9 F2 W1 F; o1 ^- d
+ H$ h' h) B8 n
执行的循环展开量增加。
( Y( J- u) A' V% [9 W6 v- F. @9 N/ O( L" [. l

# Q% p4 s! y2 O8 P) O在编译器管道中启用更积极的指令优化。# {# F6 ^3 k% @. L8 Q( ~, K4 L" i
8 p/ T$ X$ m+ d; }5 T1 D
8 C7 t) u2 B% x, _
优化级别-Os
8 O' L& k  K, N* x+ @/ Q! P-Os目的是在不显着增加代码大小的情况下提供高性能。根据你的应用程序,提供的性能可能类似于 -O2或-O3。
& U0 N" `1 V7 {6 b* |3 x, u6 N5 z- o$ x& J. F7 o6 ?

% }8 p9 ~! y8 G7 F$ x. a& N' Y-Os与-O3相比,可减少代码大小。但会降低调试体验。; V$ i5 x4 ^. A

/ X0 b# w( r" I2 t. k, {: h
' ^( H% f2 F" k. U6 ~
-Os与-O3相比使用时的差异是:, N3 R8 V* H+ A7 B

2 k8 Z& Z; K% y& T- i

' W% Q1 q$ n* C2 N' o/ ]& f6 {降低编译器认为内联调用站点可获利的阈值。" J0 n5 s  h" |* Z. p

  L/ x, ^) z! u6 h" l
# r) L4 n( m, g; p# O7 @
显着降低了执行的循环展开量。
; A: S) b8 u- I  x$ P/ L2 ~0 u$ [2 Q! E% b2 [6 p

4 V* \4 X- G4 y优化级别-Oz
+ T0 a  f$ v# r4 Y$ k1 t& I-Oz目的是提供尽可能小的代码量。Arm 建议使用此选项以获得最佳代码大小。此优化级别会降低调试体验。
2 i3 {( w' F, W+ [  i% n8 P
9 i4 |" o/ @2 _0 u6 C  X

4 X: `6 g& i  J6 R; p-Oz与-Os相比使用时的差异是:
: @* g5 A1 Z2 h8 r
5 C0 g2 q" ~$ M
: |6 z5 [( Y  S3 K5 t4 d! u2 t
编译器仅针对代码大小进行优化,而忽略性能优化,这可能会导致代码变慢。7 U% y3 E% A+ z
; ~2 ^  [5 `% a2 o! l

- @# _1 p9 V% [; [; V4 _未禁用功能内联。在某些情况下,内联可能会整体上减少代码大小,例如,如果一个函数仅被调用一次。仅当预期代码大小会减小时,才将内联启发式方法调整为内联式。4 D& k3 B- `! s  X0 h
5 t% j! B$ ^) T9 ?0 z
4 c+ x4 G& a0 U0 M5 S3 z0 e
禁用可能会增加代码大小的优化,例如循环展开和循环矢量化。$ x: p+ u5 f  }4 y. W1 m7 z

+ \* \  l2 K" E
6 K  E% T6 k# L3 [5 j
循环是作为while循环而不是do-while循环生成的。
7 w- B6 x$ e$ x6 M& z4 |5 D* ~
+ t) a. w# e3 S" ^/ O
' H! {" \7 g) F# O! i. X, ^
优化级别-Ofast3 R/ x' l  Q3 B! M. j, _
-Ofast从级别执行优化,包括使用 -ffast-math armclang选项执行的优化。8 b4 m0 y, w  [' h) N# ^

4 F; N9 E, g3 c$ n2 B6 \! w( G; k
$ M* `$ Z8 N3 J) Z9 x
该级别还执行其他进一步的优化,可能会违反严格遵守语言标准的要求。
! {4 E8 v9 a  _/ ]6 V* D) ?" g/ V6 k
0 {! v/ r  Y- k0 U0 x' K
与-O3相比,该级别会降低调试体验,并可能导致代码大小增加。0 n. ?. I& X% O4 K/ A
  H8 O8 g% M. P

2 u. x* [9 L5 T# T1 Q( f" ]: ~优化级别-Omax
' M, M6 s) g" G7 l4 Y6 B-Omax是最大程度的优化,并专门针对性能优化。它支持从级别进行的所有优化,以及链接时间优化(LTO)。
$ d5 @4 ^* a/ ^! H8 `, H' _) q- G7 \* x6 h. ^5 \$ |- R# O
: p) [/ M  |1 W* G2 m+ N
在此优化级别上,Arm Compiler可能会违反严格遵守语言标准的规定。使用此优化级别可获得最快的性能。1 q8 L/ p6 e) F4 A5 l
" o1 I! z: {' R9 Q

- I8 Z+ R/ l/ X与-Ofast相比,该级别会降低调试体验,并可能导致代码大小增加。1 H3 a$ E* I- V. a
/ e* ^" }% |0 R

$ r) V1 b5 L* C+ t/ h9 F如果你使用-Omax进行编译,并具有单独的编译和链接步骤,你还必须在armlink命令行中包括-Omax。1 u  c0 ?) y7 K% O7 x

- [1 t0 N7 c* R8 I- n3 R* w1 w- r/ t& ^! u  P  X1 u& c- z% s
收藏 评论0 发布时间:2020-12-3 12:43

举报

0个回答
关于
我们是谁
投资者关系
意法半导体可持续发展举措
创新与技术
意法半导体官网
联系我们
联系ST分支机构
寻找销售人员和分销渠道
社区
媒体中心
活动与培训
隐私策略
隐私策略
Cookies管理
行使您的权利
官方最新发布
STM32N6 AI生态系统
STM32MCU,MPU高性能GUI
ST ACEPACK电源模块
意法半导体生物传感器
STM32Cube扩展软件包
关注我们
st-img 微信公众号
st-img 手机版