你的浏览器版本过低,可能导致网站不能正常访问!
为了你能正常使用网站功能,请使用这些浏览器。

Linux性能分析中常用的工具——perf

[复制链接]
gaosmile 发布时间:2020-9-24 23:05
系统级性能优化通常包括两个阶段:性能剖析(performance profiling)和代码优化。性能剖析的目标是寻找性能瓶颈,查找引发性能问题的原因及热点代码。代码优化的目标是针对具体性能问题而优化代码或编译选项,以改善软件性能。本篇主要讲性能分析中常用的工具——perf。
, i! L. e! Q/ ~+ I& x$ F

1 D, f  y6 b- r
perf是一款Linux性能分析工具。Linux性能计数器是一个新的基于内核的子系统,它提供一个性能分析框架,比如硬件(CPU、PMU(Performance Monitoring Unit))功能和软件(软件计数器、tracepoint)功能。通过perf,应用程序可以利用PMU、tracepoint和内核中的计数器来进行性能统计。它不但可以分析制定应用程序的性能问题(per thread),也可以用来分析内核的性能问题。

" @4 Y, }/ c% H* J/ b; n
总之perf是一款很牛逼的综合性分析工具,大到系统全局性性能,再小到进程线程级别,甚至到函数及汇编级别。
5 ?% ]. T9 T: y. `& W8 N0 z6 [1 }; U
调优方向
可以从以下三种事件为调优方向:
  • Hardware Event由PMU部件产生,在特定的条件下探测性能事件是否发生以及发生的次数。比如cache命中。
  • Software Event是内核产生的事件,分布在各个功能模块中,统计和操作系统相关性能事件。比如进程切换,tick数等。
  • Tracepoint Event是内核中静态tracepoint所触发的事件,这些tracepoint用来判断程序运行期间内核的行为细节(这些tracepint的对应的sysfs节点在/sys/kernel/debug/tracing/events目录下)。比如slab分配器的分配次数等。3 `* C- E1 J5 }5 ~+ z# E0 F
      E+ \; |( n' \7 `
. W  D" r  X" B3 c* _
perf 的使用
序号命令作用
1annotate解析perf record生成的perf.data文件,显示被注释的代码。
2archive根据数据文件记录的build-id,将所有被采样到的elf文件打包。利用此压缩包,可以再任何机器上分析数据文件中记录的采样数据。
3benchperf中内置的benchmark,目前包括两套针对调度器和内存管理子系统的benchmark。
4buildid-cache管理perf的buildid缓存,每个elf文件都有一个独一无二的buildid。buildid被perf用来关联性能数据与elf文件。
5buildid-list列出数据文件中记录的所有buildid。
6diff对比两个数据文件的差异。能够给出每个符号(函数)在热点分析上的具体差异。
7evlist列出数据文件perf.data中所有性能事件。
8inject该工具读取perf record工具记录的事件流,并将其定向到标准输出。在被分析代码中的任何一点,都可以向事件流中注入其它事件。
9kmem针对内核内存(slab)子系统进行追踪测量的工具
10kvm用来追踪测试运行在KVM虚拟机上的Guest OS。
11list列出当前系统支持的所有性能事件。包括硬件性能事件、软件性能事件以及检查点。
12lock分析内核中的锁信息,包括锁的争用情况,等待延迟等。
13mem内存存取情况
14record收集采样信息,并将其记录在数据文件中。随后可通过其它工具对数据文件进行分析。
15report读取perf record创建的数据文件,并给出热点分析结果。
16sched针对调度器子系统的分析工具。
17script执行perl或python写的功能扩展脚本、生成脚本框架、读取数据文件中的数据信息等。
18stat执行某个命令,收集特定进程的性能概况,包括CPI、Cache丢失率等。
19testperf对当前软硬件平台进行健全性测试,可用此工具测试当前的软硬件平台是否能支持perf的所有功能。
20timechart针对测试期间系统行为进行可视化的工具
21top类似于linux的top命令,对系统性能进行实时分析。
22trace关于syscall的工具。
23probe用于定义动态检查点。
全局性概况:
perf list查看当前系统支持的性能事件;
perf bench对系统性能进行摸底;
perf test对系统进行健全性测试;
perf stat对全局性能进行统计;
全局细节:
perf top可以实时查看当前系统进程函数占用率情况;
perf probe可以自定义动态事件;
特定功能分析:
perf kmem针对slab子系统性能分析;
perf kvm针对kvm虚拟化分析;
perf lock分析锁性能;
perf mem分析内存slab性能;
perf sched分析内核调度器性能;
perf trace记录系统调用轨迹;
最常用功能perf record,可以系统全局,也可以具体到某个进程,更甚具体到某一进程某一事件;可宏观,也可以很微观。
pref record记录信息到perf.data;
perf report生成报告;
perf diff对两个记录进行diff;
perf evlist列出记录的性能事件;
perf annotate显示perf.data函数代码;
perf archive将相关符号打包,方便在其它机器进行分析;
perf script将perf.data输出可读性文本;
可视化工具perf timechart
perf timechart record记录事件;
perf timechart生成output.svg文档;
" M+ P8 J( K7 ~9 p4 j+ V2 V
火焰图
火焰图(Flame Graph)是由Linux性能优化大师Brendan Gregg发明的,和所有其他的trace和profiling方法不同的是,Flame Graph以一个全局的视野来看待时间分布,它从底部往顶部,列出所有可能的调用栈。其他的呈现方法,一般只能列出单一的调用栈或者非层次化的时间分布。
; m) |4 \' b* j1 m2 Y# f* C
以典型的分析CPU时间花费到哪个函数的on-cpu火焰图为例来展开。CPU火焰图中的每一个方框是一个函数,方框的长度,代表了它的执行时间,所以越宽的函数,执行越久。火焰图的楼层每高一层,就是更深一级的函数被调用,最顶层的函数,是叶子函数。

! n& ?; J9 n, w+ S# b4 ?
微信图片_20200924230132.jpg
火焰图的生成过程是:
  • 先trace系统,获取系统的profiling数据
  • 用脚本来绘制
    , N4 h/ c2 y& e

0 L& [5 u3 Y, X
下面通过实例来体验以下火焰图的生成过程:
#include <pthread.h>
6 L& k! ~# D7 c; J1 C6 `" p* ], M1 A
func_d()
6 e/ x/ W7 G: R! v4 p4 K7 ]: e{, v4 w; O7 ?7 Q8 M3 ?% B
    int i;
$ s' u" O2 |9 o* O- k+ s) |    for(i=0;i<50000;i++);. e7 v6 e2 P( \6 K3 c/ K
}$ I# Z! `3 w8 M$ B- d% @

4 a6 J& D; |; A; m# T; C7 K, qfunc_a(): Q7 H! ^" H3 S) q3 @7 z
{7 a4 Z' h) o. Z* A8 ?
    int i;
0 r" N5 a" p% h% D" c1 U    for(i=0;i<100000;i++);
+ K' L: X$ i: T, ~: V# ~    func_d();! C/ k/ U5 E2 E; O9 h
}# D% B" G5 v- B
8 C% i9 a, w9 q9 u. g1 a( y3 @* t
func_b()) m# R4 b% H6 G
{
: X* J$ `  T7 z* p+ c- c    int i;$ L# p0 ^0 F0 s( C& d; {
    for(i=0;i<200000;i++);( c' ?" s4 e5 z6 j4 t
}% i# F+ ~- M0 w
9 h) t% J: Z& w' _3 s& j* l5 H
func_c()0 D% ^0 h9 Q: K4 g7 e1 e
{
- R8 W- N4 k9 r  C' ~. r    int i;- R" |- X/ Q/ b0 I
    for(i=0;i<300000;i++);7 a! H4 }# }1 r; e$ |
}
/ X4 o) c# n3 P" {- z! g5 K! W  O; G/ \3 v4 C: X
void* thread_fun(void* param)2 n6 R! {& k/ ~; n: C
{
% r3 Z+ ^9 c9 }    while(1) {
* h: w) @- r6 }2 m        int i;. n5 n$ Y( k9 l5 j+ I
        for(i=0;i<100000;i++);
7 J. R) H, P+ @: k$ R4 o& f: ]7 ]  N2 Q, k4 F! t3 J& q  _
        func_a();
5 L0 L- _9 I* t3 m; J        func_b();/ \. f  B" t' E7 K. G1 {0 h
        func_c();
6 r/ u( J$ g- @    }
" w9 v! \# P& ~4 h}
, b9 ^' g/ ?) J+ b; A
) E8 K3 d4 K  }6 J, Qint main(void)
: n0 }, `$ U7 S{
/ W- V3 G6 ~# [; K5 ^8 p    pthread_t tid1,tid2;
, H; z1 M# R; E7 |$ d! i* }    int ret;
' J9 n9 F2 f$ Z5 a5 k6 ]5 p* o1 I, u$ z5 B
    ret=pthread_create(&tid1,NULL,thread_fun,NULL);& }% V0 e! Q" {# ?3 E9 }- J
    if(ret==-1){
. ~1 U2 u7 K; `1 G% s5 {- @3 x5 Z        ...
# p9 t% w) P' Y. C# `" z    }
$ u& a5 `8 s( i5 f: K( N$ F
8 h# e0 _, s6 G& z" m6 I    ret=pthread_create(&tid2,NULL,thread_fun,NULL);
0 s* `) I1 f6 z: G+ Z& _6 E    ...
+ ~6 ~1 j* |( r/ G: y) f% D5 m6 \
+ F* [9 b3 Y) r    if(pthread_join(tid1,NULL)!=0){+ m2 N( h+ j6 o, g+ w, Y% B. M
        ...
- M9 b  S% ?1 @& }7 S& k. i$ r    }0 B- l( V- T* u: d% o) u

; z$ |& u' a$ B( r/ I- i    if(pthread_join(tid2,NULL)!=0){+ L6 I, F* D. c8 z6 G* g
        .../ {& X! O+ b0 k! P/ K; h
    }
/ ~4 {% H& F) A3 U1 h' q
( `7 x% n5 S' y# N& {    return 0;$ |5 T( s' T& T1 o
}
先用类似perf top分析出来CPU时间主要花费在哪里:
$ gcc test.c -pthread
$ ./a.out&
$ sudo perf top
微信图片_20200924230136.jpg
perf top提示出来了fun_a()、fun_b()、fun_c(), fun_d(),thread_func()这些函数内部的代码是CPU消耗大户,但是它缺乏一个全局的视野,我们无法看出全局的调用栈,也弄不清楚这些函数之间的关系。火焰图则不然,我们用下面的命令可以生成火焰图(以root权限运行):
5 M8 s9 B0 [8 R6 B8 U" Q- K6 X
$ perf record -F 99 -a -g -- sleep 60
$ perf script | ./stackcollapse-perf.pl > out.perf-folded
$ ./flamegraph.pl out.perf-folded > perf-kernel.svg
- `6 y" s! y# O, @4 N+ ^, J
上述程序捕获系统的行为60秒钟,最后调用flamegraph.pl生成一个火焰图perf-kernel.svg,用看图片的工具就可以打开这个svg。
微信图片_20200924230140.jpg
上述火焰图显示出了a.out中,thread_func()、func_a()、func_b()、fun_c()和func_d()的时间分布。
从上述火焰图可以看出,虽然thread_func()被两个线程调用,但是由于thread_func()之前的调用栈是一样的,所以2个线程的thread_func()调用是合并为同一个方框的。
! L! _: m8 F. L/ H& i7 n
除了on-cpu的火焰图以外,off-cpu的火焰图,对于分析系统堵在IO、SWAP、取得锁方面的帮助很大,有利于分析系统在运行的时候究竟在等待什么,系统资源之间的彼此伊伴。
比如,下面的火焰图显示,nginx的吞吐能力上不来的很多程度原因在于sem_wait()等待信号量。
关于火焰图的更多细节和更多种火焰图各自的功能,可以访问:
http://www.brendangregg.com/flamegraphs.html
8 n( x* u. w3 M! P+ O8 V8 o
收藏 1 评论0 发布时间:2020-9-24 23:05

举报

0个回答

所属标签

关于
我们是谁
投资者关系
意法半导体可持续发展举措
创新与技术
意法半导体官网
联系我们
联系ST分支机构
寻找销售人员和分销渠道
社区
媒体中心
活动与培训
隐私策略
隐私策略
Cookies管理
行使您的权利
官方最新发布
STM32N6 AI生态系统
STM32MCU,MPU高性能GUI
ST ACEPACK电源模块
意法半导体生物传感器
STM32Cube扩展软件包
关注我们
st-img 微信公众号
st-img 手机版