现在的位置: 首页 > 综合 > 正文

英特尔软件开发工具介绍—— Intel® VTune 可视化性能分析器

2013年08月24日 ⁄ 综合 ⁄ 共 1188字 ⁄ 字号 评论关闭
在上期文章中,我们介绍了如何运用Intel编译器通过提高程序编译后执行效率来提升程序性能。然而,提高软件性能不仅可以从提高编译执行代码入手,更多时候需要分析程序性能,找出性能瓶颈着重进行优化。Intel VTune 可视化性能分析器便是Intel为众多开发者们提供的专门针对寻找软硬件性能瓶颈的一款分析工具。
统计表明,程序在运行中80%的时间都在执行20%的代码。而这20%的代码中,活动相对密集的区域便被称为HotSpot。Hot Spot不仅耗费大量时间,它也经常在以下事件中被发现:缓存不中,内存缺页,误预测分枝。这类错误往往非常隐蔽,难以发现。但只要能找出并优化这些Hot spot,便能够达到事半功倍的效果。VTune 主要通过以下一系列可视化分析方案来帮助软硬件开发者们寻找Hot spot。
1.采样:
以图形化方式显示程序执行的指令地址直方图,帮助确定代码中的性能瓶颈。采样数据采集完毕之后,可以按进程、线程、模块、函数或指令地址进行查看。采样只需极低的性能开销,并且不需要修改代码。通过采样图,可以方便地了解到哪些代码是处于活动密集区,如图中是按模块划分,最长的紫红色区域所对应的代码模块,代表的就是HotSpot,在开发中需要着重优化。
2.调用图:
调用图包含以下信息:
u 函数被调用次数及调用它的函数
u 在每个函数或方法上耗费的时间
u 函数耗费在阻塞或等待上的时间
u 经过调用层次结构的关键路径
u 耗费时间占总时间n%以上的函数,其中n 由用户指定。
3.计数器监视器:
“计数器监视器”可实时查看应用程序的性能。可监视200个以上可用操作系统计数器中的任何一个。用户可创建自定义的性能监视器,来监视软、硬件性能。
计数信息包括:重定向网络错误率,内存占用量,上下文切换率,CPU 时间等。
看过以上三种可视化分析方案,你一定对如何使用VTune 找到性能瓶颈有了自己的想法。除此之外VTune 也提供了一些其它实用的功能,具体如下:
多线程支持
可以同时查看多个线程的采样数据或“调用图”,或者在显示器中单独查看特定线程或处理器的数据。
远程数据采集用户可以在主机上配置、启动及停止远程机器的评测数据采集会话,然后将这些数据导入主机系统上的VTune。
此功能支持Linux 与 Windows。
英特尔优化助手
它能够解释采样数据与计数器监视器数据,并自动确定代码中的性能瓶颈,然后提出深入见解与调整建议。它还可以提供基于C、C++、Fortran、Java 或汇编语言的调整建议。
VTune 支持Windows 和Linux。支持Fortran、C#、C/C++与Java编程,并与目前主流的开发环境完全集成, 包括
微软的Visual Studio,英特尔C/C++、多种Fo rt ra n 编译器、Compaq VisualFortran,Borland 的 Delphi、C+ +Builder 以及IBM 的 Visual Age 等。

抱歉!评论已关闭.