机构购买了一套由外边供应商供给的呼叫中心系统,在运用的过程中发掘其LOAD和CPU占用偏高,因为无源代码亦不太清楚其内部的实现规律,只能够经过观察系统资源的消耗来排除其问题,以下记录的是问题排查的过程。
1、经过top命令查看其CPU占用
能够看到其load占用为“20.14, 16.42, 19.16”,三个数字分别暗示cpu在1分钟、5分钟及15分钟的load,cpu的运用率亦偏高,达到了68.8%,占用cpu较高的进程ID为281020。
2、经过ps查看该应用 $ ps aux|grep 281020
root 212891 0.0 0.0 103328 848 pts/3 S+ 15:41 0:00 grep 281020
ipcc 281020 39.5 2.6 1025560 425540 ? Sl 01:18 341:29 /usr/bin/python ./ctiRealtimeCdrMain.py default.xml结果表示该应用为python应用。
3、查看进程中线程的CPU占用状况
在top中加入-H参数,查看该进程中线程的cpu战胜状况: $ top -H -p 281020结果如下:
能够看到进程281020中线程号为281042的线程战胜的CPU最多。
4、跟踪进程的执行栈
经过watch和pstack命令查看线程中命令的执行状况:
能够看到从mysql中读取数据占用资源较多。
5、跟踪函数的调用
进一步经过strace命令进行验证: $ strace -f -p 281042结果如下:
其中海量的数据在执行数据库的写入(write)及读取(read)操作,上面的pstack命令并无反映出write的问题,那问题应该出此刻数据库的read操作上,初步猜测是数据库的select语句有问题,或是无走索引。
6、检测MySql的慢日志
进一步检测MySql的慢日志发掘:
其中有海量的查找慢日志,SQL中运用了全表扫描的count、max、min这般的函数,最终确认问题导致的原由了,余下的便是让对方对做优化了。
|