资讯专栏INFORMATION COLUMN

LINUX 如何查看系统负载

Heier / 1550人阅读

摘要:操作系统的负载状态,反映了应用程序的资源使用情况,从中能找出应用程序优化的瓶颈所在。系统平均负载,是指处于运行或不可打扰状态的进程的平均数。处于运行,表示运行态,占用,或就绪态,等待调度。评价系统的负载一般采用分钟内的那个平均负载值。

操作系统的负载状态,反映了应用程序的资源使用情况,从中能找出应用程序优化的瓶颈所在。

系统平均负载,是指处于运行或不可打扰状态的进程的平均数。
处于运行,表示运行态,占用CPU,或就绪态,等待CPU调度。
不可打扰,表示阻塞,正在等待I/O

在 Linux 系统中,要查看负载情况一般使用 uptime 命令(w 命令和 top 命令也行)

一、uptime 命令

$ uptime
16:33:56 up 69 days,  5:10,  1 user,  load average: 0.14, 0.24, 0.29

以上信息的解析如下:

16:33:56 : 当前时间 up 69 days, 5:10 : 系统运行了69天5小时10分 1 user :

当前有1个用户登录了系统load average: 0.14, 0.24, 0.29 :

系统在过去1分钟内,5分钟内,15分钟内的平均负载 load average: 0.14, 0.24, 0.29 :

系统在过去1分钟内,5分钟内,15分钟内的平均负载

平均负载解析

查看逻辑 CPU 核心数:

$ grep "model name" /proc/cpuinfo | wc -l
1

运行结果表示,有 1 个逻辑 CPU 核心。以1个CPU核心为例,假设 CPU 每分钟最多处理100个进程 –

load=0,没有进程需要 CPU

load=0.5,CPU处理了 50 个进程

load=1, CPU 处理了 100 个进程,这时 CPU 已被占满,但系统还是能顺畅运作的

load=1.5, CPU 处理了 100 个进程,还有 50 个进程正在排除等着 CPU 处理,这时,CPU 已经超负荷工作了

为了系统顺畅运行,load 值最好不要超过 1.0,这样就没有进程需要等待了,所有进程都能第一时间得到处理。

很显然,1.0 是一个关键值,超过这个值,系统就不在最佳状态了。 一般 0.7 是一个比较理想的值。

另外,load 值的健康状态还跟系统 CPU 核心数相关,如果 CPU 核心数为 2,那么 load 值健康值应该为 2,以此类推。
评价系统的负载一般采用 15 分钟内的那个平均负载值。

二、w 命令

$ w
 17:47:40 up 69 days,  6:24,  1 user,  load average: 0.46, 0.26, 0.25
USER     TTY      FROM              LOGIN@   IDLE   JCPU   PCPU WHAT
lvinkim  pts/0    14.18.144.2      15:55    0.00s  0.02s  0.00s w

第1行 : 与 uptime 一相同。
第2行以下,当前登录用户的列表。

三、top 命令

$ top
top - 17:51:23 up 69 days,  6:28,  1 user,  load average: 0.31, 0.30, 0.26
Tasks:  99 total,   1 running,  98 sleeping,   0 stopped,   0 zombie
Cpu(s):  2.3%us,  0.2%sy,  0.0%ni, 97.4%id,  0.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:   1922244k total,  1737480k used,   184764k free,   208576k buffers
Swap:        0k total,        0k used,        0k free,   466732k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND                                                                
    1 root      20   0 19232 1004  708 S  0.0  0.1   0:01.17 init                                                                    
    2 root      20   0     0    0    0 S  0.0  0.0   0:00.01 kthreadd                                                                
...

第1行 : 与 uptime 一相同。

第2行 : 进程数信息。

Tasks: 99 total : 总共有 99 个进程

1 running : 1 个进程正在占用 CPU

98 sleeping : 98 个睡眠进程

0 stopped : 0 个停止的进程

0 zombie : 0 个僵尸进程

第3行 : CPU 使用率

us (user): 非nice用户进程占用CPU的比率

sy (system): 内核、内核进程占用CPU的比率

ni (nice): 用户进程空间内改变过优先级的进程占用CPU比率

id (idle): CPU空闲比率,如果系统缓慢而这个值很高,说明系统慢的原因不是CPU负载高

wa (iowait): CPU等待执行I/O操作的时间比率,该指标可以用来排查磁盘I/O的问题,通常结合wa和id判断

hi (Hardware IRQ): CPU处理硬件中断所占时间的比率

si (Software Interrupts): CPU处理软件中断所占时间的比率

st (steal): 流逝的时间,虚拟机中的其他任务所占CPU时间的比率

需要注意的一些情形:

用户进程us占比高,I/O操作wa低:说明系统缓慢的原因在于进程占用大量CPU,通常还会伴有教低的空闲比率id,说明CPU空转时间很少。

I/O操作wa低,空闲比率id高:可以排除CPU资源瓶颈的可能。

I/O操作wa高:说明I/O占用了大量的CPU时间,需要检查交换空间的使用,交换空间位于磁盘上,性能远低于内存,当内存耗尽开始使用交换空间时,将会给性能带来严重影响,所以对于性能要求较高的服务器,一般建议关闭交换空间。另一方面,如果内存充足,但wa很高,说明需要检查哪个进程占用了大量的I/O资源。

更多负载情形,可在实际中灵活判断。

四、iostat 命令

iostat命令可以查看系统分区的IO使用情况

$ iostat 
Linux 2.6.32-573.22.1.el6.x86_64 (sgs02)   01/20/2017     _x86_64_   (1 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
           2.29    0.00    0.25    0.04    0.00   97.41

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
vda               1.15         3.48        21.88   21016084  131997520

一些值得注意的IO指标 :

Device : 磁盘名称

tps : 每秒I/O传输请求量

Blk_read/s : 每秒读取多少块,查看块大小可参考命令 tune2fs

Blk_wrtn/s : 每秒写取多少块

Blk_read : 一共读了多少块

–Blk_wrtn : 一共写了多少块

五、iotop 命令

iotop命令类似于top命令,但是显示的是各个进程的I/O情况,对于定位I/O操作较重的进程有比较大的作用。

# iotop
Total DISK READ: 0.00 B/s | Total DISK WRITE: 774.52 K/s
  TID  PRIO  USER     DISK READ  DISK WRITE  SWAPIN     IO>    COMMAND                                                                
  272 be/3 root        0.00 B/s    0.00 B/s  0.00 %  4.86 % [jbd2/vda1-8]
 9072 be/4 mysql       0.00 B/s  268.71 K/s  0.00 %  0.00 % mysqld
 5058 be/4 lvinkim     0.00 B/s    3.95 K/s  0.00 %  0.00 % php-fpm: pool www
    1 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % init

可以看到不同任务的读写强度。

六、sysstat工具

很多时候当检测到或者知道历史的高负载状况时,可能需要回放历史监控数据,这时 sar 命令就派上用场了,sar命令同样来自sysstat工具包,可以记录系统的CPU负载、I/O状况和内存使用记录,便于历史数据的回放。

sysstat的配置文件在 /etc/sysconfig/sysstat 文件,历史日志的存放位置为 /var/log/sa
统计信息都是每10分钟记录一次,每天的23:59会分割统计文件,这些操作的频率都在 /etc/cron.d/sysstat 文件配置。

七、sar 命令

使用sar命令查看当天CPU使用:

$ sar
Linux 2.6.32-431.23.3.el6.x86_64 (szs01)   01/20/2017     _x86_64_   (1 CPU)

10:50:01 AM     CPU     %user     %nice   %system   %iowait    %steal     %idle
11:00:01 AM     all      0.45      0.00      0.22      0.40      0.00     98.93
Average:        all      0.45      0.00      0.22      0.40      0.00     98.93

使用sar命令查看当天内存使用:

$ sar -r
Linux 2.6.32-431.23.3.el6.x86_64 (szs01)   01/20/2017     _x86_64_   (1 CPU)

10:50:01 AM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit
11:00:01 AM     41292    459180     91.75     44072    164620    822392    164.32
Average:        41292    459180     91.75     44072    164620    822392    164.32

使用sar命令查看当天IO统计记录:

$ sar -b
Linux 2.6.32-431.23.3.el6.x86_64 (szs01)   01/20/2017     _x86_64_   (1 CPU)

10:50:01 AM       tps      rtps      wtps   bread/s   bwrtn/s
11:00:01 AM      3.31      2.14      1.17     37.18     16.84
Average:         3.31      2.14      1.17     37.18     16.84

更多 sar 用法,请 man sar 。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/63245.html

相关文章

  • Linux 性能诊断——平均负载 Load 问题

    摘要:利用率与平衡负载从角度来说,只是反映单位时间内占用的进程数量,而利用率与进程数量没有直接关系,我们可以使用命令查看的利用率,有以下几个指标表示用户空间程序的使用率没有通过调度表示系统空间的使用率,主要是内核程序。 前言 有一回面试,面试官提了一个问题,cpu 使用率不高,但是 Load (平均负载) 很高,你如何查找问题? 当时我不明白 Load 的意思,面试官解释说这个指标反映不可中...

    leo108 评论0 收藏0
  • 如何Linux查看所有正在运行的进程

    摘要:和都支持命令,显示所有运行中进程的相关信息。以树状显示正在运行的进程。如果指定了用户名,进程树将以用户所拥有的进程作为根节点。能查找当前正在运行的进程并列出符合条件的进程。 你可以使用ps命令。它能显示当前运行中进程的相关信息,包括进程的PID。Linux和UNIX都支持ps命令,显示所有运行中进程的相关信息。ps命令能提供一份当前进程的快照。如果你想状态可以自动刷新,可以使用top命...

    lentrue 评论0 收藏0
  • So Hot?快给 CPU 降降温!

    摘要:表示用修正进程优先级的用户态进程执行的时间。表示处理软中断所花费的时间。软中断是由软件程序如网络收发定时调度等发出的中断信号,特点是延迟执行。表示被其他虚拟机占用的时间,仅出现在多虚拟机场景。 作者:夏明(涯海) 创作日期:2019-08-14 专栏地址:【稳定大于一切】 CPU(Central Processing Unit)是计算机系统的运算和控制核心,是信息处理、程序运行的...

    stefanieliang 评论0 收藏0
  • uptime命令查看Linux服务器健康状态

    uptime格式 uptime内容也是top 命令的第一行 14:17:49 up 3 days, 3:39, 1 user, load average: 0.00, 0.01, 0.05 1. 14:17:49 系统时间 2. 3 days 启动3天 3. 3:39 3小时39分 4. 1 user1个用户在连接服务器 5. load average 1 5 15分钟的负载 通过load...

    selfimpr 评论0 收藏0
  • linux系统资源监控命令

    摘要:是一个相当全面的性能分析工具,通过它可以观察系统的进程状态内存使用情况虚拟内存的使用情况磁盘的中断上下文切换的使用情况等性能信息,建议熟练掌握此命令。虚拟内存使用情况单位。在一般情况下不显示与服务器进程相关联的套接字。 查看系统发行版 root@cf0c6032ba2f:/# lsb_release -a No LSB modules are available. Distributo...

    wapeyang 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<