资讯专栏INFORMATION COLUMN

一文让你明白平均负载

hedzr / 2219人阅读

摘要:明白了什么是平均负载后,那么自然就是要知道怎么用了。而使用率,是单位时间内繁忙情况的统计,跟平均负载并不一定完全对应。比如密集型进程,使用大量会导致平均负载升高,此时这两者是一致的。

1. 什么是平均负载

首先,我们先理解下什么是平均负载。

平均负载是指单位时间内,系统处于可运行状态不可中断状态的平均进程数,也就是平均活跃进程数,它和 CPU 使用率并没有直接关系。(为什么和 CPU 使用率没直接关系,这个我后面说明)

那么问题来了,可运行状态和不可中断状态又是什么东西呢?

所谓可运行状态的进程,是指正在使用 CPU 或者正在等待 CPU 的进程,也就是我们常用 ps 命令看到的,处于 R 状态(Running 或 Runnable)的进程。

而不可中断状态的进程,则是正处于内核态关键流程中的进程,并且这些流程是不可打断的,比如最常见的是等待硬件设备的 I/O 响应,也就是我们在 ps 命令中看到的 D 状态(Uninterruptible Sleep,也称为 Disk Sleep)的进程。

比如,当一个进程向磁盘读写数据时,为了保证数据的一致性,在得到磁盘回复前,它是不能被其他进程或者中断打断的,这个时候的进程就处于不可中断状态。如果此时的进程被打断了,就容易出现磁盘数据与进程数据不一致的问题。

所以,不可中断状态实际上是系统对进程和硬件设备的一种保护机制。

明白了什么是平均负载后,那么自然就是要知道怎么用了。

2. 如何查看平均负载

当我们使用 uptime 命令时,会出现以下结果(这是我本机的结果,每个人的机器情况不一样)

$ uptime
02:34:03 up 2 days, 20:14,  1 user,  load average: 0.63, 0.83, 0.88

对应解释:

02:34:03              // 当前时间
up 2 days, 20:14      // 系统运行时间
1 user                // 正在登录用户数

最后三个数字呢,依次则是过去 1 分钟、5 分钟、15 分钟的平均负载(Load Average)。

明白了怎么看平均负载后,那么平均负载到底是多少才是合理的呢?

3. 平均负载的合理值

当平均负载高于 CPU 数量 70% 的时候。就应该分析排查负载高的问题了。一旦负载过高,就可能导致进程响应变慢,进而影响服务的正常功能。

但 70% 这个数字并不是绝对的,最推荐的方法,还是把系统的平均负载监控起来,然后根据更多的历史数据,判断负载的变化趋势(可从 uptime 得到的三个数字分析)。当发现负载有明显升高趋势时,比如说负载翻倍了,你再去做分析和调查。

平均负载在最理想的情况下,就是每个 CPU 上都刚好运行着一个进程,这样每个 CPU 都得到了充分利用。

比如当平均负载为 2 时,意味着什么呢?

在只有 2 个 CPU 的系统上,意味着所有的 CPU 都刚好被完全占用。

在 4 个 CPU 的系统上,意味着 CPU 有 50% 的空闲。

而在只有 1 个 CPU 的系统中,则意味着有一半的进程竞争不到 CPU。

好了,关于平均负载的基本知识差不多就是这样。现在,我来填下开头的坑 —— 为什么和 CPU 使用率没直接关系呢?

4. 平均负载与 CPU 使用率

在文章最开始的时候就有提到,平均负载是指单位时间内,处于可运行状态和不可中断状态的平均进程数。所以,它不仅包括了正在使用 CPU的进程,还包括等待 CPU等待 IO的进程。

而 CPU 使用率,是单位时间内 CPU 繁忙情况的统计,跟平均负载并不一定完全对应。比如:

CPU 密集型进程,使用大量 CPU 会导致平均负载升高,此时这两者是一致的。

I/O 密集型进程,等待 I/O 也会导致平均负载升高,但 CPU 使用率不一定很高。

大量等待 CPU 的进程调度也会导致平均负载升高,此时的 CPU 使用率也会比较高

以上,就是文章的全部内容了,如果觉得有帮助的话,那就点个赞吧

本文整理自极客时间:《Linux性能优化实战》

**PS:本文原创发布于微信公众号「不只Java」,后台回复以下关键字获取经典必读书籍:
Java、MySQL、Redis、Linux、mq、数据结构、设计模式、编程思想、架构。**

公众号专注分享 Java 干货、读书笔记、成长思考。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/63138.html

相关文章

  • 一文让你明白CPU上下文切换

    摘要:所以,一次系统调用的过程,其实是发生了两次上下文切换。这些资源在上下文切换时是不需要修改的。发生线程上下文切换的场景前后两个线程属于不同进程。对同一个来说,中断处理比进程拥有更高的优先级,所以中断上下文切换并不会与进程上下文切换同时发生。 我们都知道,Linux 是一个多任务操作系统,它支持远大于 CPU 数量的任务同时运行。当然,这些任务实际上并不是真的在同时运行,而是因为系统在很短...

    paulquei 评论0 收藏0
  • 世界杯迄今最火的一场比赛 一文看懂世界杯背后的阿里云黑科技

    摘要:智能调节,大象的体型猎豹的速度直播最怕出现故障,而优酷直播全程采用阿里云的自动灾备技术,这项黑科技能够保证上述任何一个链路中出现的任何一个故障都能在数秒内自动恢复,丝毫不影响用户观看和体验。 摘要: 世界杯法阿之战中帕瓦尔世界波以及姆巴佩梅开二度一定让你印象深刻,而梅西的饮恨离开也让不少球迷碎了心。但你知道,比赛当天的阿里云藏着什么秘密吗? 世界杯法阿之战中帕瓦尔世界波以及姆巴佩梅开二...

    zhangke3016 评论0 收藏0
  • IaaS的演进!一文读懂裸金属和容器即服务

    摘要:英特尔机架规模设计则能实现以机架为单位的软硬件解耦,为裸金属即服务提供容量更大的资源池,并可通过开放的和协议如和,高效发掘管理和调配这些资源。江湖上,一直流传着 得IaaS(基础设施即服务),得公有云天下的说法。 想握紧IaaS这柄云端杀手锏,  大热的裸金属即服务和容器即服务, 还不了解一下? 它们为什么如此受人关注? 近年来,只要与IaaS相关的业界峰...

    My_Oh_My 评论0 收藏0
  • 一文带你重新认识 Docker 与 Kubernetes

    摘要:公司始于名为的平台即服务供应商。跨多个机器之间协调这些容器需要额外的工具,这称之为容器编排。的核心优势是为应用程序开发人员提供了用于编排无状态容器的强大工具。有无数的文章都在讨论和比较Docker、Kubernetes 以及Mesos。如果你是初学者,那么你可能会认为这三个开源项目正为了称霸容器界而殊死搏斗。虽然这三种技术都使得使用容器部署、管理和伸缩应用成为可能,但实际上它们各自解决了不同...

    baishancloud 评论0 收藏0
  • IaaS的演进!一文读懂裸金属和容器即服务

    摘要:英特尔机架规模设计则能实现以机架为单位的软硬件解耦,为裸金属即服务提供容量更大的资源池,并可通过开放的和协议如和,高效发掘管理和调配这些资源。 江湖上,一直流传着得IaaS(基础设施即服务),得公有云天下的说法。想握紧IaaS这柄云端杀手锏, 大热的裸金属即服务和容器即服务,还不了解一下? 它们为什么如此受人...

    MadPecker 评论0 收藏0

发表评论

0条评论

hedzr

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<