资讯专栏INFORMATION COLUMN

Gbase资源管理cgroup问题

IT那活儿 / 825人阅读
Gbase资源管理cgroup问题


一.  报错概述

日在创建资源池后日志出现如下gcrecover日志报错.


二.  分析思路

由于是新库,没有数据再跑,首先排除表数据不一致导致的状态不正常.

看到日志中有明显提示该语句可能有问题,且有event事件产生


顺着日志思路提示的是激活资源计划有问题,接着看资源计划,资源池等信息,这些资源池的设置也没有问题.

既然资源设置没有问题,那说明集群设置方面是没有问题的,这时候就要向主机的参数方向去排查问题,翻阅gbase管理员手册发现资源管理这项:

资源管理功能依托于系统服务 cgroup,在不同的操作间存在 cgroup.

资源管理用的是cgroup,而cgroup是操作系统的一个组件


因此顺着cgroup思路向下查找问题;

使用c3工具查看cgroup状态,提示cgroup服务找不到,说明这个服务没有开启或者安装

在使用如下命令: systemctl start cgconfig 尝试启动cgroup,无法启动cgroup服务,说明缺少对应的包

使用以下命令查看cgroup依赖包情况:

rpm -qa | grep libcgroup

rpm -qa | grep cgroup

rpm -qa | grep cgconfig


三.  解决方案

经分析发现缺少libcgroup-tools,这是启动cgroup的服务工具.,使用c3工具全节点安装:

cexec all: ‘yum -y install libcgroup-tools’

安装完成后使用c3工具全节点启动cgroup服务:

   cexec all: ‘systemctl start cgconfig’

启动cgroup服务后集群状态依旧不正常.查看lscgroup的mount状态,查看/etc/cgconfig.conf配置文件,比对别的正常机器的/etc/cgconfig.conf 配置文件

有问题机器的/etc/cgconfig.conf 配置文件

正常机器的/etc/cgconfig.conf 配置文件

发现少了一些内容,将其补充上去然后执行cgclear清除掉默认的所有挂载.

依次按步骤停止cgroup服务,启动cgroup服务

(假若重启cgroup服务未发生变化,可以再尝试重启集群服务,再重启cgroup服务).

systemctl  stop cgconfig

systemctl  start cgconfig

这时候gcadmin发现修改/etc/cgconfig.conf配置文件的主机状态正常了.

已找到集群状态不正常原因, 是由于操作系统安装时没有安装libconfig 相关的rpm 包,导致cgroup服务没有启动,而资源管理功能依托于系统服务 cgroup,在创建资源池后,激活资源计划是因系统cgroup服务未启动,导致集群状态不正常报错指向资源计划,接下来将正常主机的/etc/cgconfig.conf 配置文件 scp 到 各个gnode 上.

执行 cgclear 后,依次重启cgroup服务

systemctl  stop cgconfig

systemctl  start cgconfig

重启数据节点cgroup服务后,集群状态已恢复正常,且event事件也没有了.


END


更多精彩干货分享

点击下方名片关注

IT那活儿

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/129928.html

相关文章

  • 浅谈云计算数据中心对布线系统的影响

    摘要:对于规模化部署的云计算数据中心来说,优点带来的好处远大于缺点所造成的负面影响。 浅谈云计算数据中心对布线系统的影响 罗森伯格亚太电子有限公司:孙慧永 在谈云计算数据中心之前,我们要先了解一下,什么是云计算?云计算是指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源。 提供资源的网络被称为云。 云是IT的资源池,可以随时获取,按需使用,随时扩展,按使用付费。这种特性...

    asoren 评论0 收藏0
  • 使用Python处理文本,整理信息(2)

    摘要:通过函数找到所有符合上述要求的文本内容,并赋值给,通过打印,该值是一个,每一个匹配项作为一个列表单元。循环遍历上述的查找结果通过查找出来的内容,使用访问,并将剥去,就变成槽位信息了。通过查找出来的内容,经过处理就变成信息了。 处理思科设备 show inventory输出内容 任务目标 通过Python读取show inventory的内容,并将设备的槽位、模块型号和序列号自动写入CV...

    TIGERB 评论0 收藏0
  • 2021年11月国产数据库排行榜:openGauss闯入前三,Kingbase流行度与日俱增,TDe

    摘要:年月国产数据库流行度排行榜前名达梦本月分数下跌,总分,位于榜单第二位。人大金仓保持增长态势,本月分数大幅上涨,总分,位于榜单第九位。达梦入选其中,位列总榜第国产数据库第。月日,人大金仓与天津科大正式签订联合人才培养协议。2021年11月国产数据库流行度排行榜前15名   达梦本月分数下跌10.88,总分467.45,位于榜单第二位。作为具有完全自主知识产权的国产数据库厂商,今年达梦的...

    waruqi 评论0 收藏0
  • 2021年9月国产数据库大事记

    .markdown-body{word-break:break-word;line-height:1.75;font-weight:400;font-size:15px;overflow-x:hidden;color:#333}.markdown-body h1,.markdown-body h2,.markdown-body h3,.markdown-body h4,.markdown-body...

    suemi 评论0 收藏0
  • 深入理解 Linux Cgroup 系列(一):基本概念

    摘要:原文链接深入理解系列一基本概念是的一项功能它是在一个系统中运行的层级制进程组,你可对其进行资源分配如时间系统内存网络带宽或者这些资源的组合。 原文链接:深入理解 Linux Cgroup 系列(一):基本概念 Cgroup 是 Linux kernel 的一项功能:它是在一个系统中运行的层级制进程组,你可对其进行资源分配(如 CPU 时间、系统内存、网络带宽或者这些资源的组合)。通过使用 ...

    yuanzhanghu 评论0 收藏0

发表评论

0条评论

IT那活儿

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<