资讯专栏INFORMATION COLUMN

CRS启动报错CRS-1656处理分享

IT那活儿 / 2079人阅读
CRS启动报错CRS-1656处理分享

咧咧故事:内部转岗在很多公司其实是很平常的一件事情,但最近身边出现一件事情,让我觉得每个人的思维边界还是需要通过不断学习来扩充的。事情的经过大概是某个场地的一个员工,来了2年时间,做的事情都是一成不变,为了让他有更好的成长,leader给其安排轮岗,找他沟通安排时,该员工直接炸毛,表示这种安排对他是一种侮辱,且以离职作为抗拒的理由。


咧咧心得:相信每一个有点儿成长的组织都是在交付项目的同时,想方设法在交付项目的同时,提升团队的技术能力水平,毕竟自己的本事才是自己真正的衣食父母。但饭端到嘴边,连张嘴都觉得累,这事儿就没法儿玩了。由此想到我们说的焦虑,打开一个APP铺天盖地的IT40岁焦虑的文章,有段时间我也焦虑了,但发现焦虑不是没用,是没一点儿用。那与其焦虑,不如该学点儿什么学点儿什么,该让自己长点儿本事的就长点儿本事。但是,像这种饭送到你嘴边都嫌累的,更是需要多读书,多学习。我一直信奉人蠢多读书的信条,因为我是一个蠢人,但也得活不,也得养老养小不,人生别抱怨,以一份感恩的心态,干就完了。


咧咧启示:这个人能在这个团队呆2年,现在才被发现,说明这个团队的管理也是出了问题的。除非公司有矿,否则是不会允许一个员工一成不变只做一类事情,还这样任性的无所畏惧。这里给我们的启示是团队组建过程中的选才问题,每个成熟的团队组织选才都应该有自己的指标依据,否则天马行空,靠第六感,就像信号不稳定的导航,后果就是导到坑里去了,下面这张图是我选择团队成员时候总结的考察项,供各位看官参考:








下面是另外的故障处理,上下无关联




技术分享:


一、故障场景:

节点2因为主机出现硬件故障,硬件修复后主机启动,主机重启后CRS自动拉起失败,报错如下:

CRS alert日志:

2018-12-15 11:43:03.118

[cssd(6116)]CRS-1603:CSSD on node hneoms6 shutdown by user.

2018-12-15 11:43:03.137

[ohasd(16642)]CRS-2765:Resource ora.cssdmonitor has failed on server hneoms6.

2018-12-15 11:43:12.344

[ohasd(16642)]CRS-2767:Resource state recovery not attempted for ora.diskmon as its target state is OFFLINE

2018-12-15 11:43:25.815

[cssd(8639)]CRS-1713:CSSD daemon is started in clustered mode

2018-12-15 11:43:34.832

[cssd(8639)]CRS-1637:Unable to locate configured voting file with ID 4b5ba6dc-75f94f99-bf952ee3-24d218aa; details at (:CSSNM00020:) in /app/oracle/11203/grid/log/hneoms6/cssd/ocssd.log

2018-12-15 11:43:34.832

[cssd(8639)]CRS-1705:Found 0 configured voting files but 1 voting files are required, terminating to ensure data integrity; details at (:CSSNM00021:) in /app/oracle/11203/grid/log/hneoms6/cssd/ocssd.log

2018-12-15 11:43:34.832

[cssd(8639)]CRS-1656:The CSS daemon is terminating due to a fatal error; Details at (:CSSSC00012:) in /app/oracle/11203/grid/log/hneoms6/cssd/ocssd.log

2018-12-15 11:43:34.888

[cssd(8639)]CRS-1603:CSSD on node hneoms6 shutdown by user.

2018-12-15 11:43:34.907

[ohasd(16642)]CRS-2765:Resource ora.cssdmonitor has failed on server hneoms6.

2018-12-15 11:43:41.064

[ohasd(16642)]CRS-2771:Maximum restart attempts reached for resource ora.cssd; will not restart.

2018-12-15 14:20:26.769

[mdnsd(18163)]CRS-5602:mDNS service stopping by request.

2018-12-15 14:20:29.981



二、环境背景:

该套RAC安装时使用udev定义磁盘路径/asmdisk/下的磁盘,其软链接指向/dev/rdsk/emcpower*下的磁盘。

后面由于ASM磁盘空间不足新加一批磁盘,此批新加磁盘未使用udev重定义磁盘路径,直接创建成新的磁盘组。

当时基于ASM需要识别新磁盘的考虑,将asm_diskstring的值从/asmdisk/修改成/asmdisk/,/dev/rdsk/emcpower*。



三、处理思路及过程;

1)查看CRS发现无法识别votedisk。

2)通过kfed read votedisk发现磁盘可读,并查看votedisk的权限是正确的。grid,oracle用户均可读写。


3)进一步分析发现/asmdisk/及/dev/rdsk/emcpower*均可以读取votedisk,按正常思维来看,asm_diskstring是完全没问题的。

换个角度思考,是不是因为这2个路径都能读取相同的votedisk导致ASM出现识别混乱呢?


4)方向有了那就开始干吧,在存活节点asm_diskstring修改成只有一个路径的值/asmdisk/。


5)在节点2把一些已经拉起的进程宕下来,然后重新拉起CRS,发现CRS拉起成功。但是节点2由于新的ASM磁盘组由于新磁盘路径问题,

识别不到磁盘导致没有mount。将asm_diskstring的值从/asmdisk/修改成/asmdisk/,/dev/rdsk/emcpower*,这样就可以将新的ASM磁盘组mount起来。



四、后续如何做才能避免此类故障;

如果不修改asm_diskstring,后面只要CRS重启都会出现CRS无法自动启动的相同故障。

后续通过将后面加入的新磁盘通过udev重定向至/asmdisk/目录下,

然后将asm_diskstring的值从/asmdisk/,/dev/rdsk/emcpower*修改成/asmdisk/即可永久避免此类故障。



五、使用到的命令:

1、存活节点操作

su - grid

sqlplus / as sysasm

create pfile=/grid/p.ora from spfile;

alter system set asm_diskstring=/asmdisk/ scope=spfile;


2、宕掉节点操作

su - root

crsctl stop crs -f

crsctl start crs

su - grid

sqlplus / as sysasm

alter system set asm_diskstring=/asmdisk/,/dev/rdsk/emcpower* scope=both;

alter diskgroup xxx mount;


su - oracle

sqlplus / as sysdba

startup



--alter system set asm_diskstring=/asmdisk/ scope=both;






文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/130248.html

相关文章

  • DBASK问答集萃第四期

    摘要:问题九库控制文件扩展报错库的扩展报错,用的是裸设备,和还是原来大小,主库的没有报错,并且大小没有变,求解释。专家解答从报错可以看出,控制文件从个块扩展到个块时报错,而裸设备最大只支持个块,无法扩展,可以尝试将参数改小,避免控制文件报错。 链接描述引言 近期我们在DBASK小程序新关联了运维之美、高端存储知识、一森咖记、运维咖啡吧等数据领域的公众号,欢迎大家阅读分享。 问答集萃 接下来,...

    SKYZACK 评论0 收藏0
  • 入门Leaflet之小Demo

    入门 Leaflet 之小 Demo 写在前面 ---- WebGIS 开发基础之 Leaflet GIS 基本概念:GIS、Map、Layer、Feature、Geometry、Symbol、Data(Point、Polyline、Polygon)、Renderer、Scale、Project、Coordinates; GIS 开发概述:架构模式、常用平台和 SDK、二维三维 使用 Lea...

    Eminjannn 评论0 收藏0
  • 用Python做地图投影 - 多面孔的世界

    摘要:如需转载,请在显著位置注明个人微信公众号为什么要做地图投影简而言之,地球表面是一个三维的曲面,在曲面上进行测量是非常困难的。拓展同一个世界,不同的面孔链接在不同投影下的这个世界。。。 (如需转载,请在显著位置注明个人微信公众号stdrei) 为什么要做地图投影 简而言之,地球表面是一个三维的曲面,在曲面上进行测量是非常困难的。不信你拿个地球仪量一下两点的距离或者计算个夹角试试。将三维的...

    widuu 评论0 收藏0
  • 使用Python处理文本,整理信息(2)

    摘要:通过函数找到所有符合上述要求的文本内容,并赋值给,通过打印,该值是一个,每一个匹配项作为一个列表单元。循环遍历上述的查找结果通过查找出来的内容,使用访问,并将剥去,就变成槽位信息了。通过查找出来的内容,经过处理就变成信息了。 处理思科设备 show inventory输出内容 任务目标 通过Python读取show inventory的内容,并将设备的槽位、模块型号和序列号自动写入CV...

    TIGERB 评论0 收藏0
  • mongo的geo查询

    摘要:不过这样的顺序对于使用弧度查询,很容易出错,即查询要求顺序是经度纬度,即数据和参数都是这样的顺序。对于要指定之类的入参时,使用非要注意单位换算对于使用查询的时候,以及自动设置,无需关心入参单位转换。 maven org.springframework.boot spring-boot-starter-data-mongo...

    Anchorer 评论0 收藏0
  • 【图像转换】基于matlab灰度图像转换彩色图像【含Matlab 1233期】

    摘要:一获取代码方式获取代码方式完整代码已上传我的资源图像转换基于灰度图像转换彩色图像含期获取代码方式通过紫极神光博客主页开通年度会员,凭支付凭证,私信博主,可获得此代码。 ...

    Profeel 评论0 收藏0

发表评论

0条评论

IT那活儿

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<