故障分析SEARCH AGGREGATION

首页/精选主题/

故障分析

Clickhouse

...您在使用ClickHouse服务时不再需要为集群的配置、选型、故障、运维、开发工具等操心。

故障分析问答精选

cdn服务器发生故障怎么办

问题描述:关于cdn服务器发生故障怎么办这个问题,大家能帮我解决一下吗?

刘明 | 497人阅读

如何全面分析

问题描述:关于如何全面分析这个问题,大家能帮我解决一下吗?

李文鹏 | 277人阅读

数据分析师需要懂编程吗?

回答:谢谢邀请!数据分析师通常分成两种,一种是应用级数据分析师,另一种是研发级数据分析师,区别就在于是否具备算法设计及实现的能力。应用级数据分析师通常需要掌握各种数据分析工具,把业务模型映射到数据分析工具上,从而得到数据分析的结果。数据分析工具比较多,比如Excel就是一个传统的数据分析工具,另外还有Minitab、LINGO、JMP等,要想全面掌握这些工具的使用需要具备一定的数学基础和统计学基础。通常...

txgcwm | 1091人阅读

数据分析师与大数据分析师所做工作有什么区别?

回答:数据分析是干什么的?在企业里收集数据、计算数据、提供数据给其他部门使用的。数据分析有什么用?从工作流程的角度看,至少有5类分析经常做:工作开始前策划型分析:要分析一下哪些事情值得的做工作开始前预测型分析:预测一下目前走势,预计效果工作中的监控型分析:监控指标走势,发现问题工作中的原因型分析:分析问题原因,找到对策工作后的复盘型分析:积累经验,总结教训那数据分析是什么的?数据分析大体上分3步:1:获...

B0B0 | 785人阅读

怎么设置智能分析ip

问题描述:关于怎么设置智能分析ip这个问题,大家能帮我解决一下吗?

苏丹 | 278人阅读

如何学习数据分析?

回答:优秀的数据分析师并不能速成,但是零经验也有零经验的捷径。市面上有《七周七数据库》,《七周七编程语言》。今天我们就《七周七学习成为数据分析师》,没错,七周。第一周:Excel学习掌握如果Excel玩的顺溜,可以略过这一周。但很多人并不会vlookup,所以有必要讲下。了解sum,count,sumif,countif,find,if,left/right,时间转换等。excel的各类函数很多,完全不...

zhigoo | 368人阅读

故障分析精品文章

  • 百度在故障定位场景下的监控数据可视化探索

    ...总数已达数十亿。面对如此海量的数据,在日常运维(如故障诊断、成本分析、性能优化等场景)过程中,传统的统计图表难以有效直观地展示如此庞大的数据。因此,优秀的监控数据可视化产品就呼之欲出,它既要数据准确、...

    张春雷 评论0 收藏0
  • 阿里如何做到百万量级硬件故障自愈?

    ...数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务...

    Sanchi 评论0 收藏0
  • 无人值守时代,运维如何保障发布质量?

    摘要: 阿里巴巴千亿交易背后,如何尽量避免发布故障?在面对实际运维过程中遇到的问题该如何解决?阿里巴巴运维技术专家少荃,给我们带来了解决方案和思路。 导读:阿里巴巴千亿交易背后,如何尽量避免发布故障?...

    LancerComet 评论0 收藏0
  • 无人值守时代,运维如何保障发布质量?

    导读:阿里巴巴千亿交易背后,如何尽量避免发布故障?在面对实际运维过程中遇到的问题该如何解决?近日,在GOPS大会上,阿里巴巴运维技术专家少荃,给我们带来了解决方案和思路。 作者:陆叶平(花名少荃),阿里...

    Yu_Huang 评论0 收藏0
  • 捕获和增强原生系统的可观测性来发现错误

    ...践的时候,我一直在思考如何更好的发现 TiDB 整个系统的故障。最开始,我们参考的就是 Chaos Engineering 里面的方式,观察系统的稳定状态,注入一个错误,然后看 metrics 上面有啥异常,这样等实际环境中出现类似的 metrics,我们...

    Tangpj 评论0 收藏0
  • AIOps在携程的践行

    ...景主要包括以下两个领域:可用性保障:异常指标检测、故障智能诊断、故障预测、故障自动修复等;成本优化:容量规划、资源利用率提升、性能优化等。接下来介绍下携程在这两个领域下的部分典型场景,以及相关算法简介...

    MingjunYang 评论0 收藏0
  • 2012年6月14日Amazon云服务故障分析

    上周四即6月14日,Amazon位于美国东部的数据中心出现故障,并影响了AWS多项云服务以及基于之上的Heroku、Quora等知名网站。16日,Amaozn公布了事故分析。事故是由公共电网故障引起,并引发了一系列连锁故障。: 事情的起因是电...

    Luosunce 评论0 收藏0
  • 根因分析初探:一种报警聚类算法在业务系统的落地实施

    ...录关键执行点、程序执行错误时的现场信息等。系统出现故障时,运维人员一般先查看错误日志,定位故障原因。当业务流量小、逻辑复杂度低时,应用出现故障时错误日志一般较少,运维人员一般能够根据错误日志迅速定位到...

    Loong_T 评论0 收藏0
  • 阿里巴巴发布智能运维故障管理AI+生态计划

    ...任何企业或合作伙伴均可以简单方便的接入阿里巴巴智能故障管理平台,通过对接入数据的训练学习实时提供异常检测、关联分析、根因定位的能力,使原有的IT管理模型瞬间实现低成本的智能化升级,为IT同行们更便捷的提升...

    codecraft 评论0 收藏0
  • 清华裴丹:AIOps 落地路线图

    ...业务的收益和成本。目前已有运维方法的主要难点是突发故障的发现、止损、修复和规避,也是我们要解决的关键问题。这些难点导致我们运维人有很多痛点。我相信在座的各位都看到过这幅图,我们运维人是全年365天7×24小时...

    Aomine 评论0 收藏0

推荐文章

相关产品

<