出品 | 滴滴技术作者 | 张健 在大家的印象中,运维人员更多的是从属业务的角色。在传统的企业IT中,没有快速的产品迭代,没有每天成百上千次的服务发布和伸缩容,这样的角色看似没有问题。但在如今的 DevOps 时代,日常...
在云计算时代,开发和运维的结合变得越来越重要。在DIFF论坛第一期,前新浪SAE运维主管,郑志勇,分享了《一个开发眼中的运维》根据自己从开发人员转型运维之后的心得,谈如何把在开发上的运用抽象思维方式运用到运...
...率,那如何提升测试环境的稳定性?阿里巴巴应用与基础运维平台高级开发工程师张劲,通过阿里内部实践,总结了一套测试环境稳定性提升方法,供大家参考。 点此查看原文:http://click.aliyun.com/m/43287/ 导读:测试环境是研发/...
...们不会超过1周。 2.自动化一切,不单是测试和部署,运维也需要自动化。 3.内建质量,尽早的测试可以显著降低测试成本,保障交付流水线通畅,增强环境稳定性。 4.每个人都为交付过程负责,不单单编码完成交给测试...
...多,组件之间相互关联,提供的应用也很多。 1.2 大数据运维的挑战 运维这样一个大规模的平台要面对哪些挑战呢? 首先来看大数据运维的特点。 l 集群规模、数据量大,且爆发式增长。大数据从字面上理解就是大,数据...
随着大数据、机器学习和 AI 技术的飞速发展,智能化运维成为运维的热点领域。Gartner 的报告宣称,到 2020 年,将近 50% 的企业将会在他们的业务和 IT 运维方面采用 AIOps,远远高于今天的 10%。尽管 AIOps 还是一个新名词,但它无...
...failover能力或降级方案。其次,稳定性要重点做好监控和运维,确保故障及时发现,并具备高效的问题定位和处置恢复能力。 实际上,在面临了以上种种业务挑战之后,越来越多的直播平台已经在将业务下沉到边缘,充分利用边...
...,新技术层出不穷,如何以标准化的方式进行应用交付及运维?这个问题也非常典型,是很多传统行业的企业都会碰到的问题。新技术该如何选择、如何落地、如何交付?最后,秒杀、红包等高并发应用增长,如何应对弹性应用...
从电子游戏到DevOps在一个项目团队中,开发与运维之间的关系像极了知名大型游戏《刺客信条》里的故事:开发就是追求自由的刺客联盟——我喜欢用各种新颖技术手段去满足用户爸爸那些花里胡哨的需求,你别管那技术好...
...着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以...
胡凯,bilibili运维负责人,曾经就职于金山软件、金山网络、猎豹移动,负责运维相关工作。Bilibili是国内最大的年轻人潮流文化娱乐社区,银河系知名弹幕视频分享UGC平台。 95后二次元新人类的追捧,让以视频弹幕、UP主闻...
ChatGPT和Sora等AI大模型应用,将AI大模型和算力需求的热度不断带上新的台阶。哪里可以获得...
一、活动亮点:全球31个节点覆盖 + 线路升级,跨境业务福音!爆款云主机0.5折起:香港、海外多节点...
大模型的训练用4090是不合适的,但推理(inference/serving)用4090不能说合适,...