资讯专栏INFORMATION COLUMN

泪说新公司使用云服务器后构架的不堪历史

zhouzhou / 1645人阅读

摘要:有一次别人的云服务器被攻击,提供商竟然重启了物理机然后又诸多悲剧出现最大的感恩就是学到了很多知识。

第一阶段(3台):1测试,1web 1数据库

这个是云服务器,配置高的惊人,测试的机子竟然和正式的机子一模一样,只实现了web和数据库分离的构架
维持了3个月,由于物理机故障,3台服务器同时挂掉,网站暂停服务至少一天

第二阶段(4台):1测试,1web 1数据库 另一机房1数据库+web

master-slave:
还是云服务器,配置还是高的惊人, 除了另一个机房实现了web备份和数据库主从外,跟第一阶段没什么差别
因为一次数据库服务器数据页面错误,主库崩溃,web和数据库跨机房了

第三阶段(6台):1测试,1web 1数据库,另一项目1web,1数据库 另一机房1数据库+web

master-master
上一次的教训是数据库修复的时候,发现master的数据必须从slave导出来...数据一致性的要求.
痛定思痛,决定上双master-master,这个时候出现了一个应用层的悲剧,就是多个项目要公用一部分表了,而web却在另在两个服务器上 期间为了解决冲突,把自增id给岔开了

这个阶段最大的悲剧在同一个机房内,web+数据库没有备份的,在某次攻击后,悲剧的发现,web+数据必须切换到那个备份的机房去了

第三阶段...

还在进行中...

推进太困难了,经过2次事故..我有点不想继续既做开发又做运维的了...出现问题的时候大家说,我不知道啊,服务器不归我管理,我怎么操作呢?要讲解运维思路的时候大家又不积极

总结

得出的最大教训就是:云服务器太不稳定了,要以数量取胜,不能同一机柜。有一次别人的云服务器被攻击,提供商竟然重启了物理机..然后又诸多悲剧出现

最大的感恩就是:学到了很多知识。每次事故服务器我都要被迫亲自参与修复,本来不那么熟悉的,一下子被强迫做了很多事情

最近这段时间开始测试的东西有:

Fabric 用于多项目多服务器的代码发布...

Atlas 数据库读写分离中间件,从另一方面说也是屏蔽数据库服务器差异的中间件,这点认识很重要,如果有3台web,当一台出现问题是,3台的数据库连接都要修改,但有了这个中间件,只要把有问题的offline即可...1分钟就能搞定

Fabric 已经上线使用,Atlas 上线遥遥无期..很多坑等待被发现

2014年2月8日补充:

今天因为到期,来不及续费,还剩下10个小时的时间,服务器竟然自动关机了...还好,是关机而已,不是删除服务器....坑啊

2014年2月12日补充:

今天新增加2台服务器,准备内网使用,中国的带宽真TMD的贵.并不是每台都能10M出口带宽的..
因为没有统一的上传文件和图片,每个服务器都把图片上传到自己那台,最近要考虑怎么把这些图片整合起来了,因为图片量比较少,所以准备了一下方案:

rsync + crontab

rsync + inotify

sersync + inotify

inotify + svn

不知道大家还有其它方案么?难点在于多台服务器之间相互rsync...

再次重申云服务器的好处:新开服务器几乎是1小时以内,然后,一定要以数量取胜...

2014年2月13日补充:

今天同一个物理盘所在的云盘上可能有人大量写入数据...导致同一个机柜上的N个机子云盘io 100%... 以前对云主机都没怎么认识,今天真是大开眼界了...

云盘和云主机,另一个大坑就是:天佑同机柜和同物理机的的人都正正当当,不然,一般的人都不知道问题出在哪里

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/7905.html

相关文章

  • SegmentFault 技术周刊 Vol.39 - 什么!务器炸了?

    摘要:有一次别人的云服务器被攻击,提供商竟然重启了物理机然后又诸多悲剧出现。造成微博服务短暂不可用。通过建立工具来诊断问题,并创建一种复盘事故的文化来推动并作出改进,防止未来发生故障。 showImg(https://segmentfault.com/img/bV0jif?w=900&h=385); 相信小伙伴们在上网或者玩游戏的时候一定都遇到过无法访问的情况。服务器炸了的原因有各种各样,下...

    1treeS 评论0 收藏0
  • 稳定高于一切金融行业如何用容器?

    摘要:在谷歌不是这样,谷歌不会把特定的应用装在某台服务器上,业务应用和服务器的强绑定对于谷歌这种量级的数据中心的维护难度太高了。但是金融机构的数据中心规模不像谷歌这么大,所以能做到业务应用和硬件的强绑定。 复杂的基础IT架构是传统金融的现状,如何快速响应用户需求,加快新业务上线速度,缩短产品的迭代周期? 数人云在容器落地金融云的2年实践中,实现金融核心业务技术WebLogic、J2EE、Or...

    scola666 评论0 收藏0
  • 计算与 Cloud Native | 数人CEO王璞@KVM分享实录

    摘要:分享实录云计算技术源于互联网公司,现在云计算已经是下一代企业级的发展趋势。如何做云计算一直是云计算技术的领导者。互联网公司的快速发展,已经印证了云计算技术和云原生应用相比传统构架的巨大优势。 今天小数又给大家带来一篇干货满满的分享——来自KVM社区线上群分享的实录,分享嘉宾是数人云CEO王璞,题目是《云计算与 Cloud Native》。这是数人云在KVM社区群分享的第一弹,之后还有数...

    _Zhao 评论0 收藏0
  • 阿里如何打破Oracle迁移上壁垒

    摘要:摘要第九届中国数据库技术大会,阿里云数据库产品专家萧少聪带来以阿里云如何打破迁移上云的壁垒为题的演讲。于是,阿里云给出了上面的解决方案。 摘要: 2018第九届中国数据库技术大会,阿里云数据库产品专家萧少聪带来以阿里云如何打破Oracle迁移上云的壁垒为题的演讲。Oracle是指数据库管理系统,面对Oracle迁移上云的壁垒,阿里云如何能够打破它呢?本文提出了Oracle 到云数据库P...

    aristark 评论0 收藏0
  • 阿里如何打破Oracle迁移上壁垒

    摘要:摘要第九届中国数据库技术大会,阿里云数据库产品专家萧少聪带来以阿里云如何打破迁移上云的壁垒为题的演讲。于是,阿里云给出了上面的解决方案。 摘要: 2018第九届中国数据库技术大会,阿里云数据库产品专家萧少聪带来以阿里云如何打破Oracle迁移上云的壁垒为题的演讲。Oracle是指数据库管理系统,面对Oracle迁移上云的壁垒,阿里云如何能够打破它呢?本文提出了Oracle 到云数据库P...

    chavesgu 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<