网游类似魔兽世界的服务器维护都是在干嘛?

作者:林路翔,全职程序员,喜欢围棋

来,我作为前网易游戏从业人员来说说真正服务器维护时候在做什么。


服务器维护分成两种,紧急维护和日常维护。


紧急维护一般就是硬件故障或者严重 Bug。这个时候是各个团队最紧张的时候。每个团队都忙个不停。


运营团队会发布公告,安慰玩家,统计损失,编写故障报告,评定故障等级等等

策划团队可能会考虑 Bug 的影响程度,决定要不要回档,或者赔偿什么,赔偿会不会影响经济系统等等。

程序团队最重要的是缩小 Bug 的影响,比如热更新屏蔽玩法,然后解决 Bug。有时候硬件故障会导致整个服务器某些结点负载不均衡,或者万一数据库服务器挂了就得赶紧切数据库。

QC 团队会继续测试一下,包括改好的版本,QC 老大一般有一票否决权决定某个版本是不是放

SA 团队会有人值班紧跟,如果硬件问题就联系 IT 去换啊之类的。

日常维护就流程化多了


运营团队会提前放出更新内容,做好新玩法预热

策划会最后在内服上跑一跑玩法看看有没有问题,然后等着正式开服以后去论坛看玩家反应

程序一般就是更新代码,部署到服务器内部测试,如果架构有改动,就和 SA 配合一起跑脚本改架构。同时,另一拨人会跑一堆脚本,包括和计费的对账脚本,导数据的脚本,更新各种榜单的脚本,预热数据库和 cache 的脚本等等。每个人也会对自己的模块再测试一遍,然后会盯着各种警报

QC 团队也会在服务器上面把本周新玩法和主流程再测试一遍。

其他支持团队就是日常配合工作。

另外看到很多答案都说重启服务器,其实我想说,我们真的很少重启服务器的。每次重启代价都很大。除非硬件更新或者特殊情况是不会重启服务器的。


其实一般意义上讲服务器重启可以理解为两种,一种是硬件重启,一种是服务器进程重启。硬件重启比较少,服务器进程重启基本上是必须的。

很多人问为什么硬件重启代价很大。感觉大家的回答。我直接把评论补充上来。

@曦和风

如果是自动启动的程序的话没有问题,但是服务器很多系统配置和软件设置都要开机后重新折腾,同时,还要和其他的服务器通信,恢复到启动前的状态,或者从其他服务器同步信息,正确处理关机期间的各种操作,事情多,任务重,出错概率大,都不愿意重启吧。

还有人提问为什么维护了这么长时间。我想说,请去客服专区或者论坛发帖,会有一大波运营人员过来安抚你的。


还有人抱怨一个礼拜维护两次这种。我想说 EVE 这种神作是每天早上维护一次呢。维护也是为了大家能更好地游戏啊。(吐槽一下谁让 EVE 用的是 Windows 服务器呢。)

[]ۣۣۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖۖ

修改时间 2016-09-27

真诚赞赏,手留余香
赞赏
随机推荐
Git 删除历史中的大文件或者敏感文件
MySQL汉字转换为拼音
php判断是手机还是电脑访问
网游类似魔兽世界的服务器维护都是在干嘛?
Node.js 编码规范
Js抛物线加入购物车
vue.js 怎么给v-html指令绑定的数据添加样式
javascript加载顺序LABjs
php解析模板路径
Ecshop二次开发之后台添加新栏目