【拒绝背锅】运维故障处理指南 运维

【拒绝背锅】运维故障处理指南

运维的耻辱感运维团队缺少体系和全局观的支撑,导致运维后面的阶段性发展是碎片式的。碎片式的运维工作推进,运维人或者周边团队自然没法理解运维工作的意义和价值。 体系是要求运维团队能给出整体的运维框架(价值...
阅读全文
运维故障处理指南方针 运维

运维故障处理指南方针

运维利器之网络流量分析1.故障处理原则 故障处理的原则只有两个: 以恢复业务优先 及时升级 1.1 恢复业务优先 恢复业务优先是指,不管在任何情况下,也不管任何级别的故障,都要先做到恢复业务,这个和故...
阅读全文
运维笔记丨故障处理指南 运维

运维笔记丨故障处理指南

运维心法 | 6大技能让你告别背「锅」从事运维一年半,遇到过各式各样的问题,数据丢失,网站挂马,误删数据库文件,黑客攻击等各类问题。 今天想简单整理一下,分享给各位小伙伴,熟读此指南,告别背锅侠。 一...
阅读全文
运维会这个“必杀技”,稳了! 运维

运维会这个“必杀技”,稳了!

运维不仅仅是Linux居然还要懂这这些备份 做最好的计划,做最坏的打算。 gitlab删库事件的教训犹在眼前,丢失了几小时的数据,虽然大部分的备份策略都失效了,但还是挽救了几小时前的一个备份,才没有造...
阅读全文
运维利器之网络流量分析 运维

运维利器之网络流量分析

提起网络流量分析技术,运维的小伙伴们一定不陌生,在日常数据中心运行维护工作中,我们不时遇到网络大流量分析、应用响应缓慢、交易失败率高、第三方专线丢包突发、源端口复用导致拆链异常等等不易定位的问题,这时...
阅读全文
运维自动化闭环,从腾讯走出来的实践 运维

运维自动化闭环,从腾讯走出来的实践

我结合自己在运维方面的一些工作经验,介绍一下怎么样去设计和建设一套完整的运维系统以便支持分布式架构的系统。 首先简单自我介绍下,本人从事运维相关的工作有很长一段时间了,应该有十几年了吧。 我的第一份工...
阅读全文
运维团队真的很难管理与沟通吗? 运维

运维团队真的很难管理与沟通吗?

对大多数人来说,一听到运维团队,首先映入眼帘的就是工程师和工程师文化,相信很多人对他们的第一印象就是技术人员比较闷,很难沟通,天天装作键盘侠,宁可低头打字聊天也不愿抬头面对面说话。 所以很多人认为技术...
阅读全文