运维工程师必备技能:网络排错 运维

运维工程师必备技能:网络排错

数据中心IT运维之数据采集篇企业级数据中心IT运维建设工作第一步也是最重要的一步,数据管理。很多情况下,企业考虑运维平台时,会侧重技术框架、开发模式、软件品牌等因素,比如大数据架构、paas、saas...
阅读全文
【拒绝背锅】运维故障处理指南 运维

【拒绝背锅】运维故障处理指南

运维的耻辱感运维团队缺少体系和全局观的支撑,导致运维后面的阶段性发展是碎片式的。碎片式的运维工作推进,运维人或者周边团队自然没法理解运维工作的意义和价值。 体系是要求运维团队能给出整体的运维框架(价值...
阅读全文
运维故障处理指南方针 运维

运维故障处理指南方针

运维利器之网络流量分析1.故障处理原则 故障处理的原则只有两个: 以恢复业务优先 及时升级 1.1 恢复业务优先 恢复业务优先是指,不管在任何情况下,也不管任何级别的故障,都要先做到恢复业务,这个和故...
阅读全文
运维笔记丨故障处理指南 运维

运维笔记丨故障处理指南

运维心法 | 6大技能让你告别背「锅」从事运维一年半,遇到过各式各样的问题,数据丢失,网站挂马,误删数据库文件,黑客攻击等各类问题。 今天想简单整理一下,分享给各位小伙伴,熟读此指南,告别背锅侠。 一...
阅读全文
运维利器之网络流量分析 运维

运维利器之网络流量分析

提起网络流量分析技术,运维的小伙伴们一定不陌生,在日常数据中心运行维护工作中,我们不时遇到网络大流量分析、应用响应缓慢、交易失败率高、第三方专线丢包突发、源端口复用导致拆链异常等等不易定位的问题,这时...
阅读全文
运维自动化闭环,从腾讯走出来的实践 运维

运维自动化闭环,从腾讯走出来的实践

我结合自己在运维方面的一些工作经验,介绍一下怎么样去设计和建设一套完整的运维系统以便支持分布式架构的系统。 首先简单自我介绍下,本人从事运维相关的工作有很长一段时间了,应该有十几年了吧。 我的第一份工...
阅读全文
运维自动化之殇 | 高效运维最佳实践05 运维

运维自动化之殇 | 高效运维最佳实践05

这些年来,大家都在谈运维自动化。但是否也会困惑于“只见树木、不见森林”?或者说,做了几年的运维自动化,但依然不能确定还有哪些工作没做?还有,怎样更优雅的实施运维自动化? 另外,运维自动化是万能的么?有...
阅读全文