从基础搭建一个自动化运维体系
DevOps的出现有其必然性。在软件开发生命周期中,遇到了两次瓶颈。第一次瓶颈是在需求阶段和开发阶段之间,针对不断变化的需求,对软件开发者提出了高要求,后来出现了敏捷方法论,强调适应需求、快速迭代、持续交付。第二个瓶颈是在开发阶段和构建部署阶
无数据,不上班!运维“数据思维”至关重要?
信通院的一些分析数据表明,企业IT的信息化历程逐渐完成,同时企业对IT的精益运行的需求越来越迫切,在这个场景下,数据的思维和使用能力成为制约提升IT生产效率的桎梏。 笔者以为,企业数字化的范畴放在运维领域,更多的场景还处在数据量化的扩展,因此除
怎样从基础思考设计你的 DevOps 运维服务体系?
原始阶段,运维工程师与各部门无数的磨合、探索下,慢慢形成了最初的体系,其无形的规范着运维的工作和注意事项,工程师通过这个纲领开展日常工作并保障业务的健康发展,这个阶段可以说是制度为王、制度规范,没有系统的运维平台,有的只是零散的一些大小
运维:终于不用时刻准备着数万实例的Redis集群了!
当前的Redis Cluster部署在物理机集群上,为了提高资源利用率节约成本,多业务线的Redis集群都是混布的。由于没有做CPU的资源隔离,经常出现某Redis节点CPU使用率过高导致其他Redis集群的节点争抢不到CPU资源引起时延抖动。因为不同的集群混布,这类问题很
麻利地排查各类系统故障的运维方法
今天准备谈下对于IT人员面对技术类问题分析和解决的一些思路和实践总结,在很早以前我就谈到过,对于开发人员在后期需要的不是简单的新业务功能的设计和开发能力,而是问题分析和解决能力。这类问题分析和解决本身又包括了两个方面内容: 其一是IT系统运行
什么是SRE?这篇文章告诉你SRE运维体系
在任何有一定规模的企业内部,一旦推行起来整个SRE的运维模式,那么对于可观测性系统的建设将变得尤为重要,而在整个可观测性系统中,通常我们会分为如下三个方面: 指标监控:即各种指标监控,比如基础资源指标,服务性能指标,业务的调用指标。 日志:各
异曲同工,对比BAT的运维文化
大公司中的运维工作不仅面临着分工的纷繁复杂,同时还要经受着峰值流量的冲击。那么,大公司的运维工作都是如何管理的呢?本文将以BAT为例,为你揭开大型互联网公司运维思想的冰山一角。 腾讯:服务化、标准化、自动化和产品化 当运维团队只有几个人的时候
运维自我完善:怎样做好企业 IT 运维工作
随着信息技术的发展以及企业业务的不断扩张,运维人员所面临的系统架构越发的复杂,关联度越发紧密。对运维人员的要求也会越来越高,打造个个都是高手,对业务系统了如指掌。 1、需要运维人员快速转变观念,学会通过主动运维的方式应对复杂多变的 IT 问题
自动化运维落实到位的三点前提及常用工具对比
开篇的时候说了对于不同的人眼中的自动化运维意味着什么,这些理解站在点的角度上或者说站在非领导的角度上理解都是没有问题的,但是如果作为一个运维方面的领导理解仅仅理解到以上层面那就有点欠缺了,在我看来至少是缺乏了更为抽象的理解,缺少了理论的
运维人之运维的脸面
随着信息技术在各行各业越来越广泛地应用,社会上对IT运维的需求不断增加,同时由于云计算等技术的普及和成熟,弹性供给、按需付费、快速响应等特点使企业上云的意愿更加强烈,对传统运维人员的需求不增反减。技术的进步对传统行业带来的冲击是致命的,就