云“战疫”:8天扩容100万核,我们是这样跟踪的
常见的监控手段为阈值监控,对业务形态比较熟练的开发、运维人员在指标上设置一个恰当的阈值,一旦偏离阈值,系统即发送告警到开发人员。 然而阈值设置的合理性不易判断。在数千万、上亿用户的场景下,阈值少设或多设 0.01% 都代表数千、上万人的体验受损
常见的监控手段为阈值监控,对业务形态比较熟练的开发、运维人员在指标上设置一个恰当的阈值,一旦偏离阈值,系统即发送告警到开发人员。 然而阈值设置的合理性不易判断。在数千万、上亿用户的场景下,阈值少设或多设 0.01% 都代表数千、上万人的体验受损