检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
不分批:用户所有待执行的机器会全部在同一批次。 图5 选择分批策略 设置“熔断策略”。 熔断策略:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图6 设置熔断阈值 单击“提交”,执行脚本。 图7 “提交”按钮 父主题:
添加排班人员 前提条件 设置排班人员前,您需要在人员管理中完善您的人员列表,并且需要创建完成排班场景和对应的排班角色。 操作场景 不同排班方式和排班维度添加排班人员会有所不同,具体介绍如下。 排班类型 固定班次 轮班(周一 -- 周日) 全局排班 全局排班+固定班次场景添加排班人员
创建视图 提供用户创建视图的能力,用户可自由配置筛选范围,用于在跨账号场景下访问华为云中的资源信息。 操作场景 通过Cloud Operations Center创建视图。 注意事项 最多支持创建 10 个视图。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,单击“跨账号资源”。
操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。 在集成管理配置页面
订阅实例发送通知。 通知对象 是 排班下场景单选,场景下角色可多选;个人可多选 该处为设置需要通知的对象。设置为排班时,通知模块会自动获取当前排班下人的列表,给对应的人发送通知;设置为个人时,直接会给对应的人发送通知。 通知规则 / / 举例:如A规则设置了a值,若事件单中A规则
阅实例发送通知; 通知对象 是 排班下场景单选,场景下角色可多选;个人可多选; 该处为设置需要通知的对象。设置为排班时,通知模块会自动获取当前排班下人的列表,给对应的人发送通知;设置为个人时,直接会给对应的人发送通知; 通知规则 / / 举例:如A规则设置了a值,若事件单中A规则
当触发类型为问题单,状态类型有 未受理 定位出方案中 待现网实施 待验证 SLA目标 可开启SLA目标,在开启SLA之后,最多可以设置7天 通知对象 通知对象分为 工单责任人 排班 个人 其中工单责任人是默认通知 通知渠道 通知渠道分为 默认 短信 企业微信 钉钉 邮件 飞书 不通知
流转规则将所有接收的集成原始告警进行抑制、降噪、去重、路由分派操作,支持多监控源纵向抑制、横向收敛,进行多维降噪;支持每个流转规则配置事件时默认分配对象和通知策略,而实现更准确的通知。 Global 集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警
选择需要修复的实例 设置分批策略。 分批策略: 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 图2 选择分批策略 设置熔断策略。 熔断
输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 输入登录凭证。 登录凭证: 密码:用户可使用云服务器原密码或重新设置密码,请输入并牢记密码。 密钥对:用户可以选择
输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 输入“选择镜像ID”。 输入登录凭证。 登录凭证: 密码:用户可使用云服务器原密码或重新设置密码,请输入并牢记密码。
输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 输入登录凭证。 登录凭证: 密码:用户可使用云服务器原密码或重新设置密码,请输入并牢记密码。 密钥对:用户可以选择
若选择高风险,入库人工审核默认开启。 设置时区,当选中单次执行时,选择单次触发定时任务的时间,当选中周期执行时,会弹出“简单周期”和“Corn表达式”选项,帮助用户自定义执行周期,该定时任务会根据用户自定义的执行周期循环执行,直到规则结束时间,如表2所示。 图5 定时设置 表2 参数说明 参数名称
选择需要扫描的BMS实例 设置分批策略。 分批策略: 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 图7 选择分批策略 设置熔断策略。 熔断
不分批:用户所有待执行的机器会全部在同一批次。 图5 选择分批策略 设置“熔断策略”。 熔断策略:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图6 设置熔断阈值 单击“提交”执行脚本。 图7 “提交”按钮 父主题: 脚本管理
角色描述:排班角色的详细说明。 排班方式 固定班次:对人员进行固定排班管理,直接为排班角色设置相应的人员。 轮班(周一 -- 周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班。 排班维度 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关。 应用排班:排班需按照应用,Region(可选)创建,不同应用排班不同。
发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。
Operations Center查看应用运维管理中仪表盘信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看应用监控信息。 单击“ 自定义看板”设置需要监控的应用。 图1 应用监控信息 父主题: 总览