检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
SLO列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 筛选SLO 单击列表中的,查看详情。 图3 SLO详情 单击右上角“创建SLO”,选择对应的应用与SLO目标值创建SLO。
查看SLA列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 检索公共SLA模板 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看公共SLA详情 所有用户可查看系统预置的公共SLA。
单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。 在“故障影响”模块,单击“新增影响应用”,弹出“新增影响应用”页面。 根据页面提示,设置新增的影响应用信息。 单击“确定”完成添加。 图1 新增影响应用 在主屏可以看到添加的应用,支持填写故障开始时间、恢复时间及故障描述。提交后该应用的状态会变为恢复状态。
单击“+添加任务”,为步骤添加任务。任务添加完成后,单击“完成”。所有任务添加完成后,单击“确定”。 图11 添加任务 单击“+操作类型”,设置当前任务的操作类型,操作类型分为云服务API、控制、自定义脚本三种。 云服务API:包含ECS相关操作原子、执行API和等待API调用结果。ECS操作详见:ECS操作。
问题级别:必填,选择问题级别,当前包含致命,严重,一般和提示 问题类型:必填,选择问题的类型 责任人:必填,选择责任人后该问题会流转至对应的责任人名下。当前支持排班和个人,若需设置排班,参考排班管理 问题管理若需要收到通知提醒,需要在通知管理中配置通知规则,具体操作详情参考通知管理。 父主题: 问题管理
填写任务名称,操作描述。 图6 添加基本信息 单击“输入”,按需选择commandType (命令类型) :SHELL、PYTHON或BAT。设置executeUser (命令执行用户)、timeout (命令执行超时时长(秒)) 、successRate (成功率阈值(%)) 、commandContent
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。
资源运维权限和授权项说明 如果您需要对您所拥有的COC的资源运维操作进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用ECS服务的其它功能。
约束与限制 云运维中心COC为全局服务,但在部分特殊区域(专属区域、HCSO等)暂不支持,如您有相关需求,请联系COC侧沟通处理。 在使用云运维中心COC时,您需注意以下使用限制,详见表1。 表1 云运维中心使用限制 功能模块 对象 使用限制 公共 补丁/脚本/作业/ECS操作 单个操作任务最多支持选择200台实例。
、多形式、可自定义的人员管理模式。您可以在排班管理页面创建排班场景、排班角色,并将“人员管理”中的人员添加到排班场景、排班角色中完成排班的设置。 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”,进入“排班管理”页面。 在排班管理页面,单击“创建排班”。 图2 创建排班 新增或选择已有的排班场景和排班角色。
查看资源详情 提供用户查看资源详情的操作。 操作场景 通过Cloud Operations Center查看已关联应用的资源详情。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,在“弹性云服务器ECS”模块
演练任务 操作场景 管理混沌演练任务,查看演练记录。 创建演练任务 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签。 单击“创建演练任务”,进入创建演练任务页面,也可以通过演练规划接单功能进入创建演练任务页面,具体步骤可以参考演练规划章节。 图1
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对
执行自定义脚本 功能介绍 执行脚本 脚本入参、超时时间、执行用户、资源受限 脚本入参支持20个。 单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。 URI POST /v1/job/scripts/{script_uuid}
查看待办中心列表 单击搜索框,弹出搜索条件列表;选择对应的搜索条件,输入对应的值,单击回车按钮即可搜索数据。 搜索框后的图标依次支持:刷新列表数据,设置列表展示字段。 图4 添加筛选条件 选择“全部待办”、“待处理的待办”、“我处理的待办”、“我创建的待办”对应的页签,展示对应的待办列表。
ReviewerInfo objects 审批人,不填写不需要审批 数组长度:0 - 5 protocol 否 String 审批消息通知协议,用于通知审批人 DEFAULT:默认 SMS:短信 EMAIL:邮件 DING_TALK:钉钉 WE_LINK:welink WECHAT:微信