检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“验证关闭”。 设置“验证关闭”信息。 表1 验证关闭参数说明 参数 说明 验证结论 可选项“已解决”、“未解决”。 选择“未解决
脚本工单 展示脚本工单基本信息 展示批次列表 展示实例状态统计信息 展示批次详情 展示工单列表 操作脚本工单 父主题: API
“基础信息”参数配置 表3 “基础信息”参数说明 参数 示例 说明 演练任务名称 test-drill 根据命名规则,自定义演练任务的名称。 期望恢复时长(分钟) 3 从故障发生到故障恢复的预期时间 单击“添加一个新的攻击任务,还可创建5个攻击任务”,进入添加攻击新的攻击任务页面。
查看账号密码:用户可以查看在线托管资源和已开启改密策略资源的账号密码。注意:只有正常态的改密状态和导入的账号能获取到账号密码。 重置密码:重置密码会重置主机下所有“改密状态”为正常的账号的密码(导入的账号除外)且不可逆,重置后可在“查看账号密码”中查看重置密码结果。 导入账号 1、导入形式的ECS资源账号密码不参与
P5:非系统业务异常,属于客户咨询、请求类问题。 事件类别 可选参数。在下拉列表选择事件的类别。 区域 可选参数。默认“不涉及”。在下拉列表选择事件发生的区域。 企业项目 在下拉列表中选择企业项目。 故障发生时间 请填写故障发生的时间。 故障应用 在下拉列表选择事件涉及的故障应用。 业务是否中断
概述 事件管理是对应用的所有事件进行管理,包含事件的受理、驳回、转单、处理到闭环整个生命周期管理。事件来源包含流转规则产生的事件、通过告警创建的事件及人工创建的事件。 事件管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。 事件处理流程: 事件被创建后状态为“未受理
P5:非系统业务异常,属于客户咨询、请求类问题。 事件类别 可选参数。在下拉列表选择事件的类别。 区域 可选参数。默认“不涉及”。在下拉列表选择事件发生的区域。 企业项目 在下拉列表中选择企业项目。 故障发生时间 请填写故障发生的时间。 故障应用 在下拉列表选择事件涉及故障的应用。 业务是否中断 可选项“是”、“否”。
区域可用来区分同一个应用在不同区域的排班。若您的业务和区域无关,您可以忽略区域。 单击“添加人员”,填写排班信息后,单击“确定”,可查看已添加的排班人员。 图7 应用轮班排班添加人员 区域:本次排班的区域,可多选,可忽略 应用:本次排班的应用,可多选 开始时间:选择日期,重新排班策略将从该日期的00:00分开始
强制结束:单击“强制结束”,将结束本次作业的所有执行任务。 结束所有批次:单击“结束所有批次”,将结束当前步骤所有批次的执行任务。 取消:单击“取消”,将结束单台实例的执行任务。 编辑标签:可按照标签管理中的步骤,对作业工单的标签进行编辑。 图3 操作作业工单 单击“输入”页签,查询当前选中作业的基本信息以及自定义原子任务的脚本内容。
执行自定义脚本 功能介绍 执行脚本 脚本入参、超时时间、执行用户、资源受限 脚本入参支持20个。 单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。 URI POST /v1/job/scripts/{script_uuid}
排班管理”页面,单击右上角的“创建排班”。 图1 排班管理页面 进入“创建排班”页面,可以填写排班场景信息,并添加排班角色后单击“提交”。若已有排班场景和排班角色,在“创建排班”页面中可以选择已有场景,并可查看某个场景下的角色。 图2 创建排班页面 场景名称:排班场景的名称。 排班方式:排班的方式,可选择“固定班次”和“轮班(周一
注意事项 在编辑脚本时确认脚本内容的风险等级,并如实填写风险等级。 编辑自定义脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“脚本管理”。 在“自定义脚本”页签,选择需要编辑的脚本,单击操作列“编辑”。 参数信息与创建自定义脚本基本相同,请参考创建自定义脚本。
进事项相关信息,单击“确认”保存创建改进单。改进单后续处理参考改进管理。 图6 创建改进事项 表1 改进事项字段说明 字段名称 说明 改进名称 改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间
仅关联方式选择智能关联时需要设置。 请填写目标实例的标签键。 testKey 标签值 关联APM环境 仅关联方式选择智能关联时需要设置。 可选参数。请填写目标实例的标签值。 可选参数。配置本分组所对应的APM服务中的应用-组件-环境,故障诊断时可获取APM服务相关性能信息。 APM相关操作请参考APM应用管理。
仅关联方式选择智能关联时需要设置。 请填写目标实例的标签键。 testKey 标签值 仅关联方式选择智能关联时需要设置。 可选参数。请填写目标实例的标签值。 testValue 关联APM环境 可选参数。配置本分组所对应的APM服务中的应用-组件-环境,故障诊断时可获取APM服务相关性能信息。 APM相关操作请参考APM应用管理。
脚本描述:最大256个字符。 单个参数的参数名称 64个字符,只支持字母+数字+下划线。 单个参数的值最大1024个字符,正则表达式如下:^((?!.{2,})[a-zA-Z0-9_-/.*\x20?:",=+@\[{]}])*$。 审批人最多支持5人。 脚本输出的日志总量只支持1MB。 URI
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,
WarRoom 概述 WarRoom状态 修改故障信息 影响应用管理 与会成员 进展通告 起会规则 父主题: 故障管理
事件管理 创建事件单 受理事件单 提交事件单解决方案 验证事件处理结果 查询事件单详情 事件相关枚举信息 父主题: 故障管理
COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 您可以在快速配置中心完成云运维中心配置和云服务配置: 云运维中心配置:涵盖资源应用管理、自动化运维、故障管理、变更管理、混沌演练5个场景的配置任务,您可以根据