检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,建立运维信心。对于无法避免的场景(硬件故障、服务器异常下电、网络设备单板故障等)通过提前制定快速恢复应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入
恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。 若需拉起WarRoom群组,需在移动应用管理接入钉钉、企业微信或飞书。 处理流程 Warroom处理流程如下: 启动Warroom:在事件管理处理事件页面启动WarRoom。
基础配置 人员管理 排班管理 通知管理 移动应用管理 SLA管理 SLO管理 流程管理
“手动安装UniAgent”页面 UniAgent安装完成后,单击 “返回自动安装”。 单击“设置安装机”,设置刚才完成UniAgent安装的机器为安装机。 图4 设置安装机 在弹框中填写设置安装机相关信息,单击“确认”。 图5 确定安装机 父主题: 资源管理常见问题
与其他云服务的关联 云运维中心COC服务与其他服务的关系,如图1所示。 图1 与其他服务的关系 表1 与其他服务的关系 服务名称 与其他服务的关系 主要交互功能 安全云脑 总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。
选择需要清除的告警,单击操作列“清除”。 设置“清除告警”。 表1 清除告警参数说明 参数 说明 业务是否中断 可选项“是”、“否”。 故障发生时间 仅业务是否中断选择“是”时需要设置。 请填写故障发生的时间。 故障恢复时间 仅业务是否中断选择“是”时需要设置。 请填写故障的恢复时间。 备注
限制长度1-1000个字符。 影响应用 请填写应用的影响描述。 支持添加和删除影响应用。 设置“处理过程”。 表2 处理过程参数说明 参数 说明 处理过程 请填写处理过程的时间和过程描述。 支持添加和删除处理过程。 设置“根因分析”。 表3 根因分析参数说明 参数 说明 根因分析 请填写故障的根因分析。
在下拉列表中选择区域。 - 企业项目 仅关联方式选择智能关联时需要设置。 在下拉列表中选择企业项目。 - 标签键 仅关联方式选择智能关联时需要设置。 请填写目标实例的标签键。 testKey 标签值 关联APM环境 仅关联方式选择智能关联时需要设置。 可选参数。请填写目标实例的标签值。 可选参数。
在下拉列表中选择区域。 - 企业项目 仅关联方式选择智能关联时需要设置。 在下拉列表中选择企业项目。 - 标签键 仅关联方式选择智能关联时需要设置。 请填写目标实例的标签键。 testKey 标签值 仅关联方式选择智能关联时需要设置。 可选参数。请填写目标实例的标签值。 testValue
一个分批策略。 每个任务独立:可独立设置每个作业任务执行的目标实例和分批策略。 作业步骤:可自定义配置作业详情。 单击具体作业名称,右侧弹出“修改参数”页面。 设置“输入”、“输出”参数,设置“异常处理”选项。 目标实例:单击“添加实例”,设置“选择实例”。 表2 选择实例参数说明
在下拉列表中选择区域。 - 企业项目 仅关联方式选择智能关联时需要设置。 在下拉列表中选择企业项目。 - 标签键 仅关联方式选择智能关联时需要设置。 请填写目标实例的标签键。 testKey 标签值 仅关联方式选择智能关联时需要设置。 可选参数。请填写目标实例的标签值。 testValue
一个分批策略。 每个任务独立:可独立设置每个作业任务执行的目标实例和分批策略。 作业步骤:可自定义配置作业详情。 单击具体作业名称,右侧弹出“修改参数”页面。 设置“输入”、“输出”参数,设置“异常处理”选项。 目标实例:单击“添加实例”,设置“选择实例”。 表2 选择实例参数说明
使用对应环境最新参数值 脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值。 若脚本入参设置方式需选择“参数仓库”,请提前在本服务左侧菜单“参数管理 > 参数中心”模块中创建需要选择的参数。 设置“执行用户”和“超时时间”。 执行用户:默认“root”,目标实例节点上执行脚本的用户。
一个分批策略。 每个任务独立:可独立设置每个作业任务执行的目标实例和分批策略。 作业步骤:可自定义配置作业详情。 单击具体作业名称,右侧弹出“修改参数”页面。 设置“输入”、“输出”参数,设置“异常处理”选项。 目标实例:单击“添加实例”,设置“选择实例”。 表3 选择实例参数说明
在“待处理的”页签,选择需要验证的改进单,单击改进单标题。 单击右上方“验证”。 设置“结论验证”。 表3 结论验证参数说明 参数 说明 改进验证 可选项“通过”、“驳回”。 驳回理由 仅改进验证选择“驳回”时需要设置。 请填写驳回的详细理由。 单击“确定”。 完成改进单验证。 改进单历史记录
脚本执行时使用该参数,参数值为实时从参数仓库对应区域中获取的最新参数值 设置“执行用户”和“超时时间”。 执行用户:默认“root”,目标实例节点上执行脚本的用户。 超时时间:默认“300”秒,脚本在单个目标实例上执行的超时时间。 单击“添加实例”,设置“选择实例”。 表2 选择实例参数说明 参数 说明
CMDB资源视角 资源类型 默认参数,不支持修改。 RDS 区域 在下拉列表中选择区域。 华北-北京一 目标实例 在筛选框设置条件,选择筛选出的实例。 - 设置“分批策略”和“熔断策略”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户
在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要编辑的作业,单击操作列“编辑”。 参数信息与创建自定义作业基本相同,请参考创建自定义作业。 设置完成后,单击“提交”。 完成自定义作业编辑。 克隆自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。
资源运维权限和授权项说明 如果您需要对您所拥有的COC的资源运维操作进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用ECS服务的其它功能。
CMDB资源视角 资源类型 默认参数,不支持修改。 RDS 区域 在下拉列表中选择区域。 华北-北京一 目标实例 在筛选框设置条件,选择筛选出的实例。 - 设置“分批策略”和“熔断策略”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户