检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能
删除视图 提供用户删除视图的能力。 操作场景 通过Cloud Operations Center删除视图。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,单击“跨账号资源 > 视图管理”,单击 “视图管理“,进入“视图管理“页面。 单击“删除“。 图1 删除视图
成长地图 | 华为云 云运维中心 云运维中心(Cloud Operations Center)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供故障管理、批量运维、混沌演练等核心特性,实现在安全合规的前提下,云上运维效率提升。 产品介绍
创建视图 提供用户创建视图的能力,用户可自由配置筛选范围,用于在跨账号场景下访问华为云中的资源信息。 操作场景 通过Cloud Operations Center创建视图。 注意事项 最多支持创建 10 个视图。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,单击“跨账号资源”。
编辑视图 提供用户编辑视图的能力。 操作场景 通过Cloud Operations Center编辑视图。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,单击“跨账号资源 > 视图管理”,单击 “视图管理“,进入“视图管理“页面。 单击“编辑“,在右侧弹窗中填写信息,具体信息可参考
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“
列出组织的根 organizations:roots:list 跨账号场景下,查询当前组织的root 修改或删除委托权限 若开通COC后,识别到存在委托权限过大或权限不足的情况,可以前往统一身份认证服务中修改委托策略。 如果需要修改委托的权限、持续时间、描述等,可以在委托列表中,单击委托右侧的“修改”,修改委托。
域”以及搜索框搜索想要执行的目标实例列表。勾选实例列表前的“选项框”,单击“确定”即可选中实例。 图25 选择实例 选择分批策略和熔断策略。 填写任务类型,当任务类型为作业时,选择作业,弹出作业列表,选择自定义作业和公共作业页签,单击搜索框,按条件输入关键字,回车即可搜索想要的作
案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 COC
改进管理 改进管理主要是故障处理过程识别到一些改进事项可通过改进单进行跟踪闭环。改进来源包含事件/Warrroom/演练/PRR。 改进管理 父主题: 故障管理
在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 图1 SLO列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 筛选SLO 单击列表中的,查看详情。
在SLO管理列表中,选择对应“操作”列中“中断记录”,进入“中断记录”页面。 图1 中断记录 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击“添加中断记录”,右边弹出添加中断记录弹框,选择对应的数值,添加中断记录。
SLA管理”,进入“SLA管理”页面。 选择“公共SLA”页签,进入公共SLA列表界面。 图1 查看SLA列表 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 检索公共SLA模板 单击列表中的“SLA名称”,跳转到“SLA详情”页面。
SLA管理”页面,选择“SLA记录”页签,跳转到SLA记录列表界面。 图1 查询SLA记录 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击列表数据的“SLA”列对应的SLA模板,查看对应的SLA模板。
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
“资源管理”页签,选择需要同步的资源(默认选中“弹性云服务器ECS”),单击“同步资源”。 图1 同步资源 在资源列表上方的搜索框中选择搜索条件,可快速搜索资源。 图2 过滤筛选 单击按钮,可以选择需要显示的字段类型。 图3 字段显示控制 父主题: 资源管理
会在列表中显示。 图5 确认删除通知 通知列表&搜索 登录COC。 在左侧导航栏选择“基础配置 > 通知管理”页面,在搜索框中输入搜索内容后按“回车”键进行搜索。 图6 搜索通知 搜索框支持按通知类型和通知名称(模糊搜索)进行搜索;支持分页展示(10 20 50 100/页),列
自动化运维”,在“日常运维”模块单击“定时运维”,进入“定时运维”页面。 图22 查询列表 单击搜索框,弹出搜索条件列表;选择对应的搜索条件,输入对应的值,单击回车按钮即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击列表数据中对应任务名称,进入查看定时任务详情。
在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心的待处理列表。 图3 查看待办中心列表 单击搜索框,弹出搜索条件列表;选择对应的搜索条件,输入对应的值,单击回车按钮即可搜索数据。 搜索框后的图标依次支持:刷新列表数据,设置列表展示字段。 图4 添加筛选条件 选择“全部待办”、“