检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
演练任务 操作场景 管理混沌演练任务,查看演练记录。 创建演练任务 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签。 单击“创建演练任务”,进入创建演练任务页面,也可以通过演练规划接单功能进入创建演练任务页面,具体步骤可以参考演练规划章节。 图1
资源运维概述 资源运维提供了ECS、RDS、FlexusL、BMS操作的功能,也可以通过操作对机器进行批量开关机、批量重启、切换操作系统以及重装操作系统操作。 父主题: 资源运维
接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC 补丁管理 包括补丁管理合规性报告查询相关接口
UniAgent安装 单次最多可安装100台UniAgent主机。 应用管理 应用 租户创建的应用层级≤5层。 补丁管理 补丁基线 租户创建的补丁基线个数≤50个(不计入公共基线)。 脚本管理 脚本内容 自定义脚本内容≤4096字节。 作业管理 全局参数 单个自定义作业的全局参数≤30个。 Warroom
总览 为用户提供资源健康度、资源监控信息、安全概览、运维能力、系统公告等相关信息,呈现基于资源一站式的信息概览。 运维事务中心 快速配置中心 资源总览 资源监控 应用监控 安全概览 运维态势感知
排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警 WarRoom机制 可用性分析 混沌演练 02 入门 以快捷执行作业及快捷混沌演练为例,帮助您快速了解COC在典型场景下的操作方法。
应急预案 操作场景 您可以对系统可能发生的故障建立对应的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 应急预案页面 单击“创建应急预案”,填写应急预案基本信息。
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以
最近扫描时间 补丁管理 统计已扫描的实例,最近一次的扫描时间区间 统计已扫描的实例,最近一次的扫描时间区间 区域、应用 个 账号管理 纳管实例数量 账号管理 统计账号管理中,纳管的各云服务实例数量 统计账号管理中,纳管的各云服务实例数量 区域、应用 个 纳管率 账号管理 统计所有实例中,纳管的各云服务实例数量占比
混沌演练 应用性能管理 故障管理中,支持接入应用性能管理服务产生的告警,并在云运维中心中进行流转处理 接入应用性能管理告警 消息通知服务 云运维中心中的故障管理、资源运维等场景中,支持发送短信、邮件、语音、企业微信、钉钉等通知。如需使用需要先开通消息通知服务。 通知管理 云数据库 资
附录 错误码 获取项目ID
修订记录 日期 修订记录 2023-11-30 第一次发布 2024-06-06 随服务版本刷新资料内容
安全 责任共担 身份认证与访问控制 审计与日志 服务韧性 认证证书
资源运维 资源运维概述 批量ECS操作 批量RDS操作 批量FlexusL操作 批量BMS操作
定时任务执行记录 查看定时任务执行记录 登录COC。 在左侧菜单栏选择“资源运维 > 自动化运维”,在“日常运维”模块单击“定时运维”,进入“定时运维”页面。 在“定时运维”页面,单击列表数据操作列的“更多 > 历史记录”,跳转定时任务“历史记录”页面。 图1 查看执行情况 单击
韧性中心 混沌演练 应急预案 PRR评审
如何调用API 构造请求 认证鉴权 返回结果
脚本工单 展示脚本工单基本信息 展示批次列表 展示实例状态统计信息 展示批次详情 展示工单列表 操作脚本工单 父主题: API
产品咨询 云运维中心权限如何配置? 如何通过企业项目进行权限控制