检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
产品功能 产品优势 约束与限制 03 使用 为您讲解COC各类功能的详细操作使用流程,帮助您从0到1构建运维驾驶舱。 运维总览 资源总览 运维沙盘 人员与排班 人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理
在下拉列表中选择企业项目,支持选择“全部”。 全部 视图类型 请选择视图类型。 CMDB资源视角:以资源视角选择实例列表。 CMDB应用视角:以应用视角选择实例列表。 CMDB资源视角 资源类型 可选项“ECS”、“BMS”。 ECS 区域 在下拉列表中选择区域。 华北-北京一 目标实例
图2 “应用结构类型”参数配置 表1 “应用结构类型”参数说明 参数 示例 说明 应用结构类型 轻量级应用 请根据应用结构的复杂类型选择。 设置“应用结构配置”。 图3 “应用结构配置”参数配置 表2 “应用结构配置”参数说明 参数 示例 说明 应用名称 test-application
配置排班详细操作请参考排班管理,移动应用需要配置详细操作请参考移动应用管理。 单击“确定”。 完成起会规则创建。起会规则命中逻辑:根据事件启动warroom的区域、应用、事件级别,匹配起会规则的区域、应用、事件级别,会将加入群组的人加入到warroom会议和创建的移动应用中。 修改起会规则 登录云运维中心。
> 自动化运维”。 在“日常运维”模块单击“账号管理”。 选择“资源视角”或“应用视角”管理主机。 资源视角针对购买的所有主机实例。 应用视角针对购买的并已绑定应用的主机。若选择应用视角需要选择目标应用或组件。 选择需要查看的资源类型。 默认选择“弹性云服务器ECS”。 选择需要查看的主机资源,单击操作列“更多
故障模式是什么? 故障模式是对云应用面临的潜在风险进行分析和评估的结果,混沌演练平台预置华为云多年积累的故障模式数据,使用FT-FMEA故障分析法帮助您分析云应用存在的潜在风险。 父主题: 韧性中心常见问题
可选参数。在下拉列表选择WarRoom区域。可以选择多个区域。 企业项目 在下拉列表中选择企业项目。 应用 在下拉列表选择影响应用。可以选择多个应用。 创建群组方式 可选项“企业微信”、“钉钉”、“飞书”。 请先在移动应用管理配置应用通知方式,选择后WarRoom拉起会将排班人员和参与者拉入对应的群组中。 排班
若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。 故障已恢复:检查故障处理结果和应用状态。 注意:将所有应用状态修改为已恢复状态才能走到故障已恢复阶段。 使用应用诊断检查故障恢
2、变更级别:A级>B级>C级>D级。 3、变更场景:支持用户根据业务情况自定义配置。 4、变更应用:先选择顶层应用,再选择下层具体的应用范围。 5、变更区域:变更区域和变更应用相结合定义变更范围。 6、变更计划:以region为维度生成。 需要按region配置实施人&配合人;
创建改进单”或“创建改进单”。 设置“创建改进单”。 表1 创建改进单参数说明 参数 说明 改进单名称 自定义改进单的名称。 所属应用 在下拉列表选择改进单涉及的应用。 改进类型 在下拉列表选择改进类型。 改进责任人 在下拉列表选择责任用户。 改进验收人 在下拉列表选择验收用户。 期望完成时间
改进事项字段说明 字段名称 说明 改进名称 改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准 进入演练报告页面,单击“故障记录”,查看故障记录。 图7
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的
单击“提交”,当右上角显示“创建待办成功”字样,即创建成功。 文件上传限制:支持最多上传1个文件,支持文件类型:.jpg,.png,.docx,.txt,.pdf,上传文件不能超过50MB。 待办列表 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心的待处理列表。 图3 查看待办中心列表
资源类型汇聚,支持按照标签查询资源列表,并提供UniAgent安装能力。 Global 应用管理 COC提供以应用为中心的资源管理视图。提供应用和资源关联关系的建模能力。按照“应用 > 区域 > 分组 > 资源模型”进行管理,支持按照标签查询资源列表,并提供UniAgent安装能力。
审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 日志 用户开通云审计服务并创建和配置追踪器后,CTS可记录与云运维中心服务相关的操作事件。
单/汇聚告警/待办),查询账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。 图1 运维事务跟踪 图2 应用资源统计数据 单击“待处理事件”、“待处理
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
细步骤请参考演练规划。 设置“基础信息”。 表1 基础信息参数说明 参数 说明 示例 演练任务名称 根据命名规则,自定义演练任务的名称。 test-drill 期望恢复时长(分钟) 从故障发生到故障恢复的预期时间,单位为分钟。 在故障注入之后,应用自恢复或在执行应急预案时恢复到正
页面默认显示本月审批后的变更分布,单击变更标题可进入变更单详情页面。 支持按照变更应用、变更级别、状态和变更标题筛选。 若需查看某天的变更信息可点中对应的日期。 变更日历显示的进入审批状态后的变更单。 变更日历默认显示变更应用和变更标题,不同的颜色代表不同的变更单状态。 变更单排序规则: 优先以跨天数排列,跨天越多越靠前。