检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过云运维中心查看原始告警的告警源名称、告警状态、告警级别、告警来源、关联应用等。 原始告警的应用属性为命中的流转规则配置的应用。一条原始告警可以触发多个流转规则,因此其对应应用不唯一。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > 告警管理”,选择“原始告警”页签,查看原始告警
根据命名规则,自定义演练任务的名称。 期望恢复时长(分钟) 3 从故障发生到故障恢复的预期时间 单击“添加一个新的攻击任务,还可创建5个攻击任务”,进入添加攻击新的攻击任务页面。 设置“添加新的攻击任务”,设置完成后单击“下一步”,进入选择攻击场景页面。 图5 “添加新的攻击任务”参数配置
不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 是否关机:勾选“立即关机”,工单开始执行时会自动将未关机的实例关机。 设置“登录凭证”。
租户创建的流转规则个数≤50个。 集成管理 数据记录 COC保存集成数据源的最近10次数据记录。 人员管理 人员数量 租户创建的人员个数≤50个。 排班管理 排班角色 单个排班场景下的排班角色≤10个。 账号管理 资源类型 目前支持纳管的资源类型: 弹性云服务器 ECS 目前支持托管(账号导入)的资源类型:
不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 是否关机:勾选“立即关机”,工单开始执行时会自动将未关机的实例关机。 设置“登录凭证”。
公共镜像:常见的标准操作系统镜像,所有用户可见。包含操作系统以及预装的公共应用。请根据您的实际情况自助配置应用环境或相关软件。 私有镜像:用户基于云主机或者外部镜像文件创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。选择私有镜像创建云主机,可以节省您重复配置云主机的时间。
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
SLO指标配置 用户可以通过此页面查看SLO指标配置。 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。 在SLO管理列表中,选择对应“操作”列中“指标配置”,进入到SLO指标配置页面,选择添加,编辑,删除SLI指标。 图1 SLI指标配置 单击右下角“创建”完成指标配置。
WarRoom启动后,在处理故障过程中需查看、更新WarRoom状态,便于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。
集成管理 本文介绍如何集成监控源。 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。
选择时间周期内,已完成的变更单数量 天/月 个 变更成功率 变更管理 统计变更单的成功率情况 变更成功率=变更成功的变更单数量/已完成的变更单数量*100% 天/月 百分比 变更平均时长 变更管理 统计变更单的平均处理时长 选择时间周期内,已完成的变更单时长求和/已完成的变更单数量*100% 天/月
图1 查询SLA记录 单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击列表数据的“SLA”列对应的SLA模板,查看对应的SLA模板。 单击列表数据的“工单ID”列对应的“工单I
如何在不重启实例的情况下重置密码? COC提供了管理员/非管理员账号重置密码的公共脚本,通过该脚本实现重置密码效果,不会重启实例,您可通过执行相应的公共脚本来重置实例(目前支持ECS和BMS资源类型)的密码。 图1 执行重置密码公共脚本 您在COC中执行公共脚本时,需要选择实例,而能够选择到实例的前提条件为:
应用拓扑(应用层) 点击拓扑上的子应用,查看组件层,展示该子应用下的所有组件,并支持在拓扑顶部切换至查看其它子应用的组件。 图4 应用拓扑(组件层) 点击拓扑上的组件,查看资源层,展示该组件下的所有资源,并支持核心云服务的指标展示,如果在应用管理中有关联APM,也可以查看链路相关指标。 图5
管理员在用户列表中,单击新建的用户,右侧的“授权”。 图1 IAM用户授权 授权模型选择“角色授权”。 图2 选择授权模型 授权方式选择“直接给用户授权(适用于企业项目授权)”,根据需要分配“COC FullAccess”或“COC ReadOnlyAccess”策略,策略详情可查看COC权限管理。
offset 否 Long 查询数量 最小值:0 最大值:9223372036854775807 缺省值:10 incident_num 否 String 事件单号 精确查询 最小长度:0 最大长度:64 title 否 String warroom名称 模糊查询 最小长度:0 最大长度:1000
String ecs云服务器ID 最小长度:1 最大长度:64 agent_sn 是 String UniAgent_sn 最小长度:1 最大长度:32 project_id 是 String 项目Id 最小长度:1 最大长度:32 region_id 是 String 服务器所属region
最大长度:512 请求示例 查询ECS报告下不合规的报告列表 /v1/patch/instance/compliant?offset=1&limit=10&compliant_status=non_compliant&report_scene=ECS 响应示例 状态码: 200 节点合规性报告信息
账号密码管理场景步骤: 导入账号、查看账号密码。 自动改密及免密登录场景步骤: 当前已有资源可自动改密:账号管理-账号基线中配置账号基线。 后续新增资源的自动改密:账号管理-改密策略中配置改密策略。 按照region维度定期改密:账号管理-改密任务添加region。 配置后可查看账号密码、免密登录。
转发事件 操作场景 事件单需要转发给其他人处理。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击“转发责任人”。 图2 转发责任人 填写转发信息后,单击“提交”。 图3 填写转发信息