检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
人员管理。 发送方式 可选项“短信”、“企业微信”、“钉钉”、“飞书”、“电话”。 “企业微信”、“钉钉”、“飞书”需要先在移动应用管理中配置相应应用。 通报内容 不支持修改,内容为最新通报内容。 单击“确定”。 完成通告发布。 父主题: WarRoom
韧性中心 混沌演练 应急预案 PRR评审 应用韧性评估
创建改进单”或“创建改进单”。 设置“创建改进单”。 表1 创建改进单参数说明 参数 说明 改进单名称 自定义改进单的名称。 所属应用 在下拉列表选择改进单涉及的应用。 改进类型 在下拉列表选择改进类型。 改进责任人 在下拉列表选择责任用户。 改进验收人 在下拉列表选择验收用户。 期望完成时间
API 应用资源管理 脚本管理 脚本工单 故障管理 补丁管理
、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。 父主题: 集成管理
安全评分 操作场景 通过云运维中心查看安全云脑 SecMaster的安全评分和风险,安全评分维度包含合规检查、漏洞、威胁告警等。 安全概览 登录云运维中心。 进入COC“总览”后,可以查看安全云脑的安全评分。 图1 安全评分 单击“前往处理”,可跳转至安全云脑。 图2 跳转安全云脑
创建事件 驳回事件 重新开启事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 故障复盘 应用诊断 事件历史记录 父主题: 故障管理
演练规划主要做什么? 演练规划能够帮助演练管理人员对故障模式进行演练排期,管理演练进展,是故障模式能够通过演练进行实战检验的管理保障。 父主题: 韧性中心常见问题
、SDK,无论哪种访问方式,其本质都是通过COC提供的REST风格的API接口进行请求。 COC的接口支持认证请求,经过认证的请求需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加密因子,结合请求体携带的特定信息计算而成。通过访问密钥(AK/SK)认证方式进行认证鉴权,即使用Access
Management Service,TMS)用于用户在云平台通过统一的标签管理各种自定义作业。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的自定义作业较多时,可以通过标签管理服务管理账户下的自定义作业。 建议您先在TMS系统中设置预定义标签。
SLO中断记录 操作场景 用户可以通过此页面查看、添加和修正SLO中断记录。 支持添加SLI指标、WarRoom、告警单、事件单和其他,共5类来源的SLO中断记录。其中告警单和事件单,若有SLA记录,且产生业务中断的,则会自动生成中断记录,规则示例可参考告警单SLO中断记录;其余3类目前仅支持手动添加。
如果事件单在处理过程发现事件等级与实际情况不符,需修改级别,可以通过事件升降级操作进行。注意:事件只有在受理后才能修改级别。事件级别降级可以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级 登录云运维中心。 在左侧导航栏选择“故障管理
可选参数。默认“不涉及”。在下拉列表选择事件发生的区域。 企业项目 在下拉列表中选择企业项目。 故障发生时间 请填写故障发生的时间。 故障应用 在下拉列表选择事件涉及的故障应用。 业务是否中断 可选项“是”、“否”。 责任人 可选项“排班”、“个人”。 排班:按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。
API概览 云运维中心为您提供资源运维和自动化运维相关接口 表1 接口说明 接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC
应急预案基本信息参数说明 参数名 参数描述 应急预案名称 用户自定义应急预案名称 企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。
审批配置 操作场景 审批配置是在创建、修改作业时,可以强制指定排班或个人用户作为审核人,并通过短信、钉钉等方式通知审核人,审核人需要对创建或修改的作业进行审批才可以完成创建或修改流程。 注意事项 若要通过排班配置审核人,则需要提前在排班管理中创建排班。 当审批配置开启了入库人工审核时,在
审批配置 操作场景 审批配置是在创建、修改脚本时,可以强制指定排班或个人用户作为审核人,并通过短信、钉钉等方式通知审核人,审核人需要对创建或修改的脚本进行审批才可以完成创建或修改流程。 注意事项 若要通过排班配置审核人,则需要提前在排班管理中创建排班。 当审批配置开启了入库人工审核时,在
脚本工单 操作场景 执行脚本后会生成一条脚本工单记录,记录脚本执行的结果。若您需要跟踪和记录脚本的执行对象及执行结果,可通过脚本工单功能查看。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1 选择脚本工单 选择一个状态为“异常
SLO指标配置 操作场景 用户可以通过此页面进行SLO指标的创建配置、删除、编辑修改、查看操作。 指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续SLO中断记录中手动添加。 SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。