检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。 在集成管理配置页
说明 示例 选择应用下的分组 从下拉列表中选择应用、组件和分组。 测试应用/测试组件/测试分组 资源类型 从下拉列表中选择云厂商、资源类型。 华为云/弹性云服务器ECS/云服务器 资源列表 请选择需要关联的资源。 - 单击“确定”,关联至该分组下。 父主题: 应用管理
执行公共脚本 数据加密服务 资源运维中,参数中心支持用户创建加密参数,需要在数据加密服务中购买密钥进行加密。账号管理中,需要通过数据加密服务中的密钥保护账号密码的安全。 加密参数 帐号管理
主机OS补丁的合规性情况,避免主机因为OS补丁缺失产生漏洞,导致业务受损。云上无统一的OS合规性管理和自闭环工具,合规性问题修复困难或求助华为侧协助解决。希望能够自动化的完成OS补丁的扫描,并且及时修复补丁漏洞,保证主机的OS补丁合规性。 解决方案 治理:提供OS合规性自动化定时
维持正常功能和性能的评估方式。韧性的概念不仅仅局限于恢复能力,还包括预防问题、快速检测问题以及有效应对问题的能力。 COC应用韧性评估基于华为最佳实践经验,定义了300+的评估项,覆盖节点、集群、网络、容灾、容器、业务和数据等六种维度,针对以应用为粒度的资源进行韧性评估,帮助客户
选择“全部待办”、“待处理的待办”、“我处理的待办”、“我创建的待办”对应的页签,展示对应的待办列表。 图5 待办列表展示 全部待办仅可显示与登录账号有关(创建人、责任人是登录账号)的待办单子,其他子账号的待办数据不会显示。 查看待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心的待处理列表。
设置“创建分组”。 表1 创建分组参数说明 参数 说明 示例 分组名称 根据命名规则,自定义分组的名称。 测试分组 云厂商 请选择目标实例所在云厂商。 华为云 资源关联方式 请选择资源关联方式。 手动关联:用户在对应分组下,手动将对应资源数据关联至分组内进行管理。 智能关联:用户通过企业项目和
“执行”。 设置“执行类型”和“基本信息”。 表1 执行类型和基本信息参数说明 参数 示例 说明 执行类型 单账号执行 请选择执行作业的范围。 单账号执行:仅在当前账号下执行此作业。 IAM权限委托 ServiceLinkedAgencyForCOC 可选参数。用户授权云运维中心执行作业所能够使用的权限范围。
务类型等。 删除:若定时运维任务已经无需使用,您可以删除该任务。 启用、禁用定时任务 用户仅能启用/禁用自己创建的定时任务。可查看当前租户账号下其他用户创建的定时任务。 任务启用后,开始生效,在后台创建定时调度,到达执行时间时开始执行。禁用后,在后台删除定时调度,不再执行。 登录云运维中心。
知相应责任人。汇聚告警减少了重复告警,避免了告警风暴,提高用户处理告警的效率。 此外,本功能可以帮助用户高效创建和管理告警规则。其提供了跨账号、跨区域的告警规则配置能力,帮助用户提高批量配置的效率。告警规则目前仅支持CES告警的配置。 图1 告警管理流程 父主题: 告警管理
发详情。SLA管理中,支持使用公共SLA规则或自定义规则,并可以配置SLA打破、预警通知。 Global 账号管理 提供弹性云服务器资源主机账号纳管/托管能力,支持对主机账号进行定期改密。 Global
scope参数定义了Token的作用域,下面示例中获取的Token仅能访问project下的资源。您还可以设置Token的作用域为某个账号下所有资源或账号的某个project下的资源,详细定义请参见获取用户Token。 1 2 3 4 5 6 7 8 9 10 11
组件名称 根据命名规则,自定义组件的名称。 测试组件 分组名称 根据命名规则,自定义分组的名称。 测试分组 云厂商 请选择目标实例所在云厂商。 华为云 资源关联方式 请选择资源关联方式。 手动关联:用户在对应分组下,手动将对应资源数据关联至分组内进行管理。 智能关联:用户通过企业项目和
设备SN 设备SN。 - 私有IP 物理机私有IP。 192.168.1.1 设备类型 请填写设备类型。 笔记本电脑 设备厂家 请填写设备厂家。 华为 操作系统 在下拉框选择操作系统。 LINUX 描述 可选参数。对设备进行描述。 - 表5 虚拟机参数说明 参数名称 说明 示例 设备名称
"domain": { "name": "domainname" //IAM用户所属账号名 } } } },
应急预案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明
出发,按照风险分析、应急预案、演练执行、复盘改进4个维度,提供端到端混沌演练能力; 沉淀故障模式:首创基于容错视角的故障场景分析方法,沉淀华为云SRE多年的故障模式库,内置300个+典型故障模式。 图1 全旅程混沌工程 风险分析:分析应用架构,找出风险点。 应急预案:针对风险点,制定应急预案。