检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
标准化故障管理 实践场景 某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。
支持用户创建自定义作业,编写特定的操作步骤。 操作场景 通过Cloud Operations Center创建一个自定义作业。 注意事项 根据作业步骤内容,确认并如实填写作业的风险等级。 操作步骤 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“作业管理”,进入“作业管理”页面。
CTS的详细介绍和开通配置方法,请参见CTS快速入门。 日志 用户开通云审计服务并创建和配置追踪器后,CTS可记录与云运维中心服务相关的操作事件。 详细的操作列表以及查看方法,请参见查看审计日志。 父主题: 安全
资源运维权限和授权项说明 如果您需要对您所拥有的COC的资源运维操作进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用ECS服务的其它功能。
通知管理”页面,选择需要编辑的通知,在列表中的“操作”列单击对应的“编辑”,参考创建通知的步骤3进行编辑和保存。 图3 编辑通知 删除通知 登录COC。 在左侧导航栏选择“基础配置 > 通知管理”页面,选择需要删除的通知,在列表中的“操作”列单击对应的“删除”, 图4 删除通知 弹出
实例、云硬盘(EVS)磁盘、虚拟私有云(VPC)实例等。 同步资源操作:需要当前用户具有rms:resources:list权限。该权限将用于调用RMS服务接口,获取当前用户所属的所有Region下资源数据。 操作场景 通过Cloud Operations Center同步资源信息。
帐号基线 创建帐号基线 登录COC。 在左侧菜单栏选择“自动化运维”,在“日常运维”模块单击“帐号管理”,进入“帐号管理”页面。 选择“帐号改密”页签下“帐号基线”页签,根据业务需求创建基线。 针对未绑定组件的主机,系统默认通过内置的全局基线来纳管主机帐号。用户也可通过“创建帐号
若您的资源实例未安装UniAgent且您已忘记密码,则无法安装UniAgent、导致无法执行重置密码的公共脚本,请知悉! 父主题: 自动化运维常见问题
故障检查函数、故障回滚函数、环境清理函数操作。 按照上述规范,还有两个必填的脚本参数,如下。是否有其余脚本参数由您脚本内容决定。 表1 自定义故障脚本必填参数说明 参数名称 参数值 参数描述 ACTION inject_fault 演练操作动作,系统后台在演练不同阶段会自动设置对应的值。可以选择:
删除已经创建的演练任务,该演练任务已生成演练记录,不可操作删除,已有演练规划关联该演练任务,不可操作删除。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,查看演练任务列表。 在演练任务列表的“操作”列,单击“更多 > 删除”。 图20 演练任务列表
跨账号管理 概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例):
资源运维 资源运维概述 批量ECS操作 批量RDS操作 批量FlexusL操作 批量BMS操作
力,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执行机器所在的区域为现支持的区域,操作系统为现补丁管理支持操作系统,机器上具备补
自定义集成操作步骤 自定义集成最多只能接入5个监控系统,若对接错误,禁用后删除即可。 启用、禁用集成操作步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”页面。 在集成管理配置页面单击接入源上的“启用/禁用”可以对接入源进行启用或者禁用操作。也可以单
审批变更单 操作场景 变更单创建后,需审批变更单。 操作步骤 登录COC。 在左侧菜单栏选择“变更管理 > 变更中心”,进入“变更中心”页面,待处理的变更单列表,点变更标题或操作类“处理”,进入变更详情,审批变更单。 图1 审批变更单 父主题: 变更中心
提供用户编辑IDC离线资源的能力。 操作场景 通过Cloud Operations Center编辑线下IDC离线资源。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面,选择“IDC”页签,单击“操作”列中的“编辑”。 图1 编辑IDC离线资源
场景前,在排班角色“操作”列,单击“编辑”编辑排班角色信息即可。 图8 排班场景中编辑排班角色 删除排班场景操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,单击“场景管理”,进入“场景管理”页面。 图9 场景管理 在管理场景列表“操作”列单击对应的“删除”。
作业管理 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。 执行公共作业
删除账号 提供用户删除云厂商账号的能力。 操作场景 通过Cloud Operations Center删除云厂商账号。 操作步骤 登录COC。 在“多云配置”页面中单击接入列表中对应云厂商的所在行“操作”列中的“删除”。 图1 删除账号 单击“确认”。 父主题: 多云配置
本文介绍如何使用人员管理模块。 添加用户操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,单击页面右上角“同步人员”。 图1 同步人员 编辑用户信息操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 人员管理”页面,选择需要编辑的人员在对应行“操作”列单击“编辑”。 图2