检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
信息进行统一收集,生成原始告警。用户可以在集成管理处启用或禁用已有告警源,或者接入第三方监控系统。 本功能还支持汇聚告警的管理。通过设置流转规则,用户可以将接收到的符合指定规则的多条原始告警汇聚成单条告警,称为汇聚告警。 对于汇聚告警,用户可以转事件单处理,或者对其执行脚本和作业
Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的作业管理功能可以为用户提供自定义作业的操作以及在目标虚拟机上执行作业的能力。您可以通过该功能对目标实例(目前支持弹性云服务器ECS和裸金属服务器BMS)执行操作。 本章节介绍如何通过云运维中心操作一台ECS执行重启作业。
PRR评审管理 操作场景 用户可以通过PRR评审来管理产品从立项到上线的过程,PRR评审基于PRR模板。PRR评审管理列表展示所有 PRR评审的基本信息,评审详情可以查看评审进程详情以及改进事项等。 发起PRR评审 登录云运维中心。 在左侧菜单栏选择“韧性中心 > PRR评审”。
人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前华为云账号下的用户,人员管理中的用户从 统一身份认证服务(IAM) 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行修改、删除、请求订阅。
行统一收集生成的告警。原始告警列表展示告警源名称、告警状态、告警级别、告警来源、关联应用等信息。 通过流转规则可以将一条或多条原始告警汇聚成单条汇聚告警,一条原始告警可以触发多个流转规则。 注意事项 页面默认显示31天的告警信息,过期的告警将自动清除。 操作步骤 登录云运维中心。
重新提交问题 操作场景 问题单被驳回后,问题提单人再次确认该问题需要提交,可以修改问题单内容后重新提交。 重新提交 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“修改”。 设置“修改”。 表1
删除组件 操作场景 组件创建后,若想删除组件,请按如下操作进行。 注意事项 当组件下存在分组时,此组件无法删除。必须保证节点下为空才可以删除。 删除组件 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择需要删除的组件,单击。
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
自定义脚本参数输入值无效? 自定义脚本参数值需要满足如下规则: 参数值长度为1-1024位。 可以包含大写字母、小写字母、数字以及特殊字符(_-/.*?:",=+@\[{]})和空格。 禁止出现连续‘.’。 父主题: 自动化运维常见问题
权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中创建资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中的资源,使得资源的权限控制更加精确。 图1 项目隔离模型 同样在我的凭证下,您可以查看项目ID。
审批配置 操作场景 审批配置是在创建、修改作业时,可以强制指定排班或个人用户作为审核人,并通过短信、钉钉等方式通知审核人,审核人需要对创建或修改的作业进行审批才可以完成创建或修改流程。 注意事项 若要通过排班配置审核人,则需要提前在排班管理中创建排班。 当审批配置开启了入库人工审
创建参数 操作场景 您可以使用创建参数功能来保存数据,例如账号、密钥、普通文本等数据,可以被脚本、作业等操作引用,支持文本参数和加密数据的全生命周期管理。 注意事项 参数策略涉及到参数的删除,配置时请谨慎使用。 创建参数 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。
配置SLO 操作场景 用户可根据实际业务需要,配置所需的SLO目标,并且可以查看已经设置的SLO,包含已配置的SLI指标,SLO中断记录等。 创建SLO目标 登录云运维中心。 在左侧导航栏选择“基础配置 > SLO管理”。 单击右上方“创建SLO”。 设置“创建SLO目标”。 表1
处理待办 操作场景 待办任务创建成功后,责任人可以在待办中心受理和闭环待办任务。 注意事项 用户只能处理责任人或创建人为自己的待办。 受理待办 登录云运维中心。 在左侧导航栏选择“任务管理 > 待办中心”。 单击左上方“待处理的”。 选择待受理的待办,单击待办名称。 单击右上方“受理”。
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
Warroom是什么? 为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
概述 定时运维页面展示所有定时任务详情和执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、作业管理等操作。 定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。
ions云服务中设置)中的管理员或者COC云服务的委托管理员时,您可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力浪费,也降低了人工操作导致的遗漏等风险。 视图是一组筛选器,用户可以自由配置筛选范围,用于在跨账号场景下访问华为云中的资源信息。 创建步骤:设置视图基本信息
概述 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。作业管理支持最多100个版本。
障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件、故障发生的现象、客户影响等字段建