检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
、AOM)或第三方等监控系统,将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,可在原始告警中查看告警信息,通过配置流转规则后可将告警信息转事件或汇聚告警。 父主题: 集成管理
的资源进行统一的自动化运维操作,避免多账号操作导致的人力浪费,也降低了人工操作导致的遗漏等风险。 视图是一组筛选器,用户可以自由配置筛选范围,用于在跨账号场景下访问华为云中的资源信息。 创建步骤:设置视图基本信息 > 添加组织单元筛选范围 > 添加资源类型筛选范围。 注意事项 最多支持创建
在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要审批的作业,单击操作列“审批”。 设置“审批意见”。 是否通过:可选项“通过”、“不通过”。 审批意见:自定义填写审批意见。 单击“确定”。 完成自定义作业审批。 父主题: 作业管理
发、运营联合作战,保障业务快速恢复而组建的会议。可通过WarRoom添加故障恢复成员及时响应预案、通过发送故障进展及时知会关注故障的人员、通过应用诊断、响应预案等辅助应用快速恢复。 若需拉起WarRoom群组,需在移动应用管理接入钉钉、企业微信或飞书。 处理流程 Warroom处理流程如下:
在“日常运维”模块单击“脚本管理”。 在“自定义脚本”页签,选择需要审批的脚本,单击操作列“审批”。 设置“审批意见”。 是否通过:可选项“通过”、“不通过”。 审批意见:自定义填写审批意见。 单击“确定”。 完成自定义脚本审批。 父主题: 脚本管理
计算,直至问题挂起恢复。 挂起审批 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“全部问题”页签,选择需要处理的问题单,单击问题单标题。 单击上方“审批”。 设置“问题挂起审批”。 是否审批通过:可选项“通过”、“不通过”。 审批意见:填写审批详细意见。限制长度最长1024个字符。
统,用于二次开发,请使用API方式访问云运维中心,具体操作请参见《云运维中心API参考》。 控制台方式 其他相关操作,请使用管理控制台方式访问云运维中心。 如果用户已注册,可直接登录管理控制台,从主页选择“云运维中心”。如果未注册,请参见注册华为账号并开通华为云。
成改进任务,处理改进单过程若发现责任人不是本人支持转发责任人,改进项完成后需验收人验收通过才能闭环。 前提条件 需要通过事件、Warrroom、混沌演练、PRR评审创建改进单。 处理改进单 登录云运维中心。 在左侧导航栏选择“故障管理 > 改进管理”。 在“待处理的”页签,选择需要处理的改进单,单击改进单标题。
限制长度最长1024个字符。 设置“故障处理”。 应急预案类型:可选项“自动化预案”、“文档预案”。 自动化预案:可以通过脚本和作业进行故障恢复的预案。 文档预案:需要通过人工按步骤执行恢复动作进行故障恢复的预案。 处理方式:可选项“脚本”、“作业”,文档预案还可以选择“不涉及”。 脚
给用户授予COC权限流程 创建用户或创建用户组 在IAM控制台创建用户或用户组。 将系统策略附加至用户或用户组 为用户或用户组授予云运维中心只读权限的系统策略“COC ReadOnlyPolicy”,云运维中心服务管理员权限的系统策略”COC FullAccessPolicy”,或将策略附加至用户或用户组。
维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例): 如果A账号是组织管理员,则跳过此步骤。如果A账号不
*代表所有regionID,第二个*所有租户,name代表参数名称) 资源类权限决定您可以访问哪些数据,操作类权限是对您有的资源类权限进行操作,常见问题: 如果您可以访问某个参数,但是您访问不了列表页,代表您缺少coc:parameter:list权限 如果您找不到指定的参数,需要确认是否有该参数的权限
名称与参数默认值。 执行用户:默认“root”,目标实例节点上执行脚本的用户。 超时时间:默认“300”秒,脚本在单个目标实例上执行的超时时间。 目标实例:单击“添加实例”,设置“选择实例”。 表2 选择实例参数说明 参数 说明 示例 选择方式 请选择实例选择方式。 手动选择:根
运维概览 操作场景 通过云运维中心查询、跟踪运维待办事项(事件单/汇聚告警/待办),查询账号下已纳管的应用、资源等统计数据。 运维概览 登录云运维中心。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量,右侧可查看应用、资源等统计数据。 图1 运维事务跟踪
部分作业涉及,可设置全局参数。 目标实例 部分作业涉及,单击“添加实例”,设置“选择实例”。 参数说明见表3 选择实例参数说明。 分批策略 部分作业涉及,可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据
操作场景 云运维中心提供了统一操作RDS实例的功能。通过批量RDS重启实例功能,您可以对RDS实例执行单独或批量重启实例的操作。 注意事项 所选实例处于正常状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量重启 登录云运维中心。 在左侧导航栏选择“资源管理
云运维中心提供了统一操作RDS实例的功能。通过批量RDS开启实例功能,您可以对RDS实例执行单独或批量开启实例的操作。 注意事项 所选实例处于已停止状态,才能执行此操作。 无其他正在执行的工单,比如所选实例已有重启工单,则无法执行。 批量开启 登录云运维中心。 在左侧导航栏选择“资源管理
当事件创建后,您可以通过应用诊断(全链路诊断)功能快速定位故障根因。用户通过应用诊断可以查看应用层、组件层、资源层的关系拓扑,基于资源和应用告警的异常数据,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑。 确保已接入CES监控,请到集成管理进行配置。
排班管理 排班角色 单个排班场景下的排班角色≤10个。 账号管理 资源类型 目前支持纳管的资源类型: 弹性云服务器 ECS 目前支持托管(账号导入)的资源类型: 弹性云服务器 ECS、分布式缓存服务 DCS、云数据库 RDS、分布式消息服务 DMS 账号基线 基线账号数量≤30个,关联的组件数量≤100个。
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读