检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
进展通告 操作场景 进展通告在故障发生或处理过程将故障处理进展及时同步给相关人员,关注该故障的人可快速掌握故障进展。 进展通告 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。 单击需要修改的WarRoom标题。 单击右侧“更新通告”。 设置“更新实时通报内容”。
执行命令 操作场景 云运维中心提供了统一操作ECS实例的功能。通过批量ECS执行命令功能,您可以在不登录ECS的情况下,发送脚本命令至单台或多台ECS,快速完成对ECS的日常维护。 注意事项 所选实例处于运行中状态,才能执行此操作。 所选实例UniAgent状态为运行中,才能执行
在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。 在“自定义作业”页签,选择需要删除的作业,单击操作列“更多 > 删除”。 单击“确定”。 完成自定义作业删除。 审批自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“作业管理”。
自动化运维常见问题 审批人无法接收通知? 自定义脚本参数输入值无效? 实例无法选择? 如何在不重启实例的情况下重置密码? 父主题: 资源运维常见问题
在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“脚本管理”。 在“自定义脚本”页签,选择需要删除的脚本,单击操作列“删除”。 单击“确定”。 完成自定义脚本删除。 审批自定义脚本 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“脚本管理”。
HTTP方法 方法 说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的
资源监控 操作场景 您可以在资源监控快速查看账号下购买资源(例如弹性云服务器、对象存储、云数据库等)的监控指标信息,如ECS的CPU使用率、磁盘读/写带宽,对象存储的存储对象总数、TPS等。 资源监控 登录云运维中心。 进入COC“总览”后,可以查看CES监控的指标信息。 图1 CES监控信息
目标实例 在筛选框设置条件,手动选择或自动全选筛选出的实例。 - 设置“分批策略”、“熔断策略”和“是否关机”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自
录,历史记录呈现脚本工单/作业工单,支持跳转查看每一个工单详情。 查看定时任务执行记录 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“定时运维”。 选择需要查看的任务,单击操作列“更多 > 历史记录”。 单击工单执行列表的工单ID。 工
力。 Global 补丁管理 补丁管理提供了用户能够管理ECS实例上补丁的能力。通过补丁管理能力,用户能够实现OS补丁合规性扫描,OS补丁合规性修复功能。 Global 批量ECS操作 批量ECS操作为用户提供了管理ECS实例的能力,支持进行批量开机、关机、重启、切换操作系统、重装操作系统等操作。
华北-北京一 目标实例 在筛选框设置条件,手动选择或自动全选筛选出的实例。 - 设置“分批策略”和“熔断策略”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要
coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start 授予启动云服务器的权限。 coc:instance:reboot 授予重启云服务器的权限。 coc:instance:stop
本信息。 关闭WarRoom:确认故障已闭环,需要关闭WarRoom。 注意:填写修改故障信息中所有必填的故障信息才可以关闭WarRoom。 另外: 故障处理过程中如果需要增加相关成员并拉入群组,请参考与会成员操作。 故障处理过程中如果需要发布通告将故障处理进展及时同步给相关人员,请参考进展通告操作。
审批人无法接收通知? 审批人没有在人员管理配置任何消息通知渠道。 消息渠道配置请参考:如何使用人员管理。 父主题: 自动化运维常见问题
API概览 云运维中心为您提供资源运维和自动化运维相关接口 表1 接口说明 接口分类 说明 应用资源管理 包括租户委托首次同步租户RMS资源、查询租户的资源信息等 自动化运维 包括自定义脚本的创建、修改、删除、查询等 事件管理 包括事件的创建、处理、验证及查询 集成管理 主要为用户上报自监控系统的告警至COC
添加组织单元筛选范围 > 添加资源类型筛选范围。 注意事项 最多支持创建 10 个视图。 创建视图后,需要同步资源,同步当前视图下现有资源。 已有视图的资源产生变化,需要重新同步资源。 创建视图 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击筛选框上方“跨账号资源”。
清除告警参数说明 参数 说明 业务是否中断 可选项“是”、“否”。 故障发生时间 仅业务是否中断选择“是”时需要设置。 请填写故障发生的时间。 故障恢复时间 仅业务是否中断选择“是”时需要设置。 请填写故障的恢复时间。 备注 可选参数。请填写备注。 备注支持中文字符、英文字母、数字及特殊字符,长度不超过100个字符。
事件验证通过后,会根据故障复盘规则自动生成故障报告。如果当前故障复盘规则不符合实际业务,可以参考如下操作调整故障复盘规则。 开启/关闭规则 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”。 单击“事件流程 > 故障复盘”。 单击是否开启列按钮。 完成故障复盘规则开启或关闭。 修改规则 仅管理账号可修改复盘规则。
和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤: 登录COC。 同步人员,具体参考人员管理。
人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前华为云账号下的用户,人员管理中的用户从 统一身份认证服务(IAM) 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以手动选择需要的用户进行编辑、删除、请求订阅。