检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
云运维中心COC为全局服务,但在部分特殊区域(专属区域、HCSO等)暂不支持,如您有相关需求,请联系COC侧沟通处理。 在使用云运维中心COC时,您需注意以下使用限制,详见表1。 表1 云运维中心使用限制 功能模块 对象 使用限制 公共 补丁/脚本/作业/ECS操作 单个操作任务最多支持选择200台实例。 补丁/脚本/作业/ECS操作
启动ECS操作系统 可以对ECS实例执行单独或批量开机的操作。 重启ECS操作系统 可以对ECS实例执行单独或批量重启的操作。 切换ECS操作系统 可以对ECS实例执行单独或批量切换操作系统的操作。 关机ECS操作系统 可以对ECS实例执行单独或批量关机的操作。 重装ECS操作系统 可以对ECS实例执行单独或批量重装的操作。
处理事件 操作场景 事件受理并定位故障原因后,可以通过处理事件功能快速执行应急预案、脚本或作业来处理故障,并在事件处理功能中记录事件详情。 事件来源为“告警”的事件可以在事件详情中查看关联的原始告警。 执行响应预案 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。
用。 编辑:您可以根据需要,自行修改定时运维任务的名称、版本号、任务类型等。 删除:若定时运维任务已经无需使用,您可以删除该任务。 启用、禁用定时任务 用户仅能启用/禁用自己创建的定时任务。可查看当前租户账号下其他用户创建的定时任务。 任务启用后,开始生效,在后台创建定时调度,到
重新提交问题 操作场景 问题单被驳回后,问题提单人再次确认该问题需要提交,可以编辑问题单内容后重新提交。 重新提交 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“修改”。 设置“修改”。 表1
为了更加安全地保护您的主机帐号密码,云运维中心会使用DEW服务来加密您的主机帐号密码。在使用密钥管理之前,请先在DEW创建好密钥。 配置密钥 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“账号管理”。 单击右上方“密钥管理”。 根据是否已绑定密钥。 若首次使用密钥管理,未绑定过密钥,单击“绑定密钥”。
若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。 故障已恢复:检查故障处理结果和应用状态。 注意:将所有应用状态修改为已恢复状态才能走到故障已恢复阶段。 使用应用诊断检查故障恢复情
当前跨账号执行,不支持BMS的API调用,不支持脚本的跨账号执行。 使用该功能,需要先将账号加入组织并提前配置好委托权限,填入对应的委托名称。相关操作请参见跨账号管理。 设置“执行账号及区域”。 执行规则:请保证有1条执行规则,最多支持20条执行规则。 执行账号:即租户账号名,可以通过我的凭证页面查看。 执行区域:执行的目标对象所在的区域。
送短信、邮件、语音、企业微信、钉钉等通知。如需使用需要先开通消息通知服务。 通知管理 云数据库RDS 资源运维中,可以对RDS进行批量操作。混沌演练中,支持对RDS进行演练任务执行。 资源运维 混沌演练 裸金属服务器 资源运维中,可以对裸金属服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。
审批人无法接收通知? 审批人没有在人员管理配置任何消息通知渠道。 消息渠道配置请参考:如何使用人员管理。 父主题: 自动化运维常见问题
公共预案 操作场景 您可以对公共预案进行克隆,从而创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 查看公共预案详情 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“公共预案”页签。 单击公共预案表格第一列“应急预案”名称,查看应急预案。 图1
通知规则-事件类别 否 可多选 选择事件单的类别,有多个值供选择。 通知规则-来源 否 可多选 选择事件单的来源,人工创建为在事件单中心创建事件单,流转创建为流转过程中产生的事件单。 通知规则-区域 否 可多选 选择事件单的区域,多个区域可选。 通知方式 是 可多选 选择通知的渠道。
补丁基线中安装规则基线与自定义基线的区别? 安装规则基线提供了用户能够根据补丁包的基本信息进行基线筛选的能力,使用安装规则基线修复会将不合规的补丁升级为最新版本。 自定义基线提供了用户能自定义补丁包名称以及版本进行基线筛选的能力,使用自定义基线修复将会将不合规的补丁升级到自定义指定版本。 父主题: 补丁管理常见问题
填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。 若选择“自动化预案”,处理方式可以选择“脚本”和“作业”。 图3 故障处理 若选择脚本为处理方式,关联脚本可以选择“自定义脚本”和“公共脚本”。 图4 关联自定义脚本 图5 关联公共脚本 若选择作业为处理方式,关联作业可以选择“自定义作业”和“公共作业”。
变更场景 使用场景 变更管理中系统默认的变更场景字段和实际业务使用过程中有差异,支持修改变更场景枚举值。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面变更<br>场景,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 变更场景 若不
攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。 本章节介绍如何通过云运维中心操作一台弹性云服务器ECS进行CPU使用率加压的故障演练。 操作流程 操作步骤 说明 准备工作 注册华为账号并实名认证,开通云运维中心。
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤 登录云运维中心。
PRR模板和检查项信息。评审过程中,用户可以上传自检材料,并在评审完成后录入评审纪要。对于需要改进的检查项,用户可以创建改进事项。 PRR模板管理 PRR模板是用于进行 PRR评审的一种工具,它包含了产品立项、产品设计、产品上线三个阶段的检查项信息。用户可以通过 PRR模板管理页面进行模板
紧急 重要 次要 提示 当触发类型为待办任务,级别有 紧急 重要 次要 提示 当触发类型为问题单,级别有 致命 严重 一般 提示 选择应用 可以选择 部分应用 全部应用 单击SLA规则表格里的“编辑”,弹出SLA规则弹窗。 编辑弹窗中的“SLA目标”、“通知对象”、“通知渠道”,如表2所填写
承载华为云确定性运维业务场景,提供故障管理、批量运维、混沌演练等核心特性,实现在安全合规的前提下,云上运维效率提升。 产品介绍 立即使用 立即使用 仅两个按钮时选用 成长地图 由浅入深,带您玩转COC 01 了解 云运维中心(Cloud Operations Center)承载华