检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建排班 使用场景 事件、变更等场景需获取排班中的人员作为责任人,可通过创建排班场景及角色进行人员管理。 创建排班 登录云运维中心。 在左侧导航栏选择“基础配置 > 排班管理”。 单击右上方“创建排班”。 设置“排班场景”。 选择已有:选择当前已有的排班场景,在原有基础上增加新的排班角色,支持查看场景下的角色。
启动ECS操作系统 可以对ECS实例执行单独或批量开机的操作。 重启ECS操作系统 可以对ECS实例执行单独或批量重启的操作。 切换ECS操作系统 可以对ECS实例执行单独或批量切换操作系统的操作。 关机ECS操作系统 可以对ECS实例执行单独或批量关机的操作。 重装ECS操作系统 可以对ECS实例执行单独或批量重装的操作。
账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查能力,从事前、事中、事后逐层拦截变更风险,实现全方位运维作业可信。 AI加持风险评估
云运维中心当前仅有部分操作支持按照企业项目授权,可以参考表1创建自定义策略。 表1 支持企业项目鉴权的操作 操作 描述 coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start
管理员负责创建、管理和授权产品。 终端用户 终端用户可以查询、启动被授权后的产品,生成云资源。 产品 产品是服务目录专有概念,底层是基于Terraform或Json构成的云资源模板。根据Terraform及Json的定义,可以是单个云资源,也可以是多个云资源的组合。 产品版本 每次变更产品的Terraform
批量操作常见问题 批量ECS资源切换镜像报错如何处理? 父主题: 资源运维常见问题
批量FlexusL操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 父主题: 资源批量操作
流程管理 概述 事件流程 问题流程 变更场景 父主题: 基础配置
批量ECS操作 批量开机 批量关机 批量重启 批量重装操作系统 批量切换操作系统 执行命令 父主题: 资源批量操作
认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 单击“确定”并再次“确定”。 执行自定义作业支持变更管控功能。开关和使用请参考变更管控章节。 对于工单执行是否完成,支持以下操作:
issues inc_type_p_ohter_issues 其他 ohter issues inc_type_p_change_issues 变更操作问题 Change operation problem 父主题: 事件相关枚举信息
入门 以快捷执行作业及快捷混沌演练为例,帮助您快速了解COC在典型场景下的操作方法。 快速入门 快捷执行作业 快捷混沌演练 04 API 您可以使用本文档提供的API对COC进行相关操作,例如脚本工单的查询、自定义脚本的增/删/改/查/执行等。 API文档 API概览 如何调用API
如果您需要对您所拥有的COC的资源运维操作进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用ECS服务的其它功能。 默认情况
设置不同的访问权限,以达到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全的控制华为云资源的访问。如果华为账号已经能满
regions Array of regions objects 影响的Region 数组长度:0 - 1000 change_num String 变更单号 最小长度:0 最大长度:255 occur_time Long 开始时间 最小值:0 最大值:9223372036854775807
警命中流转规则时,创建事件/告警,并根据排班管理通知对应责任人。责任人可对告警进行处理或转事件,定位恢复后,清除告警。对于无法清除的告警,可以转事件进行升级或启动WarRoom处理。形成规范性告警处理流程,避免告警处理异常。 标准化事件处理流程包含以下步骤: 集成管理接入原始告警数据;
自定义预案 操作场景 如果云运维中心提供的公共预案不满足您的要求,可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录云运维中心。 在左侧菜单栏选择“韧性中心 > 应急预案”。 在“自定义预案”页签,单击右上方“创建应急预案”。
创建产品 操作场景 产品底层基于Terraform或Json构成的云资源模板。根据Terraform及Json的定义,可以是单个云资源,也可以是多个云资源的组合。管理员可以通过入门示例模板或自定义模板创建产品。 前提条件 确保您登录的账号拥有管理员的权限,管理员权限账号需加入COCSe
告警转事件 操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤 登录云运维中心。
SLO指标配置 操作场景 用户可以通过此页面进行SLO指标的添加、修改、删除、查看操作。 指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续SLO中断记录中手动添加。 添加SLO指标 登录云运维中心。 在左侧导航栏选择“基础配置 > SLO管理”。 选择需要配置的SLO指标,单击操作列“指标配置”。