检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
图1 资源帐号管理流程 按照资源帐号管理流程完成相关配置后,方可从帐号管理页面获取到主机密码。 密钥管理 帐号基线 改密策略 改密任务 查询帐号密码 父主题: 自动化运维
运维运营安全,以及更广义的安全合规遵从。 租户:负责云服务内部的安全,安全地使用云。 华为云租户的安全责任在于对使用的 IaaS、PaaS 和 SaaS 类云服务内部的安全以及对租户定制配置进行安全有效的管理,包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统,虚拟防火墙、API
汇聚告警 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 处理告警 告警转事件 清除告警 历史告警 父主题: 告警管理
operator 是 String 操作人ID,示例:00909e0a9c0a49a1b5e1c3eac362e3d7,可以在【基础配置】【人员管理】中查询到 最小长度:0 最大长度:255 operate_key 是 String 操作类型,固定值:acceptedIncident1 最小长度:0
资源运维概述 资源运维提供了ECS、RDS、FlexusL、BMS操作的功能,也可以通过操作对机器进行批量开关机、批量重启、切换操作系统以及重装操作系统操作。 父主题: 资源运维
不分批:用户所有待执行的机器会全部在同一批次。 图7 选择分批策略 单击“提交”,执行公共作业,将跳转到作业工单详情页面。在工单详情页面查看作业和各批次的执行情况。 单击“强制结束”,将结束本次作业的所有执行任务。 单击“结束所有批次”,将结束当前步骤所有批次的执行任务。 图8 作业工单详情
制定PRR模板参数说明 参数名称 说明 模板名称 PRR模板的名称 模板描述 PRR模板的详细描述 应用分类 PRR模板所属的应用分类 PRR检查项 PRR模板提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息 制定检查项信息,单击选择检查项所属的评审阶段“产品立项/产品设计/产品上线“,
脚本描述:最大256个字符。 单个参数的参数名称 64个字符,只支持字母+数字+下划线。 单个参数的值最大1024个字符,正则表达式如下:^((?!.{2,})[a-zA-Z0-9_-/.\x20?:",=+@[{]}])$。 修改的脚本如果有审批人,在修改之后,需要再次选择审批人,查询审批 URI PUT
该参数基本信息中显示的参数值 使用对应环境最新参数值 作业执行时使用该参数,参数值为实时从参数仓库中获取的最新参数值 单击,在步骤间添加新步骤。 图8 新增步骤 单击步骤名称或者,可以修改步骤名称。 图9 修改步骤名称 对于已添加的作业步骤,单击,删除不需要的步骤。 图10 删除步骤
在触发规则部分,选择触发类型,触发规则的数据源下拉选择监控源,并根据相应的监控源的字段的键,配置相应的条件及满足条件的值。 图6 触发规则 可在流转规则中配置对应事件或告警的响应预案,可选择已有的脚本和作业作为预案。 图7 响应预案 在分派规则部分,选择分派的对象,最后单击下方的“提交”,完成流转规则的创建。 图8
COC于2024年7月31日在中国站、国际站转商,转商后COC本身的基础功能免费,若后续部分高阶产品能力开始收费,提前30天通知。 云运维中心与其他云服务组合使用,例如为您提供发送通知等增值服务,这些增值服务可能产生额外费用,具体以对应云服务的收费为准,由提供该功能的服务结算。
执行公共脚本 提供用户执行服务提供的公共脚本的能力。 公共脚本说明:所有用户都可见的脚本,用户对公共脚本只有读和执行权限,具备一些常见的功能,如清理磁盘。 操作场景 通过Cloud Operations Center执行服务提供的公共脚本。 注意事项 在执行脚本时需要确认是否有目标机所属组件资源权限。
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 操作步骤 登录COC。 进入COC“总览”后,可以看到快速配置中心。
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
跨账号管理概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例):
通知管理”页面,选择需要编辑的通知,在列表中的“操作”列单击对应的“编辑”,参考创建通知的步骤3进行编辑和保存。 图3 编辑通知 删除通知 登录COC。 在左侧导航栏选择“基础配置 > 通知管理”页面,选择需要删除的通知,在列表中的“操作”列单击对应的“删除”, 图4 删除通知
脚本管理 提供用户自定义脚本的创建、修改、删除以及在目标虚拟机上执行自定义脚本、公共脚本的能力。通过该功能,用户可以通过自定义脚本或公共脚本在目标实例上执行操作。 创建自定义脚本 管理自定义脚本 执行自定义脚本 执行公共脚本 父主题: 自动化运维
作业管理 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。 执行公共作业 创建自定义作业