检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,可单击页面上方“补丁自动扫描“或“补丁自动修复“进入定时运维页面查看或编辑。 图3 配置完成 图4 定时运维查看 父主题: 补丁管理
概述 定时运维页面展示所有定时任务详情和执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、作业管理等操作。 定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。
变更管控 变更管控是对资源进行变更操作时,通过工单提权的方式,才能执行脚本、作业或查询账号密码等操作,确保人和所操作的对象和实际资源保持一致,防止权限过大,降低安全风险。 操作场景 通过变更管控,您可以根据具体的使用场景,配置是否开启工单提权,当前支持事件、Warroom和变更单提权。
若响应预案选择了应急预案,应急预案为自动化预案,需要单击步骤中的“执行”执行脚本或作业,完成后单击“提交”;应急预案为文本预案,根据对应的步骤执行后,单击“提交”。 图4 执行应急预案页面 处理事件过程可查看事件关联的原始告警。 图5 查看事件关联告警信息 事件处理完后,可单击“事件处理”,填写事件处理结果。
不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 是否关机:勾选“立即关机”,工单开始执行时会自动将未关机的实例关机。 设置“登录凭证”。
不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 是否关机:勾选“立即关机”,工单开始执行时会自动将未关机的实例关机。 设置“登录凭证”。
周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关 应用排班:排班需按照应用创建,不同应用排班不同 场景描述:排班场景的详细说明 单击排班场景的“操作”列中“创建排班角色”可为该场景创建排班。
Service,TMS)用于用户在云平台通过统一的标签管理各种资源。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的云资源较多时,可以通过标签管理服务管理账户下的云资源。 建议您先在TMS系统中设置预定义标签。 标签由“键”和“值”组成,每个标签中的一个“键”只能对应一个“值”。
作业名称 测试作业 根据命名规则,自定义作业的名称。 企业项目 - 在下拉列表中选择企业项目。 描述 - 对作业进行描述。 标签 - (可选)单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_
单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_ . : = + - @特殊字符,但首尾不能含有空格,不能以_sys_开头,限制长度最长128个字符。 标签的值可以包含任意语种字母、数字、空格和_
设置“镜像”。 公共镜像:常见的标准操作系统镜像,所有用户可见。包含操作系统以及预装的公共应用。请根据您的实际情况自助配置应用环境或相关软件。 私有镜像:用户基于云主机或者外部镜像文件创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。选择私有镜像创建云主机,可以节省您重复配置云主机的时间。
新增流转规则 若两个流转规则中的信息较相似,可单击“操作”列“复制”,快速创建流转规则。 根据页面提示,输入规则名称、应用名称等基本信息。 图2 填写流转规则基本信息 在触发规则部分,选择触发类型,选择触发规则的数据源,根据相应的数据源的字段的键,配置相应的条件及满足条件的值,并选择级别。 图3
区域可用来区分同一个应用在不同区域的排班。若您的业务和区域无关,您可以忽略区域。 单击“添加人员”,填写排班信息后,单击“确定”,可查看已添加的排班人员。 图7 应用轮班排班添加人员 区域:本次排班的区域,可多选,可忽略 应用:本次排班的应用,可多选 开始时间:选择日期,重新排班策略将从该日期的00:00分开始
故障信息 操作场景 WarRoom的故障信息,主要是为了记录该故障的发生时间、恢复时间,故障带来的影响及故障原因,便于后续回溯防止故障再次发生。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中Wa
左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。 在WarRoom详情”页面,单击“邀请”,选择与会方式、要邀请的成员,之后单击“加入WarRoom”。 父主题: WarRoom
已收藏的企业项目快速筛选出资源。 收藏企业项目 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面。 点击右上方“收藏配置”。 设置“收藏配置”。 企业项目:勾选需要收藏的企业项目。 单击“确认”。 单击“确定”,完成企业项目收藏。 查看已收藏企业项目的资源
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
选择“是”,必须填写“故障发生时间”及“故障恢复时间”。此处填写的业务中断时间计入对应应用的SLO中断记录。 图1 清除告警-业务中断 生成SLO中断记录需要先设置对应的SLA规则、SLO规则,并且该告警存在对应的SLA记录。 输入备注,单击“确定”,清除告警。 备注可以包含中文
改进管理”,选择“待处理的”页签,单击改进标题进入“改进单详情”页面。 图1 改进列表 单击右上角的“处理”或“转发” ,进入处理或转发页面 图2 改进单详情页 改进单验证 登录COC。 在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理的”页签,选择待验证状态的改进单,单击改进标题进入“改进单详情”页面。
排班管理”页面,单击右上角的“创建排班”。 图1 排班管理页面 进入“创建排班”页面,可以填写排班场景信息,并添加排班角色后单击“提交”。若已有排班场景和排班角色,在“创建排班”页面中可以选择已有场景,并可查看某个场景下的角色。 图2 创建排班页面 场景名称:排班场景的名称。 排班方式:排班的方式,可选择“固定班次”和“轮班(周一