检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
改进事项字段说明 字段名称 说明 改进名称 改进事项的名称 所属应用 改进事项所属的应用 改进类型 改进事项的类型 改进责任人 改进事项的责任人 期望完成时间 改进事项的期望完成时间 问题现象 问题现象 改进闭环标准 改进事项闭环的标准 进入演练报告页面,单击“故障记录”,查看故障记录。
时时长、成功率阈值) 不同的任务类型消费标签中的不同key URI GET /v1/job/script/orders/{execute_uuid} 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id,取自execute
排班方式:排班的方式,可选择“固定班次”和“轮班(周一 -- 周日)”。 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 场景描述:排班场景的详细说明。 角色名称:排班角色的名称。 排班场景:可选择当前已创建的排班场景。 角色描述:排班角色的详细说明。 排班方式 固定班次:对人员进行固定排班管理,直接为排班角色设置相应的人员。
选择一台已经安装了UniAgent的主机作为安装机,安装机通过代理的方式作为中间桥梁安装UniAgent到同一个VPC下的其他主机。 需安装UniAgent主机 填写需安装UniAgent主机的详细信息。 主机IP:主机的IP。 操作系统:主机的操作系统,Linux或Windows。
execute_statistics Array of ExectuionStatistic objects 每个状态一个count,里面记录该状态的总数量,以及包含该状态的批次列表 表3 ExectuionStatistic 参数 参数类型 描述 instance_status String 执行实例状态
cute_uuid}/batches 表1 路径参数 参数 是否必选 参数类型 描述 execute_uuid 是 String 脚本工单的执行Id,取自executeJobScript和ListJobScriptOrders返回体中 最小长度:1 最大长度:26 请求参数 无 响应参数
管理排班人员 提供排班人员的查询、修改、删除操作。 操作场景 排班人员发生变化时,可进行修改、删除操作。不同场景修改人员方式不同,具体如下。 全局排班+固定班次 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择排班场景和排班角色,单击排班“操作”列的“删除”,即可删除排班。
m时,创建企业微信Warroom作战室必要的企业微信配置信息,用户可通过移动应用管理页面管理企业微信的配置信息。 查看移动应用管理 登录COC。 在左侧导航树中选择“基础配置 > 移动应用管理”页面。当该租户已绑定企业微信时,会展示绑定的信息。当该租户未绑定企业微信时,会展示新增企业微信密钥界面。
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
Service,TMS)用于用户在云平台通过统一的标签管理各种资源。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的云资源较多时,可以通过标签管理服务管理账户下的云资源。 建议您先在TMS系统中设置预定义标签。 标签由“键”和“值”组成,每个标签中的一个“键”只能对应一个“值”。
点击此处 填入自动化执行参数,单击“确认配置”。 选择区域后,补丁自动化操作将定时执行该区域中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,可单击页面上方“补丁自动扫描“或“补丁自动修复“进入定时运维页面查看或编辑。
根据命名规则,自定义演练任务的名称。 期望恢复时长(分钟) 3 从故障发生到故障恢复的预期时间 单击“添加一个新的攻击任务,还可创建5个攻击任务”,进入添加攻击新的攻击任务页面。 设置“添加新的攻击任务”,设置完成后单击“下一步”,进入选择攻击场景页面。 图5 “添加新的攻击任务”参数配置
COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 您可以在快速配置中心完成云运维中心配置和云服务配置: 云运维中心配置:涵盖资源应用管理、自动化运维、故障管理、变更管理、混沌演练5个场景的配置任务,您可以根据
单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_ . : = + - @特殊字符,但首尾不能含有空格,不能以_sys_开头,限制长度最长128个字符。 标签的值可以包含任意语种字母、数字、空格和_
集成管理 本文介绍如何集成监控源。 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。
云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心通过视图对组织内所有成员账号进行统一的分组管理,无需逐个登录到成员账号,实现资源可视范围的管控。 视图是一组筛选器,用户可以自由配置筛选范围,用于在跨账号场景下访问华为云中的资源信息。 创建步骤:设置视图基本信息
用户添加策略:进入“IAM”服务,选择“用户”,点击“添加权限”,选择“直接附加策略”,将上一步中创建的策略选上,点击“下一步”完成添加权限。 选择需要同步资源所属账号。 默认选择“我的资源”。 选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。 单击筛选框右侧。 父主题: 资源管理
制定PRR模板参数说明 参数名称 说明 模板名称 PRR模板的名称 模板描述 PRR模板的详细描述 应用分类 PRR模板所属的应用分类 PRR检查项 PRR模板提前制定的产品立项、产品设计、产品上线三个阶段的检查项信息 制定检查项信息,单击选择检查项所属的评审阶段“产品立项/产品设计/产品上线“,
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能发生的故障点进行
应急预案基本信息参数说明 参数名 参数描述 应急预案名称 用户自定义应急预案名称 企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。