检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
审批人通过排班场景和排班角色决定。 审批方式:一人通过 或 全部通过。 3、支持添加多个审批环节 注:排班角色需配置具体的审批人才可生效,未配置审批人变更申请将无法提交成功。 编辑审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,点击操作列的“编辑”,修改审批配置信息。
作业:在下拉列表选择选择作业,支持自定义作业和公共作业。 作业类型的任务,当前暂不支持引用全局参数的作业任务,以及无目标实例的作业。 IAM权限委托:用户授权云运维中心执行作业所能够使用的权限范围。 区域:请选择目标实例所在区域。 目标实例模式:请选择作业步骤和目标实例的执行方式。 所有步骤一致:
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书 另外,华为云还提供了以下销售许可证及软件著作权证书,供用户下载和参考。具体请查看合规资质证书。
概述 定时运维页面展示所有定时任务详情和执行记录。您可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、作业管理等操作。 定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。
在本服务左侧菜单“参数管理 > 参数中心”模块中创建需要选择的参数。 设置“执行用户”和“超时时间”。 执行用户:默认“root”,目标实例节点上执行脚本的用户。 超时时间:默认“300”秒,脚本在单个目标实例上执行的超时时间。 单击“添加实例”,设置“选择实例”。 表2 选择实例参数说明
理流畅度和运维效率。 资源管理驾驶舱:从全局视角实现用户资源可视化管理,支持多云和跨账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查
一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源
删除前通知和未修改通知规则。 删除前通知时间必须小于到期删除时间。 删除前通知时间必须大于参数创建或修改的时间。 未修改通知时间不能小于参数创建或修改的时间。 有到期删除策略时,未修改通知时间不能大于到期删除时间。 (可选)单击“添加标签”。 标签的键仅支持包含数字、字母和_- .
问题流程 使用场景 实际业务中问题级别、类型、降级和挂起和系统默认的枚举值或流程有差异,可对问题级别、问题分类进行修改,对问题降级和问题挂起的审批配置进行自定义。 问题级别 问题类型 问题审批 父主题: 流程管理
数量、WarRoom数量和期望完成时间等。此外,用户还可以通过列表中的“PRR评审名称”进入评审详情页面,查看评审的详细信息,包括评审进程详情以及改进事项等。 PRR评审列表是 PRR评审管理功能的一部分,使用户能够有效地追踪和管理 PRR评审的整个流程。 父主题: PRR评审
说明 报告标题 自定义故障报告的标题。 报告责任人 在下拉列表选择故障报告责任人。 故障现象 请填写故障的现象。 限制长度1-1000个字符。 影响客户 请填写受影响的客户。 限制长度1-1000个字符。 影响应用 请填写应用的影响描述。 支持添加和删除影响应用。 设置“处理过程”。
企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。 若选择“自动化预案”,处理方式可以选择“脚本”和“作业”。 图3
警填写的业务中断时间自动计入对应应用的SLO中断记录。具体操作步骤如下: 创建SLA规则,设置触发类型:告警管理,选择级别和应用,需要包含汇聚告警级别和应用。 创建SLO规则,选择应用,需要包含汇聚告警应用。 汇聚告警产生后,条件满足SLA记录设置的级别和应用,生成对应的SLA记录。
问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。 Global 流转规则 流转规则将所有接收的集成原始告警进行抑制、降噪、去重、路由分派操作,支持多
可选参数。单击“添加标签”,输入标签的键和值。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键可以包含任意语种字母、数字、空格和_ . : = + - @特殊字符,但首尾不能含有空格,不能以_sys_开头,限制长度最长128个字符。 标签的值可以包含任意语种字母、数字、空格和_ .
排班管理”页面,选择排班场景和排班角色,单击排班“操作”列的“删除”,即可删除排班。 图1 全局固定排班删除人员 全局排班+轮班班次 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择排班场景,单击“清空人员”。 图2 全局轮班场景删除人员 在清空人员弹窗填写开始时间和结束时间,选
概述 作业是操作步骤(原子动作)的集合,一个作业可以包含一个或多个操作,例如重启ECS、执行脚本等。 作业管理提供对公共作业、自定义作业的创建、修改、克隆、删除等管理的能力以及在目标实例上执行作业的能力。通过作业管理,用户可以在目标实例执行定义好的特定操作步骤。作业管理支持最多100个版本。
rRoom。 故障定界和恢复:分析故障影响范围,恢复所有受影响应用。 若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。 故障已恢复:检查故障处理结果和应用状态。 注意:将所有
手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 单击“提交”并“确定”,开始执行工单。