检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
Cron表达式是一种用于指定定时任务的时间表达式,常用来指定任务的执行时间、执行频率和执行间隔。它由6个字段组成,分别表示秒、分、时、日期、月份、星期。 域取值 表1 Cron表达式域取值 域 允许的数值 允许的特殊字符 备注 秒 0~59 不支持 无 分 0~59 * / 任务的执行间隔大于30分钟
比、趋势图和Top /Bottom排序的方式,呈现事件风险情况。WarRoom中包含受损应用、引起WarRoom事件级别和时间窗,反映重大故障场景的发生和改善情况。回溯改进中包含回溯改进的闭环率和趋势分析,确保对于已发生的故障进行经验沉淀,减少相同故障再次发生的频率和处理时间。指标详情可查看表3。
自定义脚本参数值需要满足如下规则: 参数值长度为1-1024位。 可以包含大写字母、小写字母、数字以及特殊字符(_-/.*?:",=+@\[{]})和空格。 禁止出现连续‘.’。 父主题: 自动化运维常见问题
邀请成员账号加入组织之后,管理员或服务委托管理员可以在云运维中心查看和管理该组织下成员账号的数据与资源,支持的跨账号管理的功能有运维态势感知、资源管理和作业管理。 父主题: 开通云运维中心并授权使用
审批人通过排班场景和排班角色决定 审批方式:一人通过 或 全部通过 3、支持添加多个审批环节 注:排班角色需配置具体的审批人才可生效,未配置审批人变更申请将无法提交成功。 编辑审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,点击操作列的“编辑”,修改审批配置信息。
问题受理后状态为“定位出方案中”,定位出方案中状态可对问题单填写问题定位结果信息、转发责任人、升降级和挂起。 问题单挂起后需要创建单人审核,审批通过后状态为“挂起”,挂起后问题单可手动解除挂起或到达设定的解除挂起时间自动解除挂起。 问题填写定位结果时,若选择需要变更,问题单状态为“待现网实施
理流畅度和运维效率。 资源管理驾驶舱:从全局视角实现用户资源可视化管理,支持多云和跨账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查
/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书 另外,华为云还提供了以下销售许可证及软件著作权证书,供用户下载和参考。具体请查看合规资质证书。
制、可故障管理、可变更能力、可运维、安全生产等维度,对服务可用性及运维能力提出基线要求,在服务产品开发前端构筑能力,进行相关需求规划、设计和开发工作,并在服务上线前进行生产准入审视。 父主题: PRR评审
产品优势 一站式运维平台 提供集成式运维能力,支持集中管控和运维。 ITSM、ITOM、专家服务相互协同,形成合力。 无需多平台间跳转,站内闭环,夯实一站式体验。 一体化解决方案 化零为整,原子化运维能力实现有机融合。 沉淀华为云运维专家经验,提供场景化运维解决方案。 安全生产、
企业项目 应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。 若选择“自动化预案”,处理方式可以选择“脚本”和“作业”。 图3
问题管理 问题管理主要是对应用的所有问题单进行管理,通过识别故障的实际和潜在原因、管理规避方案和已知错误,来降低故障再次发生的可能性和影响性。包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配置SLA规则,若需配置请参考基础配置-SLA管理。
发起PRR评审的基本参数表 参数名称 说明 PRR评审名称 PRR评审的名称 PRR评审描述 PRR评审的描述 应用名称 PRR评审所属的应用名称 应用责任人 PRR评审所属的应用的责任人 应用介绍 PRR评审所属的应用的介绍信息 应用分类 PRR评审所属的应用的类别信息 评审阶段
转移资源 提供用户将已关联的资源转移至其它的分组内进行管理。 操作场景 通过Cloud Operations Center转移已关联的资源到其它应用下的指定分组中。 注意事项 只有资源所属的企业项目与应用所属的企业项目相同时才可转移。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理
根据页面提示,设置新增的影响应用信息。 单击“确定”完成添加。 图1 新增影响应用 在主屏可以看到添加的应用,支持填写故障开始时间、恢复时间及故障描述。提交后该应用的状态会变为恢复状态。 受影响应用支持执行应急预案快速恢复故障、同时可以查看该应用的告警、事件和变更信息。 图2 影响应用页面
单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 单击列表数据的“SLA”列对应的SLA模板,查看对应的SLA模板。 单击列表数据的“工单ID”列对应的“工单ID”或“操作”列对应的“查看详情”,查看SLA记录详情。
资源管理 COC提供以资源为基础的资源管理视图。面向各类资源提供纳管能力,可建立资源拓扑;按照资源类型汇聚,支持按照标签查询资源列表,并提供UniAgent安装能力。 Global 应用管理 COC提供以应用为中心的资源管理视图。提供应用和资源关联关系的建模能力。按照“应用 > 区域
在响应预案部分,选择针对本次流转规则相关联的脚本、作业和应急预案,脚本和作业的添加请参考自动化运维。 脚本、作业和自动化预案支持故障自愈能力,选择脚本作业和自动化预案后会显示“自动执行”勾选项,勾选后带出脚本或作业对应的参数 图5 填写响应预案 参数值、Region ID、和目标实例填写格式为${}
流程管理 流程管理支持自定义事件、问题的级别和描述,同时支持配置事件或问题升降级,暂停的审批配置。按照公司事件和问题管理流程制定级别的类别。 事件流程 问题流程 变更场景 父主题: 基础配置
用户访问COC的方式包括:COC控制台、API、SDK,无论哪种访问方式,其本质都是通过COC提供的REST风格的API接口进行请求。 COC的接口支持认证请求,经过认证的请求需要包含一个签名值,该签名值以请求者的访问密钥(AK/SK)作为加密因子,结合请求体携带的特定信息计算而