检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
已关闭”装填前,若又满足流转规则不再会产生事件---该规则是默认启用的,支持关闭该规则。 2.流转规则生成汇聚告警,在窗口期内若没有收到原始告警,系统会将之前窗口期内的告警作为历史告警(即当前告警状态默认设置为“已处理”) 图4 流转规则转事件/告警示意图 触发条件中key说明如下:
t_fault()、check_fault_status()、rollback()、clean()函数内编写自定义的内容来自定义故障注入函数、故障检查函数、故障回滚函数、环境清理函数操作。 按照上述规范,还有两个必填的脚本参数,如下。是否有其余脚本参数由您脚本内容决定。 表1 自定义故障脚本必填参数说明
概述 流转规则将所有接收的集成原始告警进行去重操作,支持每个流转规则配置事件时默认分配对象&通知策略,从而实现更准确的通知。 父主题: 流转规则
全链路故障诊断 操作场景 当事件创建后,您可以通过全链路故障诊断,快速定位故障根因。我们面向客户应用提供应用层、组件层、资源层的关系拓扑,实现基于资源和应用告警的异常染色,并提供资源核心指标查看与实例诊断能力。 前提条件 已完成在CMDB的应用创建和资源关联,并完成应用拓扑编辑。
待办中心 概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。
自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:明确标准化事件处理流程,通过WarRoom实现多运维兵种协同作战,通过响应预案提升事件处理效率。 图1 标准化故障管理 COC通过设置流转规则
稽查能力,从事前、事中、事后逐层拦截变更风险,实现全方位运维作业可信。 AI加持风险评估:通过高危命令智能拦截算法,AI加持消减作业风险。 图3 变更风控&作业可信 标准化故障管理 标准化故障管理流程,加持WarRoom驾驶舱,实现故障高效协同和快速恢复。 标准化流程:华为云标准
当产生事件单、问题单或有变更单时,通知规则会根据事件/问题/变更信息和配置的通知规则进行信息匹配,解析出需要通知的人员、内容和发送通知的渠道,进行发送通知信息,实现了自动通知的功能。 事件和变更的通知模板为系统内置的,您可以根据您的场景选择通知模板。 创建通知 创建通知规则,事件单、问题单和变更单触发对应场景后会自动发送通知。
风险评估:基于场景规则、流程规则、业务规则对变更进行管控,提前识别和拦截变更风险;通过变更日历实现变更冲突检测,降低服务间变更依赖导致的变更风险。 实施保障:按预定方案执行变更,变更步骤标准化、可观测,变更异常及时介入处理,实现变更实施全过程可控、可视、可管。 确定性故障管理 统一事件中心:提供事件发
如何在不重启实例的情况下重置密码? COC提供了管理员/非管理员账号重置密码的公共脚本,通过该脚本实现重置密码效果,不会重启实例,您可通过执行相应的公共脚本来重置实例(目前支持ECS和BMS资源类型)的密码。 图1 执行重置密码公共脚本 您在COC中执行公共脚本时,需要选择实例,而能够选择到实例的前提条件为:
Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供变更管理、批量运维等核心特性,实现在安全合规的前提下,提升用户运维能力成熟度和云上运维效率。 COC提供以下功能: 运维态势感知大屏,面向不同角色运维人员的专属运维BI看板,辅助管理层洞察决策和优化改进。
ITSM、ITOM、专家服务相互协同,形成合力。 无需多平台间跳转,站内闭环,夯实一站式体验。 一体化解决方案 化零为整,原子化运维能力实现有机融合。 沉淀华为云运维专家经验,提供场景化运维解决方案。 安全生产、运维大脑、故障管理等优秀实践使能客户极简运维。 一朵云使用体验 构
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 云运维中心配置 登录COC。 进入COC“总览”后,可以看到快速配置中心。
需要,进行纳管策略设置,来确保新增的主机实例也能被自动纳管。 图1 开启改密策略 未绑定组件的增量主机实例实现自动纳管,打开“全局维度”按钮即可;已绑定组件的增量主机实例实现自动纳管,点击“组件维度”页签下“选择组件”按钮,通过搜索应用或组件名称,“确定”提交即可。 图2 选择组件
AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。 多AZ容灾 COC支持跨AZ容灾,当一个AZ异常时,不影响COC实例持续提供服务。 数据容灾 通过数据定期备份方式实现数据容灾。 父主题: 安全
补丁管理提供了用户能够管理ECS或CCE实例上补丁的能力。通过补丁管理能力,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执行机器所在的区域为
集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。 集成管理
个流转规则配置事件时默认分配对象和通知策略,而实现更准确的通知。 Global 集成管理 集成配置支持简单、快速集成现有或第三方等监控系统;将业务下所有分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 Global 变更管理 变更中心主
Center)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。承载华为云确定性运维业务场景,提供故障管理、批量运维、混沌演练等核心特性,实现在安全合规的前提下,云上运维效率提升。 产品介绍 立即使用 立即使用 仅两个按钮时选用 成长地图 由浅入深,带您玩转COC 01 了解 云运维中心(Cloud
授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM项目(Project)/企业项目(Enterprise