检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障信息 操作场景 WarRoom启动后,可以查看、编辑故障信息,本节介绍如何管理WarRoom的故障信息。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。
审批人无法接收通知? 审批人没有在人员管理配置任何消息通知渠道。 消息渠道配置请参考:如何使用人员管理。 父主题: 自动化运维常见问题
自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:明确标准化事件处理流程,通过WarRoom实现多运维兵种协同作战,通过响应预案提升事件处理效率。 图1 标准化故障管理 COC通过设置流转规则
与会成员 操作场景 WarRoom启动后,可以查看与会成员、邀请成员、设置恢复责任人、设置恢复成员、移除成员,本节介绍如何管理WarRoom中的与会成员。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom
理流畅度和运维效率。 资源管理驾驶舱:从全局视角实现用户资源可视化管理,支持多云和跨账号集中运维能力。 图2 资源全生命周期管理 变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查
型企业。 例如:如果需要对IAM用户授予可以创建华北-北京四区域的ECS和华南-广州区域的OBS的权限,基于角色授权的场景中,管理员需要创建两个自定义策略,并且为IAM用户同时授予这两个自定义策略才可以实现权限控制。在基于策略授权的场景中,管理员仅需要创建一个自定义策略,在策略中
提供用户从脚本、作业等已有能力选择任务并且创建定时任务的能力。支持单次执行和周期执行两种执行方案,周期性包括Cron表达式和简单周期执行。 Global 参数中心 支持Region级参数全生命周期管理,持续看护参数正确性和一致性。支持作业编排等运维场景快速引用。 Global 事件中心
WarRoom状态 操作场景 WarRoom启动后,可以查看、更新WarRoom状态,本节介绍如何管理WarRoom的状态。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入
集成管理 本文介绍如何集成监控源。 操作场景 每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 操作步骤 该步骤主要介绍华为云监控系统、开源监控系统的接入步骤 登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”配置页面。
分散的监控系统告警进行统一收口及管理。不同的监控系统通过各自独立的集成接入密钥实现对接集成。 监控系统接入后,配置流转规则后可将告警信息转事件或告警。 当前支持集成CES、AOM、Prometheus和自建监控系统。 集成管理 父主题: 故障管理
待办中心 概述 待办中心主要实现功能:客户华为云主账号(租户主SRE)直接创建任务给下属的某些IAM账号(租户子SRE)去处理(如一个公司下有不同部门,每个部门分别有一个IAM账号)。 新增待办 登录COC。 在左侧导航栏选择“任务管理 > 待办中心”页面,进入待办中心列表界面。
某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“排雷”和“验收”,以确保在正式引流时无重大稳定性风险。
快速配置中心 COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 操作场景 通过快速配置中心进行不同场景资源的快捷配置。 云运维中心配置 登录COC。 进入COC“总览”后,可以看到快速配置中心。
审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CTS可记录COC的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法,请参见CTS快速入门。 日志 用户
、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。 本章节介绍如何通过云运维中心操作一台弹性云服务器ECS进行CPU使用率加压的故障演练。 操作流程 操作步骤 说明 准备工作 注册华为账号并实名认证,开通云运维中心。
新增起会规则 操作场景 WarRoom拉起会议通过起会规则拉起,本节介绍如何创建起会规则。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,选择“起会规则”页签,进入“起会规则”列表。 图1 起会规则列表 在起会规则列表上方,单击“新建起会规则”,输入规则
需要,进行纳管策略设置,来确保新增的主机实例也能被自动纳管。 图1 开启改密策略 未绑定组件的增量主机实例实现自动纳管,打开“全局维度”按钮即可;已绑定组件的增量主机实例实现自动纳管,点击“组件维度”页签下“选择组件”按钮,通过搜索应用或组件名称,“确定”提交即可。 图2 选择组件
补丁基线中安装规则基线与自定义基线的区别? 补丁工单日志中出现all mirrors were tried异常如何处理? 机器无法选择? 补丁修复后合规性报告仍然为不合规如何处理? 补丁操作出现lsb_release not found异常如何处理? 父主题: 资源运维常见问题
补丁管理提供了用户能够管理ECS或CCE实例上补丁的能力。通过补丁管理能力,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确认执行机器所在的区域为
产品咨询 云运维中心权限如何配置? 如何通过企业项目进行权限控制