检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
定时运维 概述 创建定时任务 管理定时任务 定时任务执行记录 Cron表达式使用 父主题: 自动化运维
SLA管理 SLA管理概述 自定义SLA 公共SLA SLA记录 父主题: 基础配置
发起PRR评审的基本参数表 参数名称 说明 PRR评审名称 PRR评审的名称 PRR评审描述 PRR评审的描述 应用名称 PRR评审所属的应用名称 应用责任人 PRR评审所属的应用的责任人 应用介绍 PRR评审所属的应用的介绍信息 应用分类 PRR评审所属的应用的类别信息 评审阶段
管理员在用户列表中,单击新建的用户,右侧的“授权”。 图1 IAM用户授权 授权模型选择“角色授权”。 图2 选择授权模型 授权方式选择“直接给用户授权(适用于企业项目授权)”,根据需要分配“COC FullAccess”或“COC ReadOnlyAccess”策略,策略详情可查看COC权限管理。
每个监控源的集成配置都有独立的集成接入步骤,需要单独接入,各监控源的详细步骤可查看集成接入中各监控集成说明。 接入集成 该步骤介绍华为云监控系统、开源监控系统的接入步骤 登录云运维中心。 在左侧导航栏选择“故障管理 > 集成管理”。 在集成管理配置页面根据业务需要选择要接入的接入源,单击“接入集成”。
安全评分 操作场景 通过云运维中心查看安全云脑 SecMaster的安全评分和风险,安全评分维度包含合规检查、漏洞、威胁告警等。 安全概览 登录云运维中心。 进入COC“总览”后,可以查看安全云脑的安全评分。 图1 安全评分 单击“前往处理”,可跳转至安全云脑。 图2 跳转安全云脑
概述 创建问题 驳回问题 重新提交问题 撤销问题 转发问题 受理问题 升降级 挂起问题 问题定位出方案 问题待现网实施 验证问题 问题处理记录 父主题: 故障管理
驳回事件 重新开启事件 转发事件 受理事件 升降级 添加备注 启动WarRoom 处理事件 验证事件 事件创建改进单 故障复盘 应用诊断 事件历史记录 父主题: 故障管理
生成事件的流程是什么? 生成事件有三种方式:手动创建事件、告警转事件和通过流转规则自动生成事件,具体介绍如下。 手动创建事件 在故障管理>事件管理创建事件单,具体操作详见创建事件单。 告警转事件 在故障管理>事件管理创建事件单,具体操作详见告警转事件。 流转规则自动生成事件 流转规则自动生成事件,需要做以下步骤:
parameter:list权限 如果您找不到指定的参数,需要确认是否有该参数的权限 coc:service-name:region:account-id:resource-type:resource-path这个是资源类权限的结构,*代表该层级所有权限,添加资源类权限需要按照这个格式填写
概述 云运维中心的韧性中心提供了应急预案功能,允许用户为系统可能发生的故障建立对应的应急预案。这样,在故障发生后,用户可以参考这些预案进行紧急恢复。创建应急预案的流程包括登录 云运维中心,选择“韧性中心>应急预案”页面,并进行应急预案的自定义创建,包括填写基本信息、选择处理方式(如“脚本”或“作业”)
流转规则 流转规则 租户创建的流转规则个数≤50个。 集成管理 数据记录 COC保存集成数据源的最近10次数据记录。 人员管理 人员数量 租户创建的人员个数≤50个。 排班管理 排班角色 单个排班场景下的排班角色≤10个。 账号管理 资源类型 目前支持纳管的资源类型: 弹性云服务器 ECS
变更配置:承载变更中心相关配置的业务,支持审批配置等变更基础配置的能力。支持用户根据自身业务需求,自定义变更单审批流程、审批人员。 变更管控:是对资源进行变更操作时,通过工单提权的方式,才能执行脚本、作业或查询账号密码等操作,确保人和所操作的对象和实际资源保持一致,防止权限过大,降低安全风险。
单击应用拓扑右侧“告警”。 查看应用告警,列表展示告警产生时间范围在右侧时间轴内的告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。 单击应用拓扑右侧“变更”。 查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。 单击应用拓扑右侧“故障诊断”。 查看资源的故障诊断数据,可以对应用的DCS
在下拉列表中选择区域。 华北-北京一 目标实例 在筛选框设置条件,选择筛选出的实例。 - 勾选“同意安装插件并采集数据《GuestOS诊断服务前端数据授权》”,单击“同意”。 单击“提交”。 等待诊断完成,查看诊断报告。 父主题: 诊断工具
用户可以自定义补丁安装规则、补丁的合规性级别、补丁例外。 使用补丁管理包含以下步骤: 创建补丁基线,基于操作系统及对应的补丁扫描基线。 补丁扫描,基于扫描基线对资源进行补丁扫描。 查看摘要,扫描完成后可以查看资源的扫描合规性。 补丁修复,不合规的资源可以执行批量修复。 定时运维:
选择时间周期内,已完成的变更单数量 天/月 个 变更成功率 变更管理 统计变更单的成功率情况 变更成功率=变更成功的变更单数量/已完成的变更单数量*100% 天/月 百分比 变更平均时长 变更管理 统计变更单的平均处理时长 选择时间周期内,已完成的变更单时长求和/已完成的变更单数量*100% 天/月
常规变更&紧急变更的区别? 概念上的区别 常规变更(指非紧急、能通过正常程序化的申请、评估、批准、排序、计划、测试、实施和回顾的变更)。 紧急变更(为了处理生产环境不可用或机器不可用、紧急满足业务需求而提出的计划外变更,无法满足计划性要求,或者来不及走正常流程进行评估审批的变更)。 审批环节上的区别
如果资源无法在资源管理页面中查询到,如何处理? 在资源管理页面中进行同步资源。具体操作详见同步资源。 父主题: 资源管理常见问题
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题