检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问题流程 使用场景 实际业务中问题级别、类型、降级和挂起和系统默认的枚举值或流程有差异,可对问题级别、问题分类进行修改,对问题降级和问题挂起的审批配置进行自定义。 问题级别 问题类型 问题审批 父主题: 流程管理
总览 为用户提供资源健康度、资源监控信息、安全概览、运维态势感知、系统公告等相关信息,呈现基于资源一站式的信息概览,同时您可通过总览页面右上角“自定义设置”灵活配置页面楼层的展示和排序。 运维概览 快速配置中心 资源看板 资源监控 优化顾问 安全评分 运维态势感知
混沌演练是什么? 混沌演练是通过主动在系统中模拟软件或硬件故障,并根据系统在各种压力下的表现行为确定优化策略的一种系统韧性保障手段。一个完整的混沌演练包括前期的故障模式分析,中期的故障注入和后期的复盘改进。 父主题: 韧性中心常见问题
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
示资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 支持查看华为云资源的拓扑关系。 支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器 (BMS)、云容器引擎 (CCE)的拓扑关系。 查看资源拓扑 登录云运维中心。 在左侧导航栏选择“资源管理
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
集成管理 支持用户自主接入告警数据 功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型
业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的 IaaS、PaaS 和 SaaS 类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务
区域筛选 鼠标移动到云服务图标(云服务图标右上角红底数字代表告警数量)悬停,可以快速查看紧急/重要告警数量,以及资源实例的区域分布。 图3 鼠标悬停查看资源 单击云服务图标,可以查询对应资源类型的全部资源信息。 图4 查询资源信息 单击“查看详情”将会跳转至ECS云服务的实例基本信息页面。
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
若需拉起WarRoom群组,需在移动应用管理接入钉钉、企业微信或飞书。 处理流程 Warroom处理流程如下: 启动Warroom:在事件管理处理事件页面启动WarRoom。 故障定界和恢复:分析故障影响范围,恢复所有受影响应用。 若分析还有其他应用受影响,使用新增影响应用增加。
集成自建监控系统告警。 告警管理数据,当前支持POST方式集成,具体参考自建监控系统上报告警。 验证集成是否成功。 在左侧导航栏选择“故障管理 > 集成管理”,在“已集成”中查看到应用运维管理监控源状态为“已接收报警”则说明已集成成功。 自定义集成最多只能接入5个监控系统,若对接错误,禁用后删除即可。
任务类型:脚本,作业。 执行对象:目标实例,由客户自行选择。 定时运维使用限制 单个租户最多支持创建100个定时任务。 目标实例目前仅支持弹性云服务器(ECS),裸金属服务器(BMS)和云耀FlexusL实例三种类型。 定时运维任务“状态”列为“正常”(免审批或已审批入库的)、“是否启用”列为“开启”才会自动执行脚本/作业。
各种挑战做好准备。 注意事项 由于自定义故障完全由您编写的脚本决定,所以在使用脚本对弹性云服务器 (ECS)进行攻击时,可能会导致资源使用率飙高、网络发生故障等异常现象,从而存在将弹性云服务器 (ECS)上已安装的UniAgent状态变成离线/异常的风险,请悉知。 创建自定义故障
管理跨账号资源 操作场景 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力。当您的账号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,你可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力
概述 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前华为云账号下的用户,人员管理中的用户从 统一身份认证服务(IAM) 同步,人员管理页面的数据作为云运维中心的用户基础数据,供创建待办、定时运维、通知管理、事件中心等多个功能模块使用。 人员管理页面可以
选择需要查看资源所在的云厂商。 默认选择“华为云”。 选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。 选择目标实例,单击实例名称。 单击下方的“查看资源详情”。 进入对应资源服务详情页面。 父主题: 资源管理
SLO管理概述 SLO(服务级别目标,Service Level Object)为业界通用指标,SLO实际值=1-(应用不可用时长/应用总时长)*100%,通常代表服务/应用的质量水平。 在COC中,Warroom、告警、事件(“业务是否中断”属性为“是”的事件单)等运维工单,会
SLO期望值)*全年服务总时长(min); 当SLO实际值≤SLO期望值时,ErrorBudget=0; 天/月 分钟 PRR看板 PRR看板(生产就绪程度评审)中包含评审服务汇总、评估雷达分布、服务复盘、改进任务闭环情况。评审服务汇总体现投入生产前各个服务当前所处的评审阶段,以
自定义预案 操作场景 您可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 自定义预案页面 单击右上角“创建应急预案”,填写应急预案基本信息。