检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
某智能客服运维人员在处理事件/告警时,事件处理闭环低效,无标准化事故处理流程、无明确故障恢复协同作战阵型、无应急响应预案。同类型故障场景重复出现,无运维经验沉淀,确定性故障场景无法自动恢复。存在多种级别的告警,处理告警缺乏规范性流程且处理效率较低。需要建立标准化的事件流程,实现规范性处理。 解决方案 端到端事件流程:
补丁管理 补丁管理提供了用户能够管理ECS或CCE实例上补丁的能力。通过补丁管理能力,用户能够实现操作系统补丁合规性扫描,操作系统补丁合规性修复功能。 补丁管理当前仅支持能够访问公网的机器,可通过绑定EIP或NAT网关的方式实现,请在功能使用前确认。 在执行补丁管理操作之前,请确
支持哪些攻击场景? 支持对华为云ECS实例、RDS实例、CCE集群和Pod等多个云服务的常见故障场景的模拟,支持对多个故障场景的自由编排和组合。 父主题: 韧性中心常见问题
页面。 图6 场景管理 在管理场景列表“操作”列单击对应的“编辑”。 在编辑弹框中修改场景名称和描述,单击“确定”完成编辑。 图7 编辑排班场景 排班场景中的排班方式和排班维度不能修改,若需要修改请按照创建排班指导创建排班 在排班场景页面可编辑关联的排班角色,点击排班场景前,在排
资源运维概述 资源运维提供了ECS、RDS、FlexusL、BMS操作的功能,也可以通过操作对机器进行批量开关机、批量重启、切换操作系统以及重装操作系统操作。 父主题: 资源运维
升降级 操作场景 事件单等级与实际情况不符,只有在事件受理后才能修改事件级别。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入事件详情 单击页面右上角“...”中的“升降级”。 图2 升降级事件
最大长度:512 请求示例 查询ECS报告下不合规的报告列表 /v1/patch/instance/compliant?offset=1&limit=10&compliant_status=non_compliant&report_scene=ECS 响应示例 状态码: 200 节点合规性报告信息
到期通知 到期通知时间必须小于到期删除时间 图1 到期通知时间大于到期删除时间 到期通知时间必须大于参数创建或修改的时间 图2 到期通知时间小于系统时间 父主题: 通知规则
提供用户创建应用的能力,便于按业务逻辑单元进行资源管理。 操作场景 通过Cloud Operations Center创建应用。 注意事项 同一个应用下不能同时存在子应用和组件。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,单击“创建应用”。
版本号 必选参数。 版本管理的版本号 IAM权限委托 必选参数。 执行该定时任务的委托权限 说明: 若选择的任务是公共作业下的ECS开机、ECS关机、ECS重启、OS补丁扫描或OS补丁修复,系统执行时默认使用名为ServiceAgencyForCOC的委托。 风险等级 必选参数。 风险等级有以下三种:
点击此处 填入自动化执行参数,单击“确认配置”。 选择区域后,补丁自动化操作将定时执行该区域中所有Agent正常运行且操作系统为Linux的ECS实例,请自行判断影响范围。 图2 定时任务参数 创建定时任务成功后,可单击页面上方“补丁自动扫描“或“补丁自动修复“进入定时运维页面查看或编辑。
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
资源管理常见问题 首次安装UniAgent如何操作? 如果资源无法在资源管理页面中查询到,如何处理? 无法找到应用管理层级说明页面?
自动化运维常见问题 审批人无法接收通知? 自定义脚本参数输入值无效? 实例无法选择? 如何在不重启实例的情况下重置密码? 父主题: 资源运维常见问题
作”列单击“订阅”。 图5 订阅 人员管理中的订阅用途简介: 单击“订阅”后,弹窗中可选择需要发起订阅的通知方式,只能选择一个。 订阅时,无法勾选已确认订阅的通知方式。 若用户所有的通知方式均已确认订阅,则在页面操作栏中的“订阅”按钮不可单击。 父主题: 人员管理
请、评估、批准、排序、计划、测试、实施和回顾的变更)。 紧急变更(为了处理生产环境不可用或机器不可用、紧急满足业务需求而提出的计划外变更,无法满足计划性要求,或者来不及走正常流程进行评估审批的变更)。 审批环节上的区别 支持针对常规变更、紧急变更两个场景配置审批环节。 父主题: 变更管理常见问题
器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 关机展示操作页
器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 开机展示操作页
器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 重启展示操作页
器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 输入“熔断策略”。 用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,可以精确到小数点后一位。 单击“提交”。 图2 开启展示操作页