检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
概述 问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理
产品介绍 立即使用 立即使用 仅两个按钮时选用 成长地图 由浅入深,带您玩转COC 01 了解 云运维中心(Cloud Operations Center)承载华为云确定性运维业务场景,为用户提供集中、简化、一站式的运维工作台。
表1 操作系统安装规则 类型 可选项 说明 产品 全部 Huawei Cloud EulerOS1.1 Huawei Cloud EulerOS2.0 选择补丁的产品属性,在补丁扫描修复时将会过滤出该产品的补丁。
手动关联资源 操作场景 为分组创建对应环境后,即可为环境关联相关资源实例,后续可通过应用监控功能实时监控资源的使用情况。 手动关联资源 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要关联资源的应用,单击“关联资源
如果自动拉起WarRoom则为必填,当前只支持1个 最小长度:0 最大长度:255 数组长度:0 - 1 enterprise_project Array of strings 企业项目ID,当前只支持1个 最小长度:0 最大长度:255 数组长度:0 - 1 current_cloud_service
修改应用 操作场景 应用创建后,若想对应用的名称或描述进行修改,请按如下操作进行。 修改应用 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要修改的应用,单击。 设置“编辑应用”。 表1 编辑应用参数说明 参数 说明
配置UniAgent 操作场景 UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座, 提供中间件指标采集、自定义指标采集能力和脚本下发执行通道。本章介绍UniAgent的安装、重装、升级、卸载和状态同步操作,安装完成后您可以通过UniAgent对资源执行自动化运维
创建组件 操作场景 创建应用或创建子应用后,若想在应用或子应用下创建组件,请按如下操作进行。 创建组件 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择需要创建组件的应用,单击。 设置“创建组件”。 表1 创建组件参数说明
修改组件 操作场景 组件创建后,若想对组件的名称进行修改,请按如下操作进行。 修改组件 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,展开应用,选择需要修改的组件,单击。 设置“修改组件”。 表1 修改组件参数说明 参数
实例 实例是终端用户使用服务目录创建的云资源,可以是单个云资源(例如:一台ECS),也可以是多个云资源(例如:多台ECS、一个数据库、一个VPC等)的组合。 授权 在产品组合中,管理员可以为终端用户授权,以便终端用户在服务目录查看产品组合中的所有产品。
事件类别 KEY 中文名称 英文名称 inc_type_p_security_issues 安全问题 Security issues inc_type_p_function_issues 功能问题 function issues inc_type_p_reliability_issues
升降级 操作场景 如果事件单在处理过程发现事件等级与实际情况不符,需修改级别,可以通过事件升降级操作进行。注意:事件只有在受理后才能修改级别。事件级别降级可以增加审批流程,详细操作请参考事件审批,设置后满足条件的事件降级申请需要审批人审核通过或驳回后才可以完成事件降级流程。 升降级
责任共担 华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任
重新开启事件 操作场景 事件单被驳回后,事件提单人再次确认该故障需要提交,可以编辑事件单内容后重新提交。 重新开启事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“重新开启”。 设置“修改事件单
创建事件 操作场景 云运维中心提供了多种方式生成事件来记录故障。如果汇聚告警工单转事件和原始告警触发自动生成事件两种被动生成事件的方式不满足您的业务需求,您还可以通过手动创建事件功能来记录。 前提条件 需要先在应用管理中创建您的应用。 注意事项 确认事件单的内容,并如实填写事件等级
创建自定义脚本 操作场景 如果云运维中心提供的公共脚本不满足您的要求,可以创建自定义脚本。脚本支持“Shell”、“Python”、“Bat”三种命令,支持全局参数和关联参数仓库。 注意事项 确认脚本内容的风险等级,并如实填写风险等级。 创建自定义脚本 登录云运维中心。 在左侧导航栏选择
账号基线 操作场景 账号基线分为全局基线和组件基线。 全局基线:系统内置基线,针对没有绑定组件的主机,不可删除,使用全局基线需要通过修改账号基线添加基线账号;开启了全局基线的改密策略后,会按照基线中创建的账号来进行定期改密。 组件基线:创建账号基线创建的是组件基线,用户根据业务需求自定义创建
图8 通过演练规划接单进入创建演练任务页面 步骤四:演练任务 通过Cloud Operations Center创建一个演练任务。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,可以查看演练任务列表。 单击“创建演练任务”。
创建自定义故障 通过Cloud Operations Center创建一个自定义故障攻击场景的演练任务。 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签,参考演练任务,新建攻击任务。
创建自定义作业 操作场景 如果云运维中心提供的公共作业不满足您的要求,可以创建自定义作业。作业包含自定义脚本、API、流程控制等,支持全局参数和关联参数仓库。 注意事项 根据作业步骤内容,确认并如实填写作业的风险等级。 创建自定义作业 登录云运维中心。 在左侧导航栏选择“资源管理