检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
验证事件 操作场景 事件单处理完成后,验证事件是否处理完成。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 事件管理”,选择“待处理的”页签,单击事件标题进入“事件详情”页面。 图1 进入页面详情 单击“验证关闭”。 图2 验证关闭事件 填写验证信息后,单击“确定。 图3
待验证 操作场景 问题单处理完成后,需求创单人验证问题是否已解决。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“验证”,跳转验证详情,填写信息后点击提交。 图1 问题单验证页面
诊断工具 OS诊断 父主题: 故障管理
OS诊断 登录COC。 在左侧菜单栏单击“故障管理 > 诊断工具”,在“OS诊断”模块单击“立即诊断”,进入“创建OS诊断”页面。 图1 OS诊断入口 在“创建OS诊断”页面,单击“添加实例”。实例需提前安装UniAgent,且镜像和规格满足OS诊断要求。 图2 选择实例 在“创
认证证书 合规证书 华为云服务及平台通过了多项国内外权威机构(ISO/SOC/PCI等)的安全合规认证,用户可自行申请下载合规资质证书。 图1 合规证书下载 资源中心 华为云还提供以下资源来帮助用户满足合规性要求,具体请查看资源中心。 图2 资源中心 销售许可证&软件著作权证书 另
验证事件处理结果 功能介绍 验证事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
怎么能收到事件单通知? 登录COC。 在人员管理中完成消息通知订阅,具体参考人员管理。 在通知管理中配置通知规则,具体参考通知管理。 父主题: 故障管理常见问题
受理事件单 功能介绍 受理事件 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号,示
HandleCocIncident 处理事件单 URI POST /v1/external/incident/handle 备注:受理,提交解决方案,验证等操作URI一致。 请求参数 表1 请求Body参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号
改进管理”,选择“待处理的”页签,选择待验证状态的改进单,单击改进标题进入“改进单详情”页面。 图3 改进单列表 单击右上角的“验证”,填写验证结论。 图4 改进单验证 改进单历史记录 登录COC。 在左侧菜单栏选择“故障管理 > 改进管理”,选择“待处理的”页签,选择待验证状态的改进单,单击改进标题进入“改进单详情”页面。
事件创建:创建事件后需要发送通知。 事件驳回:事件被驳回后发送通知。 事件转发:事件转发后发送通知。 事件验证:事件解决后进入待验证状态时发送通知。 事件完成:事件已经处理并验证通过后发送通知。 事件验证未通过:事件进入待验证状态下,验证不通过时发送通知。 事件驳回后完成:事件被驳回后,事件被关闭后发送通知。 父主题:
理”、“升降级”、“添加备注”、“启动warroom”等操作。 事件单被处理后,进入“已解决待验证”状态,已解决待验证状态下可进行“验证”操作,验证通过后事件单进入“已完成”状态,验证不通过后,重新进入“已受理”状态。 若需要增加事件级暂停功能,可参考基础配置-事件流程 图1 事件流程图
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环
安全合规性担忧;需要周期性检查主机OS补丁的合规性情况,避免主机因为OS补丁缺失产生漏洞,导致业务受损。云上无统一的OS合规性管理和自闭环工具,合规性问题修复困难或求助华为侧协助解决。希望能够自动化的完成OS补丁的扫描,并且及时修复补丁漏洞,保证主机的OS补丁合规性。 解决方案
失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。 操作场景 您可以对应用可能发生的故障点进行分析,通过描述故障发生的条件
图23 单击“事件处理”按钮 填写事件处理信息后,单击“提交”。 图24 填写事件处理信息 单击“验证关闭”。 图25 单击“验证关闭”按钮 填写验证信息后,单击“确定”。 图26 填写验证信息
解决该问题需要涉及变更实施操作。 前提条件 问题定位出解决方案详情页面,“是否需要变更”填写“需要变更”,问题单会走到待现网实施阶段。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“现网实
ows。 登录帐号:登录主机的帐号。当操作系统为LINUX时,建议使用root帐号,可保证有足够的读写权限。 登录端口:访问主机的端口。 认证方式:认证方式为密码。 密码:登录主机的密码。 连接测试结果:连接测试的结果,测试安装机和需安装主机间的网络连通性。 操作:连接测试。 说明:
接入方式有三种:直连接入(内网)、直连接入(公网)和代理接入。 直连接入(内网):华为云主机,使用直连接入(内网)的方式。 直连接入(公网):非华为云主机,使用直连接入(公网)的方式。 代理接入:通过选择已配置代理机的代理区域,使用代理接入的方式远程安装UniAgent。 直连接入(内网)
当触发类型为事件单,状态类型有 未受理 处理中 已解决待验证 当触发类型为告警单,状态类型有 告警中 当触发类型为待办任务,状态类型有 待受理 处理中 当触发类型为问题单,状态类型有 未受理 定位出方案中 待现网实施 待验证 SLA目标 可开启SLA目标,在开启SLA之后,最多可以设置7天