检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
资源运维常见问题 补丁管理常见问题 自动化运维常见问题 批量操作常见问题 参数管理常见问题 资源运维权限和授权项说明
SLO管理 SLO(服务等级目标,Service Level Object),SLO管理目前对接Warroom、故障、告警等功能,自动化地完成SLO的计算,为SLO看板大屏提供数据。 查看SLO SLO指标配置 SLO中断记录 父主题: 基础配置
ReadOnlyAccess),表示“COC ReadOnlyAccess”已生效。 登录云运维中心COC后,在左侧导航栏选择“任务管理 > 待办中心”,单击右上角“ 创建待办”,尝试创建待办任务,如果创建待办任务成功(假设当前权限仅包含COC FullAccess),表示“COC FullAccess”已生效。
应用管理 应用管理,即为管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。 创建应用 修改应用 删除应用 编辑应用拓扑 创建组件 修改组件 删除组件 创建分组 修改分组 删除分组 手动关联资源 智能关联资源 转移资源 解除关联资源 执行UniAgent操作
安装UniAgent页面 根据页面的运行安装命令进行手动安装UniAgent。 图3 “手动安装UniAgent”页面 UniAgent安装完成后,单击 “返回自动安装”。 单击“设置安装机”,设置刚才完成UniAgent安装的机器为安装机。 图4 设置安装机 在弹框中填写设置安装机相关信息,单击“确认”。
/v1/external/incident/{incident_num} 表1 路径参数 参数 是否必选 参数类型 描述 incident_num 是 String 事件单号 最小长度:0 最大长度:255 请求参数 无 响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 provider_code
更”,问题单会走到待现网实施阶段。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“现网实施”,跳转现网实施页面,系统会默认带出涉及的区域,填写区域对应的变更单后,系统会获取变更结果
图1 创建变更单 填写变更单基本信息和变更配置。 图2 填写变更单基本信息 填写变更方式,支持选择作业或上传变更指导书,作业执行可参考自动化运维。 图3 填写变更方式 1、变更类型 常规变更(指非紧急、能通过正常程序化的申请、评估、批准、排序、计划、测试、实施和回顾的变更);
服务韧性 COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容
arRoom中的影响应用。 操作步骤 登录COC。 左侧菜单栏选择“故障管理 > WarRoom”,可以查看WarRoom列表信息。 单击WarRoom列表中WarRoom名称,进入对应的“WarRoom详情”页面。 在“故障影响”模块,单击“新增影响应用”,弹出“新增影响应用”页面。
在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“升降级”,页面会显示问题挂起弹窗页面,并填写挂起信息。 图1 问题升降级 当前升降级暂不需要审批,填写后问题单级别会变更。 父主题: 处理问题
在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“验证”,跳转验证详情,填写信息后点击提交。 图1 问题单验证页面 验证通过后问题单闭环;验证未通过问题状态会走到定位出方案中。 父主题: 处理问题
驳回问题 操作场景 若创建人提交的问题属于非问题可驳回问题单,驳回会创建人可重新编辑提交或直接闭环。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入“待我处理”的问题列表页面。 点击问题单名称进入问题详情页面,单击右上角“驳回”,创单人可对问题单重编辑后提交或撤回关闭。
变更风控&作业可信 融合华为SRE安全生产最佳实践的管控模型,助力客户作业可信和稳定可靠。 全方位作业可信:构筑人员风险评估、高危命令拦截和自动化稽查能力,从事前、事中、事后逐层拦截变更风险,实现全方位运维作业可信。 AI加持风险评估:通过高危命令智能拦截算法,AI加持消减作业风险。
0到1构建运维驾驶舱。 运维总览 资源总览 运维沙盘 人员与排班 人员管理 排班管理 资源管理与运维 资源管理 应用管理 补丁扫描与修复 自动化运维 脚本管理 作业模板与执行 定时运维 故障管理 配置和应用流转规则 标准化事件管理流程 集成告警 WarRoom机制 可用性分析 混沌演练
图6 PRR模板列表 在“模板名称”列单击对应的“模板名称”,进入“PRR模板详情”页面。 图7 PRR模板详情 编辑PRR模板 登录COC。 在左侧菜单栏选择“韧性中心 > PRR评审”页面,单击“PRR模板管理”,进入“PRR模板管理”页面。 图8 PRR模板列表 在“操作”列单击对应的
COC部署时不区分物理区域,为全局级服务。授权时,在全局级服务中设置权限,访问COC时,不需要切换区域。 如表2所示,包括了COC的所有系统权限。基于角色授权场景的系统策略与基于策略授权场景的并不互通。 表2 COC系统权限 系统角色/策略名称 描述 类别 依赖关系 COC ReadOnlyAccess
功能介绍 支持租户将自开发的监控系统按照标准化集成至COC,集成后告警会按照标准格式上报至COC告警中心 URI POST /v1/event/huawei/custom/{integration_key} 表1 路径参数 参数 是否必选 参数类型 描述 integration_key