检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问题发生时间:非必填,填写当前问题发生的时间 问题应用:必填,选择该问题的归属应用 问题级别:必填,选择问题级别,当前包含致命,严重,一般和提示 问题类型:必填,选择问题的类型 责任人:必填,选择责任人后该问题会流转至对应的责任人名下。当前支持排班和个人,若需设置排班,参考排班管理 问题管理若需要收到通
以中文字符、英文字母、数字开头 不能以“.”结尾 待办描述 必选参数。 可输入中文字符、英文字母、数字及特殊字符,长度不超过1000字符 类型 必选参数。 待办类型,可以选择: 计划事件 风险预警 其他 重要性 必选参数。 待办的重要性,可以选择: 紧急 重要 次要 提示 责任人 必选参数。
在下拉列表中选择企业项目。 参数描述 - 可选参数。对输入参数进行描述。 参数类型 普通文本 可选项“普通文本”、“加密文本”。 加密方式 KMS 仅参数类型选择加密文本时涉及。 不支持修改,当前仅支持KMS加密方式。 选择密钥 - 仅参数类型选择加密文本时需要设置。 在下拉框选择密钥。 密钥统一由数
选择时间周期内,所有变更单的数量 天/月 个 服务SLO SLO管理 统计服务SLO实际值的变化趋势 SLO实际值 = 1 - (服务不可用时长 / 云服务总时长)*100% 天/月 百分比 风险冒泡 变更导致故障数 事件管理 统计变更问题引发事件单数量 事件类型为变更操作问题的事件单数量 天/月
ReadOnlyAccess 统一身份认证服务的只读权限 全局服务 [全局] 人员管理中读取IAM账户下的人员信息 RMS ReadOnlyAccess 资源管理服务只读权限 全局服务 [全局] 资源管理中同步纳管云服务资源 DCS UserAccess 分布式缓存服务普通用户权限(无实例创建、修改、删除、扩缩容)
自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“参数中心”,进入“参数中心”页面。 选择需要查看的参数,单击参数名称,进入“参数详情”页面。 若参数类型为加密文本:单击参数值旁边查看敏感参数值,单击“查看解密数据”查看所有版本的参数值。 父主题: 参数中心
用户下发了执行脚本的任务,系统生成对应的脚本工单。 操作场景 通过云运维中心查看脚本工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“脚本工单”页签。 图1 选择脚本工单 选择一个状态为“异常”的脚本工单,单击对应的“脚本名称”,进入“脚本工单详情”页面。 图2
问题历史记录 操作场景 问题回溯过程对处理问题或者填写问题单相关信息有疑问,可以查询历史记录。 操作步骤 登录COC。 在左侧菜单栏选择“故障管理 > 问题管理”,进入全部问题列表页面。 点击问题单名称进入问题详情页面,单击“历史记录”页签查看问题处理历史记录。 图1 问题处理记录
操作场景 通过Cloud Operations Center查看作业工单。 操作步骤 登录COC。 在左侧导航栏选择“任务管理 > 执行记录”页面,选择“作业工单”页签。可对作业工单进行“克隆操作”和“ 编辑标签”。 克隆:单击“克隆”,将跳转至执行作业,可按照执行自定义作业中的操作步骤再次执行该作业。
服务韧性 COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容
定时任务执行记录 操作场景 您可以在定时运维页面查看定时任务的执行历史记录,历史记录呈现脚本工单/作业工单,支持跳转查看每一个工单详情。 查看定时任务执行记录 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“定时运维”,进入“定时运维”页面。
EulerOS 2.2 EulerOS 2.5 EulerOS 2.8 EulerOS 2.9 EulerOS 2.10 表2 补丁管理依赖 依赖类型 依赖项 Python环境 Python(Python2或Python3) dnf软件包(Huawei Cloud EulerOS2.0、CentOS8
待办任务大盘,可以查看待办任务处理情况、历史待办任务统计,以及全量待办任务概览。支持用户手动创建待办任务。 Global 执行记录 在执行记录中,可查询补丁、脚本、作业、ECS操作等任务的工单记录,支持查看工单详情。 Global 人员管理 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管
应急预案所属的企业项目,默认为default 所属应用 预案所属的应用 恢复时长 预期的故障恢复时长 版本号 版本号 摘要 描述应急预案主要信息 填写故障处理,应急预案类型可以选择“自动化预案”和“文档预案”。 若选择“自动化预案”,处理方式可以选择“脚本”和“作业”。 图3 故障处理 若选择脚本为处理方式,
事件流程 支持事件级别、事件类别、事件降级和事件暂停的审批配置 事件级别 事件类别 事件审批 父主题: 流程管理
概述 随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(
事件相关枚举信息 事件级别 事件类别 事件来源 事件状态 父主题: 事件管理
自动化运维”,进入“自动化运维”页面。 在“日常运维”模块单击“补丁管理”,进入“补丁管理”页面。 在“补丁扫描”页签,选择需要修复实例的资源类型。 选择需要修复的实例,单击操作列“修复”,进入“补丁修复”页面。 设置“补丁修复”。 执行用户:默认“root”,不可更改。 超时时间:用于限制扫描允许执行的最长时间。
任务管理 执行记录 待办中心
SLO管理 查看SLO SLO指标配置 SLO中断记录 父主题: 基础配置