检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
公共作业是由云运维中心提供几种常见运维场景的解决方案,作业详情所有用户可见,公共作业不支持用户的增加、修改和删除。 自定义作业 自定义作业是由用户自定义创建并管理,作业包含自定义脚本、API、流程控制等,支持全局参数和关联参数仓库。 单个租户账号下所有子账号最多支持创建200个作业。 父主题: 作业管理
UniAgent的全称是统一数据采集Agent,主要是作为云服务运维系统的底座, 提供中间件指标采集、自定义指标采集能力和脚本下发执行通道。本章介绍UniAgent的安装、重装、升级、卸载和状态同步操作,安装完成后您可以通过UniAgent对资源执行自动化运维。 注意事项 当前只有弹性云服务器ECS的实例支持UniAgent的操作。
添加排班人员 前提条件 设置排班人员前,您需要在人员管理中完善您的人员列表,并且需要创建完成排班场景和对应的排班角色。 操作场景 不同排班方式和排班维度添加排班人员会有所不同,具体介绍如下。 排班类型 固定班次 轮班(周一 -- 周日) 全局排班 全局排班+固定班次场景添加排班人员
应用之间的关系,管理范围包含华为云、友商云(当前支持阿里云、AWS)核心资源和IDC离线资源,为混沌演练、变更管控、账号管理等功能提供统一可靠的资源分组信息。 应用的结构类型根据复杂程度分为轻量级应用和大型应用。 轻量级应用:层级少,架构简单。 轻量级应用的结构类型:应用 > 组件
演练报告有哪些内容? 演练报告包括演练过程的基本信息、服务恢复能力评分和复盘改进措施,并且能够生成复盘改进工单,确保演练中发现的问题能够落实改进。 父主题: 韧性中心常见问题
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点进行分
查看审计日志 支持审计的COC操作 通过云审计服务,您可以记录与云运维中心服务相关的操作事件,便于日后的查询、审计和回溯。支持审计的关键操作如表1所示。 表1 支持审计的关键操作列表 操作名称 资源类型 事件名称 创建warroom WarRoom createWarRoom 创建起会规则
您可以通过演练规划对故障模式进行排期,创建演练规划可以指定执行人和计划演练时间,执行人通过接单来创建演练任务,演练任务关联故障模式和区域。 注意事项 演练规划所属的企业项目无需指定,和其关联的故障模式的企业项目保持一致。 创建演练规划 登录云运维中心。 在左侧导航栏选择“韧性中心 > 混沌演练”。
攻击场景说明 操作场景 混沌演练现在支持多种攻击场景供用户演练使用,包括体验类、主机资源、主机进程、主机网络、自定义故障和资源运维。通过集成武器模块和功能,用户可以更准确地模拟真实环境故障,及早发现系统可用性等问题,持续提升应用韧性。 攻击场景说明 表1 攻击场景说明 攻击目标来源
自动化预案:可以通过脚本和作业进行故障恢复的预案。 文档预案:需要通过人工按步骤执行恢复动作进行故障恢复的预案。 处理方式:可选项“脚本”、“作业”,文档预案还可以选择“不涉及”。 脚本:在下拉列表选择选择脚本,支持自定义脚本和公共脚本。 作业:在下拉列表选择选择作业,支持自定义作业和公共作业。
处理待办 操作场景 待办任务创建成功后,责任人可以在待办中心受理和闭环待办任务。 注意事项 用户只能处理责任人或创建人为自己的待办。 受理待办 登录云运维中心。 在左侧导航栏选择“任务管理 > 待办中心”。 单击左上方“待处理的”。 选择待受理的待办,单击待办名称。 单击右上方“受理”。
COC服务提供了3级可靠性架构,通过AZ内(Availability Zone,可用区)实例容灾、多AZ容灾、数据定期备份技术方案,保障服务的持久性和可靠性。 表1 COC服务可靠性架构 可靠性方案 简要说明 AZ内实例容灾 单AZ内,COC实例通过多实例方式实现实例容灾,快速剔除故障节点,保障COC实例持续提供服务。
人员管理 操作场景 人员管理统计了当前华为云账号下的用户和基础信息,通过人员管理功能您可以对用户信息进行修改,比如修改联系方式和设置通知方式等,具体操作如下。 添加人员 登录云运维中心。 在左侧导航栏选择“基础配置 > 人员管理”。 单击右上方“同步人员”。 修改人员信息 登录云运维中心。
补丁基线拥有弹性云服务器(ECS)、云容器引擎(CCE)和裸金属服务器(BMS)三种使用场景,用户可以根据具体使用场景,创建合适的补丁基线。 云运维中心提供了各操作系统的公共补丁基线作为初始ECS和BMS场景默认补丁基线,如需使用CCE场景下补丁基线功能请手动创建。 注意事项 公共基线不支持修改和删除。 创建补丁基线
自定义脚本参数值需要满足如下规则: 参数值长度为1-1024位。 可以包含大写字母、小写字母、数字以及特殊字符(_-/.*?:",=+@\[{]})和空格。 禁止出现连续‘.’。 父主题: 自动化运维常见问题
云运维中心COC的SLA管理功能为客户提供了工单时效管理能力,当工单触发某SLA规则时,COC会记录工单SLA触发详情,并通知客户及时跟进和处理。 SLA功能概要如下: 支持客户自定义SLA,或使用COC预置的公共SLA规则。 支持事件单/告警单/待办任务/问题单4类工单。 支持
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询服务的终端节点。 父主题: 使用前必读
创建变更单 操作场景 应用涉及变更事项,可通过创建变更单记录变更的范围和变更方案,变更方案支持上传详细的变更方案或通过作业实现变更。 前提条件 需要先在应用管理中创建您的应用。 需要在排班管理创建变更审批人的排班。 注意事项 确认变更单内容,按实际变更需求申请变更单。 创建变更单
单击“添加标签”。 输入标签的键和值时,系统会自动联想当前用户所有关联的预定义标签。 标签的键允许包含任意语种字母、数字、空格和_ . : = + - @特殊字符,但首尾不能含有空格,不能以_sys_开头,限制长度最长128个字符。 标签的值允许包含任意语种字母、数字、空格和_ . : / =
公共预案 操作场景 公共预案是云运维中心提供的预定义预案,用户对公共预案具有只读和使用权限,应急预案提供基础的公共预案列表。公共预案可以通过克隆,从而创建自定义预案。 查看公共预案详情 登录云运维中心。 在左侧菜单栏选择“韧性中心 > 应急预案”。 单击左上方“公共预案”。 选择需要查看的公共预案,单击应急预案名称。