检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
标实例,单击“提交”。 图6 选择目标实例 选择“分批策略”: 自动分批:用户选择的待执行机器,会根据默认规则,分成多批。 手动分批:用户可以根据自身需要,将待执行的机器,分成若干批,控制机器所在的批次。 不分批:用户所有待执行的机器会全部在同一批次。 图7 选择分批策略 单击“
选择应用拓扑右侧“故障诊断”页签,点击“创建诊断”按钮后,可以对应用的dcs、rds、dms资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。 图8 创建诊断 诊断完成后,点击诊断结果列表中的“查看详情”按钮,可以查看诊断报告。 图9 诊断报告 父主题: 处理事件
则进行信息匹配,解析出需要通知的人员、内容和发送通知的渠道,进行发送通知信息,实现了自动通知的功能。 事件和变更的通知模板为系统内置的,您可以根据您的场景选择通知模板。 创建通知 创建通知规则,事件单、问题单和变更单触发对应场景后会自动发送通知。 登录COC。 在左侧导航栏选择“基础配置
自定义脚本、公共脚本的能力。通过该功能,用户可以通过自定义脚本或公共脚本在目标实例(目前支持ECS)上执行操作。 Global 作业管理 提供用户自定义作业的创建、修改、删除以及在目标虚拟机上执行自定义作业的能力。通过该功能,用户可以通过自定义作业在目标实例(目前支持ECS)上执行操作。
填写资源相关信息,确认信息无误后上传。 图2 导入托管帐号 1、导入形式的ECS资源帐号密码不参与纳管改密,若想对导入的帐号进行自动纳管,可以编辑全局基线或者创建帐号基线来添加对应帐号,则系统会对这些主机帐号密码进行立即纳管。 2、导入形式的DCS、RDS和DMS资源不参与纳管改密,帐号密码无法完成自动纳管改密。
确定”完成创建。 图2 设置策略内容-1 图3 设置策略内容-2 图4 设置策略内容-3 云运维中心当前仅有部分操作支持按照企业项目授权,可以参考表1创建自定义策略。 表1 支持企业项目鉴权的操作 操作 描述 coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。
维管理中已配置的仪表盘可以在云运维中心中进行展示。故障管理中,支持接入应用运维管理服务产生的告警,并在云运维中心中进行流转处理。混沌演练中,支持在演练过程中查看应用运维管理的指标数据。 应用监控 接入应用运维管理告警 演练监控 弹性云服务器 资源运维中,可以对弹性云服务器进行批量
在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签。 单击“创建演练任务”,进入创建演练任务页面,也可以通过演练规划接单功能进入创建演练任务页面,具体步骤可以参考演练规划章节。 图1 创建演练任务 填写演练任务基本信息,包括演练任务名称和期望恢复时长,单位为分钟。 期望
ame(第一个*代表所有regionID,第二个*所有租户,name代表参数名称) 资源类权限决定您可以访问哪些数据,操作类权限是对您有的资源类权限进行操作,常见问题: 如果您可以访问某个参数,但是您访问不了列表页,代表您缺少coc:parameter:list权限 如果您找不到指定的参数,需要确认是否有该参数的权限
自定义脚本”。若已有自定义故障脚本,则可以选择已有的;若之前没有创建过自定义故障脚本,则需要创建脚本。 图2 选择攻击场景为自定义故障 创建自定义故障脚本,可以单击“脚本管理”,会跳转到“自动化运维 > 脚本管理 > 自定义脚本”中。创建脚本的具体步骤可以参考创建自定义脚本章节。脚本规范请参考如下代码。
> 排班管理”页面,单击右上角的“创建排班”。 图1 排班管理页面 进入“创建排班”页面,可以填写排班场景信息,并添加排班角色后单击“提交”。若已有排班场景和排班角色,在“创建排班”页面中可以选择已有场景,并可查看某个场景下的角色。 图2 创建排班页面 场景名称:排班场景的名称。
补丁基线。用户可以自定义补丁安装规则、补丁的合规性级别、补丁例外。 使用补丁管理包含以下步骤: 创建补丁基线,基于操作系统及对应的补丁扫描基线。 补丁扫描,基于扫描基线对资源进行补丁扫描。 查看摘要,扫描完成后可以查看资源的扫描合规性。 补丁修复,不合规的资源可以执行批量修复。
跨账号管理概述 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力,如果您的账号由组织管理,您可以在云运维中心对组织内所有成员账号进行统一的资源管理、自动化运维以及运维态势感知,而无需逐个登录到成员账号。 通过COC对组织成员账号进行跨账号管理需要执行以下操作(以A账号管理B账号为例):
、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计不足之处、故障恢复流程卡点等),及早发现系统可用性的问题进行解决,持续提升应用韧性,
操作场景 通过Cloud Operations Center查看应用运维管理中仪表盘信息。 操作步骤 登录COC。 进入COC“总览”后,可以查看应用监控信息。 单击“ 自定义看板”设置需要监控的应用。 图1 应用监控信息 父主题: 总览
登录COC。 在左侧导航栏选择“故障管理 > 集成管理”,进入“集成管理”页面。 在集成管理配置页面单击接入源上的“启用/禁用”可以对接入源进行启用或者禁用操作。也可以单击接入源,进入接入源详情后,单击底部的“启用”、“禁用”按钮进行启用或者禁用操作。 更新集成标识操作步骤 登录COC。
登录COC。 左侧菜单栏选择“故障管理 > 告警管理”,选择“原始告警”页签,查看原始告警列表,页面默认显示一个月的告警信息。 单击击告警列表前可以查看告警其他信息。 图1 原始告警 父主题: 告警管理
汇聚告警 登录COC。 在左侧菜单栏单击“故障管理 > 告警管理”,可以查看汇聚告警或原始告警列表信息。 在汇聚告警搜索框中输入告警单号、集成告警名称,“回车”进行搜索。 汇聚告警包含当前告警和历史告警。 图1 告警列表 处理告警 告警转事件 清除告警 历史告警 父主题: 告警管理
根据您选择的班次数量N,将在一天中生成N个时间段,您需要在N个时间段内分别设置每个角色对应的责任人。 责任人可以选择多个。 排班创建好后,在“排班”页面,选择排班场景和时间段,可以查看排班中的人员。 应用排班+固定班次场景 使用场景:适用不同应用,排班人员是全天固定的。 前置条件:“
操作场景 通过Cloud Operations Center创建、跟踪、闭环运维待办事项。 操作步骤 登录COC。 进入COC“总览”后,左上角可以查询到待处理事件、待处理告警、我的待办的统计数量。 图1 统计数量 单击“创建待办”,可创建对应的待办。 图2 创建待办 单击“创建事件”,可创建对应的事件。