检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
故障定界和恢复:分析故障影响范围,恢复所有受影响应用。 若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。 故障已恢复:检查故障处理结果和应用状态。 注意:将所有应用状态修改为已恢复状态才能走到故障已恢复阶段。
应急预案参数说明 参数名 参数说明 应急预案名称 用户自定义此次演练的应急预案名 所属应用 演练目标主机或容器的所属应用 应急预案概述 描述应急预案主要信息 应急预案附件 针对演练异常情况的紧急恢复指导书 演练过程中可能出现不可预料的异常情况,用户须提前准备好应急措施,准备好紧急恢复指导书,
在执行记录中,可查询补丁、脚本、作业、ECS操作等任务的工单记录,支持查看工单详情。 Global 人员管理 人员管理为云运维中心提供了统一的人员数据管理。您可以在人员管理页面管理当前租户下的用户,人员管理中的用户从统一身份认证(IAM)同步,人员管理页面的数据作为云运维中心的用户基
CMDB资源视角:以资源视角选择实例列表。 CMDB应用视角:以应用视角选择实例列表。 CMDB资源视角 资源类型 默认参数,不支持修改。 ECS 区域 在下拉列表中选择区域。 华北-北京一 目标实例 在筛选框设置条件,选择筛选出的实例。 - 勾选“同意安装插件并采集数据《GuestOS诊断服务前端数据授权》”,单击“同意”。
接入其他云厂商 操作场景 云运维中心支持对友商云账号进行配置,同步友商云资源,当前已支持的友商云有:阿里云、AWS。当您需要通过云运维中心管理其他友商云资源时,请按如下操作进行。 注意事项 当前支持创建阿里云、AWS账号。 新增账号后,需要同步资源,同步当前账号下现有资源。 已有账号的资源产生变化,需要重新同步资源。
COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 您可以在快速配置中心完成云运维中心配置和云服务配置: 云运维中心配置:涵盖资源应用管理、自动化运维、故障管理、变更管理、混沌演练5个场景的配置任务,
操作场景 WarRoom启动后,在处理故障过程中需查看、更新WarRoom状态,便于记录故障恢复的时间节点,同时了解故障当前的进展。WarRoom状态包含启动WarRoom、故障定界和恢复、故障已恢复和关闭。 WarRoom状态 登录云运维中心。 在左侧导航栏选择“故障管理 > WarRoom”。
全局排班:排班不考虑您创建的应用,即设置的排班与应用无关。 应用排班:排班需按照应用,Region(可选)创建,不同应用排班不同。 提交后会跳转至排班完成页面,单击“排班人员”。不同排班方式会和排班维度组合添加人员的方式不同,具体操作请参考添加排班人员。 父主题: 排班管理
填写需安装UniAgent主机的详细信息。 主机IP:主机的IP。 操作系统:主机的操作系统,Linux或Windows。 登录账号:登录主机的账号。当操作系统为Linux时,建议使用root账号,可保证有足够的读写权限。 登录端口:访问主机的端口。 认证方式:认证方式为密码。 密码:登录主机的密码。
登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。 在“日常运维”模块单击“账号管理”。 选择“资源视角”或“应用视角”管理主机。 资源视角针对购买的所有主机实例。 应用视角针对购买的并已绑定应用的主机。若选择应用视角需要选择目标应用或组件。 选择需要查看的资源类型。
图2 “应用结构类型”参数配置 表1 “应用结构类型”参数说明 参数 示例 说明 应用结构类型 轻量级应用 请根据应用结构的复杂类型选择。 设置“应用结构配置”。 图3 “应用结构配置”参数配置 表2 “应用结构配置”参数说明 参数 示例 说明 应用名称 test-application
转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。
概述 云运维中心支持脚本管理功能。您可以通过执行脚本,完成复杂或重复的自动化任务。脚本管理可以对脚本进行高危检测,也支持Windows和Linux操作系统,当前脚本支持弹性云服务器 ECS、裸金属服务器 BMS、Flexus应用服务器L实例三种云资源。 自定义脚本 自定义脚本是由
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
操作场景 云运维中心支持通过账号管理免密登录主机(当前仅支持ECS的linux主机)。可以通过免密登录选择账号进入命令执行页面,账号来源于账号基线中配置的账号且OS主机存在的账号。 注意事项 主机可以成功远程登录的前提条件。 安装UniAgent且UniAgent的状态为运行中并UniAgent的版本需要大于1
单次最多可安装100台UniAgent主机。 应用管理 应用 租户创建的应用层级≤5层。 补丁管理 补丁基线 租户创建的补丁基线个数≤50个(不计入公共基线)。 脚本管理 脚本内容 自定义脚本内容≤4096字节。 作业管理 全局参数 单个自定义作业的全局参数≤30个。 Warroom 起会规则 租户创建的Warroom起会规则个数≤50个。
发起PRR评审的基本参数表 参数名称 说明 PRR评审名称 PRR评审的名称 PRR评审描述 PRR评审的描述 应用名称 PRR评审所属的应用名称 应用责任人 PRR评审所属的应用的责任人 应用介绍 PRR评审所属的应用的介绍信息 应用分类 PRR评审所属的应用的类别信息 评审阶段
Service,TMS)用于用户在云平台通过统一的标签管理各种资源。TMS服务与各服务共同实现标签管理能力,TMS提供全局标签管理能力,各服务维护自身标签管理 。当您的云资源较多时,可以通过标签管理服务管理账户下的云资源。 建议您先在TMS系统中设置预定义标签。 标签由“键”和“值”组成,每个标签中的一个“键”只能对应一个“值”。
单击搜索框,弹出搜索条件列表中选择对应的搜索条件,输入对应的值,单击“回车”即可搜索数据。搜索框后的图标依次支持:刷新列表数据、设置列表展示字段。 图2 筛选SLA规则 单击列表中的“SLA名称”,跳转到“SLA详情”页面。 图3 查看SLA详情 系统做了租户隔离,仅能查看当前租户账号及其子账号创建的自定义SLA。
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。