检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
OS诊断插件仅支持部分操作系统,详情请见下表: 表1 OS诊断插件支持的操作系统 机器架构 操作系统(OS)类型 OS诊断插件(holmes-agent)是否支持 (Y:支持;N:不支持) X86 Huawei Cloud EulerOS Huawei Cloud EulerOS 2.0 标准版 64位(40GB)
和参与者拉入对应的群组中。 排班 按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。 参与者 在下拉列表选择参与用户。可以选择多个用户。 单击“提交”。 完成WarRoom启动。 若在拉起Warroom的时候需要同时拉起群组(群组方式支持企业微信、钉钉、飞书),需要配置以下信息:
资源管理:同步并纳管用户在云平台上使用的资源实例,构筑资源运维能力底座。 配置管理:提供应用和资源视角的管理能力,以及参数配置集中式看护、全生命周期管理的能力。 合规性管理:资源运维提供批量的补丁扫描修复能力,安全合规先行,兼顾高效。 全方位变更管理 方案评审:支持变更方案标准化(Standard
云运维中心当前仅有部分操作支持按照企业项目授权,可以参考表1创建自定义策略。 表1 支持企业项目鉴权的操作 操作 描述 coc:instance:reinstallOS 授予重装弹性云服务器操作系统的权限。 coc:instance:changeOS 授予切换弹性云服务器操作系统的权限。 coc:instance:start
成功率取值范围0~100,支持精确到小数点后一位。 跳过步骤9,执行步骤10。 设置“任务类型”。 作业:在下拉列表选择选择作业,支持自定义作业和公共作业。 作业类型的任务,当前暂不支持引用全局参数的作业任务,以及无目标实例的作业。 IAM权限委托:用户授权云运维中心执行作业所能够使用的权限范围。
执行对象:目标实例,由客户自行选择。 定时运维使用限制 单个租户最多支持创建100个定时任务。 目标实例目前仅支持弹性云服务器(ECS),裸金属服务器(BMS)和云耀FlexusL实例三种类型。 定时运维任务“状态”列为“正常”(免审批或已审批入库的)、“是否启用”列为“开启”才会自动执行脚本/作业。
不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 单击“提交”并“确定”,开始执行工单。 对于工单执行是否完成,支持以下操作:
流转规则 流转规则 租户创建的流转规则个数≤50个。 集成管理 数据记录 COC保存集成数据源的最近10次数据记录。 人员管理 人员数量 租户创建的人员个数≤50个。 排班管理 排班角色 单个排班场景下的排班角色≤10个。 账号管理 资源类型 目前支持纳管的资源类型: 弹性云服务器 ECS
对应API接口:自定义策略实际调用的API接口。 授权项:自定义策略中支持的Action,在自定义策略中的Action中写入授权项,可以实现授权项对应的权限功能。 依赖的授权项:部分Action存在对其他Action的依赖,需要将依赖的Action同时写入授权项,才能实现对应的权限功能。 IAM
请填写故障的现象。 限制长度1-1000个字符。 影响客户 请填写受影响的客户。 限制长度1-1000个字符。 影响应用 请填写应用的影响描述。 支持添加和删除影响应用。 设置“处理过程”。 表2 处理过程参数说明 参数 说明 处理过程 请填写处理过程的时间和过程描述。 支持添加和删除处理过程。
等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。 Global 流转规则 流转规则将所有接收的集成原始告警进行抑制、降噪、去重、路由分派操作,支持多监控源纵向抑制、横向收敛,
选择实例参数说明。 操作系统 目标实例的操作系统类型,当前支持Linux和Windows。 请根据目标实例的操作系统类型进行选择。 执行用户 命令的执行用户。 Windows系统ECS:默认为system,不支持修改。 Linux系统ECS:默认为root,支持手动输入其他用户作为执行用户。
自定义规则名称。 区域 可选参数。在下拉列表选择涉及的区域,支持多选。 不选择区域展示“默认”,表示不涉及区域。 应用 在下拉列表选择涉及的应用,支持多选。 事件级别 可选项“P1”、“P2”、“P3”、“P4”、“P5”。支持多选。 默认严重程度“P1”最严重,“P5”最轻微。
随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(软件Bug、方案设计
根据命名规则,自定义基线的名称。 测试基线 基线类型 参数不支持修改,账号基线的类型。 组件基线 基线账号 账号类型 参数不支持修改,账号的操作系统类型。 仅支持Linux操作系统。 Linux 账号名称 请填写账号名称。 账号名称是资源的主机账号,后续账号改密等功能依赖填写的账号名称。 root
概述 云运维中心支持对弹性云服务器 ECS、云数据库 RDS、Flexus应用服务器L实例、裸金属服务器 BMS等多种资源进行批量操作,具体操作包含批量开机、批量关机、批量重启、重装操作系统以及切换操作系统等场景。 支持场景 表1 资源运维支持的资源和场景 资源类型 批量开机 批量关机
当前应用韧性评估中,只支持对部分云服务的资源进行评估,若应用中存在不支持的云服务资源,则默认忽略对该云服务的资源进行评估。详情如表1所示。 3. 当前应用韧性评估中,只支持对部分区域内的云服务资源进行评估,若存在其他区域的云服务资源,则会评估失败。详情如表1所示。 表1 应用韧性评估支持的云服务和支持区域
右侧时间轴内的告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。 单击应用拓扑右侧“变更”。 查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。 单击应用拓扑右侧“故障诊断”。 查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。
不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 成功率取值范围0~100,支持精确到小数点后一位。 是否关机:勾选“立即关机”,工单开始执行时会自动将未关机的实例关机。 设置“登录凭证”。
默认有1个攻击任务组,单击“添加新的任务组”可添加新的任务组。添加攻击任务后继续单击“添加一个新的攻击任务”,可添加新的攻击任务。 1.任务组间的任务为串行执行,任务组内的任务为并行执行。 2.当前不支持一个任务组内对同一个资源的多次故障注入。 设置“添加新的攻击任务”。 若需要添加已有任务,