检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
若分析还有其他应用受影响,使用新增影响应用增加。 通过应用诊断可以快速定位故障根因,使用执行预案能够快捷处理故障。处理完成后需要修改应用状态为“已恢复”。 故障已恢复:检查故障处理结果和应用状态。 注意:将所有应用状态修改为已恢复状态才能走到故障已恢复阶段。 使用应用诊断检查故
概述 您可以通过云运维中心的应用管理功能对资源进行分组管理,管理云服务对象与应用之间的关系,管理范围包含华为云、友商云(当前支持阿里云、AWS)核心资源和IDC离线资源,为混沌演练、变更管控、账号管理等功能提供统一可靠的资源分组信息。 应用的结构类型根据复杂程度分为轻量级应用和大型应用。
补丁基线中安装规则基线与自定义基线的区别? 安装规则基线提供了用户能够根据补丁包的基本信息进行基线筛选的能力,使用安装规则基线修复会将不合规的补丁升级为最新版本。 自定义基线提供了用户能自定义补丁包名称以及版本进行基线筛选的能力,使用自定义基线修复将会将不合规的补丁升级到自定义指定版本。 父主题: 补丁管理常见问题
定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。 执行对象:目标实例,由客户自行选择。 定时运维使用限制 单个租户最多支持创建100个定时任务。 目标实例目前仅支持弹性云服务器(ECS),裸金属服务器(BMS)和云耀FlexusL实例三种类型。
变更场景 使用场景 变更管理中系统默认的变更场景字段和实际业务使用过程中有差异,支持修改变更场景枚举值。 操作步骤 登录COC。 在左侧导航栏选择“基础配置 > 流程管理”页面,单击页面变更<br>场景,当前页面显示的为系统预置的问题类型,不支持编辑和删除。 图1 变更场景 若不
添加备注 使用场景 事件处理过程,若存在事件需要添加额外的备注信息,可使用添加备注的功能。 前提条件 事件受理后才能添加备注。 添加备注 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“... >
创建参数 操作场景 您可以使用创建参数功能来保存数据,例如账号、密钥、普通文本等数据,可以被脚本、作业等操作引用,支持文本参数和加密数据的全生命周期管理。 注意事项 参数策略涉及到参数的删除,配置时请谨慎使用。 创建参数 登录云运维中心。 在左侧导航栏选择“资源管理 > 自动化运维”。
每次变更产品的Terraform或Json模板,会产生一个新的产品版本。 产品组合 产品组合由一个或多个产品构成,是管理产品的方式。 实例 实例是终端用户使用服务目录创建的云资源,可以是单个云资源(例如:一台ECS),也可以是多个云资源(例如:多台ECS、一个数据库、一个VPC等)的组合。 授权
全局排班+固定班次场景添加排班人员 全局排班+轮班场景添加排班人员 应用排班 应用排班+固定班次场景添加排班人员 应用排班+轮班场景添加排班人员 全局排班+固定班次场景 使用场景:适用所有应用,排班人员是全天固定。 登录COC。 在左侧导航栏选择“基础配置 > 排班管理”页面,选择已创建的排班场景(排班场景名称
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
为快速恢复业务的运作机制,支撑运维、研发、运营联合作战,保障业务快速恢复而组建的会议。已受理的事件可以启动Warroom,具体参考启动WarRoom。 Warroom使用指导,请参考WarRoom管理。 父主题: 故障管理常见问题
管理跨账号资源 操作场景 云运维中心服务具备安全可靠的跨账号数据汇聚和资源运维能力。当您的账号是企业级账号,且为组织(organizations云服务中设置)中的管理员或者COC云服务的委托管理员时,你可以对组织内其它账号下的资源进行统一的自动化运维操作,避免多账号操作导致的人力
驳回事件 操作场景 事件创建后,若事件不合理或其他原因事件处理人可驳回事件,驳回后事件创单人可重新编辑提交或闭环。 驳回事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“驳回”。 填写驳回原因,单击“确定”。
执行用户 命令的执行用户。 Windows系统ECS:默认为system,不支持修改。 Linux系统ECS:默认为root,支持手动输入其他用户作为执行用户。 执行计划 命令的执行计划,默认为“立即执行”。 超时时间 单次命令执行的超时时间,超时后会强制终止发送进程。 范围:6~1800秒(24小时)。
示例 攻击类型 根据攻击场景的类型区分。 主机资源 攻击场景 根据命名规则,自定义攻击任务的名称。 CPU使用率加压 攻击参数 根据不同的攻击场景,配置相应的攻击参数。 CPU使用率(百分比):80 故障持续时长(秒):60 单击“下一步”。 (可选)设置“监控任务配置”。 表4 监控任务配置参数说明
优化顾问 操作场景 您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。
改进管理指在处理事件、WarRoom或进行演练过程发现产品、运维或管理方面需要改进完善的地方,通过改进单的方式跟踪闭环。 Global 问题管理 问题管理是在使用软件产品过程中,发现产品功能缺陷、性能差等问题,记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整
如何通过企业项目进行权限控制 问题描述 如何通过企业项目进行云运维中心的权限控制。 解决方法 管理员登录IAM控制台。 管理员在权限管理-权限中,单击“创建自定义策略”。 图1 创建自定义策略 设置策略内容,选择允许“云服务操作中心”,并选择要进行企业项目鉴权的操作。单击“确定”完成创建。
转发事件 操作场景 事件单处理过程发现该事件属于其他应用,或运维专家处理,可转发事件单给对应的责任人。 转发事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“转发责任人”。 设置“转发责任人”。
撤销问题 操作场景 问题单创建后,发现提交的问题属于非问题或其他原因问题处理人可撤销问题单。撤销问题单前需要先驳回问题,已受理的问题单不可撤销。 撤销问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“撤销”。