检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
可选项“应急预案”、“脚本”、“作业”。 自动执行 勾选是否自动执行。自动化预案、脚本、作业支持自动执行。 勾选“自动执行”后,显示“参数映射”,系统根据上方的触发条件及设置自动执行。 参数值、Region ID、和目标实例填写格式为${},需要通过该表达式解析对应的值,详细请参考自动化执行参数示例说明。
资源类型 可选项“ECS”、“BMS”。 ECS 区域 在下拉列表中选择区域。 华北-北京一 目标实例 在筛选框设置条件,选择筛选出的实例。 - 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。
在筛选框设置条件,选择筛选出的实例。 - 设置“分批策略”、“熔断策略”和“是否关机”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。
补丁工单日志中出现all mirrors were tried异常如何处理? 一般由网络原因引发,确认机器网络是否能和机器上所配置的补丁源联通,或机器网络是否出现异常。 父主题: 补丁管理常见问题
HTTP方法 方法 说明 GET 请求服务器返回指定资源。 PUT 请求服务器更新指定资源。 POST 请求服务器新增资源或执行特殊操作。 DELETE 请求服务器删除指定资源,如删除对象等。 HEAD 请求服务器资源头部。 PATCH 请求服务器更新资源的部分内容。 当资源不存在的
事件创建后,若事件不合理或其他原因事件处理人可驳回事件,驳回后事件创单人可重新编辑提交或闭环。 驳回事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“驳回”。 填写驳回原因,单击“确定”。 父主题:
华北-北京一 目标实例 在筛选框设置条件,手动选择或自动全选筛选出的实例。 - 设置“分批策略”和“熔断策略”。 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要
地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 COC混沌演练目前已支持弹性云服务器(ECS)、裸金属服务器(BMS)和Flexus应用服务器L实例(FlexusL)三种探针类武器的攻击对象,并提供了相应的资源类武器和网络类武器供用户演练使用。其中
程中查看应用运维管理的指标数据。 应用监控 接入应用运维管理告警 演练监控 弹性云服务器 资源运维中,可以对弹性云服务器进行批量操作、脚本执行、作业执行、定时任务等运维操作。混沌演练中,支持对弹性云服务器进行演练任务执行。 资源运维 混沌演练 云容器引擎 混沌演练中,支持对云容器引擎进行演练任务执行。
的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。 本章节介绍如何通过云运维中心操作一台弹性云服务器ECS进行CPU使用率加压的故障演练。 操作流程 操作步骤 说明 准备工作
在验证关闭事件中填写验证结果,选择未解决可以驳回事件,驳回后需事件处理人重新定位并处理该故障。 验证事件 登录云运维中心。 在左侧导航栏选择“故障管理 > 事件管理”。 在“待处理的”页签,选择需要处理的事件单,单击事件标题。 单击右上方“验证关闭”。 设置“验证关闭”信息。 表1
问题单创建后,发现提交的问题属于非问题或其他原因问题处理人可撤销问题单。撤销问题单前需要先驳回问题,已受理的问题单不可撤销。 撤销问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“撤销”。 填写撤销原因,单击“确定”。
单个排班场景下的排班角色≤10个。 账号管理 资源类型 目前支持纳管的资源类型: 弹性云服务器 ECS 目前支持托管(账号导入)的资源类型: 弹性云服务器 ECS、分布式缓存服务 DCS、云数据库 RDS、分布式消息服务 DMS 账号基线 基线账号数量≤30个,关联的组件数量≤100个。
变更管控”页面,启用工单授权默认关闭,若需启用工单授权点击开启即可。 开启后列表显示COC的所有操作动作(即Action),支持对已对接的action进行开启或关闭。关闭表示所有账号操作该场景不用进行工单提权;开启后需要进行工单提权。 图1 变更管控列表 action开启后还需关联策略,将COC自动的策略加入到账号的用户组,即可使用工单提权
若创建人提交的问题属于非问题或其他原因可驳回问题单,驳回后创建人可重新编辑提交或撤销问题,重新提交后需问题处理人继续定位解决。 驳回问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“驳回”。 填写驳回原因,单击“确定”。
优化顾问 操作场景 您可以在云运维中心总览页快速查看资源风险项,该功能使用优化顾问OA服务,提供大量检查项能力和优化建议,例如ECS实例规格检查,资源实例或集群是否开启自动备份等。 优化顾问 登录云运维中心。 进入COC“总览”后,可以查看优化顾问信息。 单击“查看风险项”可查看TOP10风险项清单。
选择应用下的分组 在下拉列表中选择应用、组件和分组。 测试应用/测试组件/测试分组 资源类型 在下拉列表中选择云厂商、资源类型。 华为云/弹性云服务器ECS/云服务器 资源列表 请选择需要关联的资源。 - 单击“确定”。 关联至该分组下。 父主题: 应用管理
故障恢复时间不得早于创建WarRoom时间。 故障影响 可选参数。在故障已恢复阶段为必填参数。 请填写故障影响。 限制长度250个字符。 故障原因 可选参数。在故障已恢复阶段为必填参数。 请填写故障原因。 限制长度250个字符。 单击“确定”。 完成故障信息修改。 父主题: WarRoom
COC快速配置中心面向华为云全局云服务提供场景化的集中配置入口,通过最佳实践的极简配置实现多区域、多账号、定时的自动化操作,为后续运维降低操作门槛。 您可以在快速配置中心完成云运维中心配置和云服务配置: 云运维中心配置:涵盖资源应用管理、自动化运维、故障管理、变更管理、混沌演练5个场景的配置任务,您可以根据自身需要,
SLO期望值)*全年服务总时长(min); 当SLO实际值≤SLO期望值时,ErrorBudget=0; 天/月 分钟 PRR看板 PRR看板(生产就绪程度评审)中包含评审服务汇总、评估雷达分布、服务复盘、改进任务闭环情况。评审服务汇总体现投入生产前各个服务当前所处的评审阶段,以