检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
可以在这里创建定时任务,也可以管理已创建的定时任务。创建定时任务后,系统按确定时间或周期定时触发脚本执行、作业管理等操作。 定时运维包含如下几项核心要素: 定时设置:单次执行,周期执行(设置简单周期或Cron表达式)。 任务类型:脚本,作业。 执行对象:目标实例,由客户自行选择。
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。 不分批:用户所有待执行的机器会全部在同一批次。 熔断策略: 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
查看资源拓扑 操作场景 资源拓扑以图形的形式呈现,其中节点表示各种资源,连线表示资源之间的关系。为您更加直观地展示资源之间的相互关系,便于资源的使用、监控和管理。 注意事项 支持查看华为云资源的拓扑关系。 支持查看弹性云服务器(ECS)、MapReduce服务 (MRS)、裸金属服务器
记录和解决应用中存在的根本原因问题。其主要目标是降低产品/服务现网故障数量,并提高服务的整体质量促进产品或应用质量的不断完善,防止问题的再次发生。问题管理包含问题单的创建、受理、驳回、转单、处理到闭环整个生命周期管理。问题单来源主要有人工创建与北向接口创建。 问题管理同时支持配
查看资源详情 操作场景 资源列表默认展示资源的部分属性,如果您需要查看应用层级下某个资源的资源详情,可按如下操作查看。 查看资源详情 登录云运维中心。 在左侧导航栏选择“资源管理 > 应用资源管理”。 单击左上方“应用管理”。 在左侧应用栏,选择应用,选择目标实例,单击实例名称。
发生条件 故障可能发生的条件。 预计故障现象 故障发生时的业务现象。 客户影响 故障造成的客户影响。 选择是否有应急预案。如果选择是,请输入应急预案名称搜索,选择对应的应急预案,如果没有合适的应急预案 可以选择直接创建一个应急预案,单击“完成配置”即可创建故障模式。 如选择优秀故障模式可以进行克隆操作创建故障模式。
”,点击“下一步”并创建策略。 用户添加策略:进入“IAM”服务,选择“用户”,点击“添加权限”,选择“直接附加策略”,将上一步中创建的策略选上,点击“下一步”完成添加权限。 选择需要同步资源所属账号。 默认选择“我的资源”。 选择需要同步的资源类型。 默认选择“弹性云服务器ECS”。
驳回问题 操作场景 若创建人提交的问题属于非问题或其他原因可驳回问题单,驳回后创建人可重新编辑提交或撤销问题,重新提交后需问题处理人继续定位解决。 驳回问题 登录云运维中心。 在左侧导航栏选择“故障管理 > 问题管理”。 在“待我处理”页签,选择需要处理的问题单,单击问题单标题。
与其他云服务的关联 云运维中心COC服务与其他服务的关系,如图1所示。 图1 与其他服务的关系 表1 与其他服务的关系 服务名称 与其他服务的关系 主要交互功能 安全云脑 总览页面中提供用户查看到账号下的安全监控信息。从安全评分、安全监控、安全趋势三个维度呈现安全概览,并支持自定义看板。
演练规划页面 单击“创建演练规划”,选择故障模式,执行人,区域和计划演练时间 ,单击“确认”,即可完成演练规划的创建。 图2 创建演练规划 演练规划指定的执行人在演练规划列表操作项里单击“接单”,进入创建演练任务页面,演练任务关联选择的故障模式和区域。并且可以对后续的演练任务进度进行跟踪。
演练任务功能允许用户通过模拟软件或硬件故障来测试系统的恢复能力。演练任务操作包括管理混沌演练任务和查看演练记录,以及创建演练任务的流程。演练任务的设置包括基础信息、攻击任务组的添加、攻击任务的选择、攻击场景的选择等。此外,演练任务还涉及监控任务配置,以及演练后的复盘改进,确保系统
您可以对系统可能发生的故障创建自定义的应急预案,在故障发生后可以参考应急预案进行故障紧急恢复。 创建应急预案 登录COC。 在左侧菜单栏选择“韧性中心 > 应急预案”页面,选择“自定义预案”页签。 图1 自定义预案页面 单击右上角“创建应急预案”,填写应急预案基本信息。 图2 创建应急预案 表1
服务目录”。 单击“产品组合管理 > 产品组合”。 单击需要绑定产品的产品组合名称。 单击“产品”。 单击“绑定产品”。 选择需要绑定的产品。 支持多选,最多支持100个产品。若需要创建产品,详细操作请参考创建产品。 单击“确定”。 完成产品绑定。 父主题: 管理产品组合
示例 分组名称 根据命名规则,自定义分组的名称。 测试分组 资源关联方式 请选择资源关联方式。 手动关联:用户在对应分组下,手动将对应资源数据关联至分组内进行管理。 智能关联:用户通过企业项目和标签的形式,将企业项目下的相同标签资源创建至同一资源分组。 手动关联 区域 在下拉列表中选择区域。
SLO指标配置 操作场景 用户可以通过此页面进行SLO指标的创建配置、删除、编辑修改、查看操作。 指标分为请求型SLI指标和实例型SLI指标,配置完成可以在后续SLO中断记录中手动添加。 SLO指标配置 登录COC。 在左侧菜单栏选择“基础配置 > SLO管理”,进入“SLO管理”页面。
单击需要修改的WarRoom标题。 单击右上方“修改”。 设置“修改故障信息”。 表1 修改故障信息参数说明 参数 说明 区域 可选参数。在下拉列表选择故障涉及的区域,支持多选。 不选择区域展示“默认”,表示不涉及区域。 故障发生时间 请填写故障发生时间。 默认为创建WarRoo
m拉起会将排班人员和参与者拉入对应的群组中。 排班 按照已配置的排班场景和角色在下拉列表选择。配置排班详细操作请参考排班管理。 参与者 在下拉列表选择参与用户。可以选择多个用户。 单击“提交”。 完成WarRoom启动。 若在拉起Warroom的时候需要同时拉起群组(群组方式支持