正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
不分批:用户所有待执行的机器会全部在同一批次。 图5 选择分批策略 设置“熔断策略”。 熔断策略:用户可以设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。 图6 设置熔断阈值 单击“提交”执行脚本。 图7 “提交”按钮 父主题: 脚本管理
图2 查询SLA记录详情 SLA记录详情里的“SLA信息”表展示了工单的“SLA状态”与创建SLA模板时设置的SLA规则强相关,当工单的状态类型持续时间超过了SLA规则设置的时间,状态自动修改为“已打破”。 “持续时间”与工单的状态变化强相关。 父主题: SLA管理
、可自定义的人员管理模式。您可以在排班管理页面创建排班场景、排班角色,并将“人员管理”中的人员添加到“排班场景”、“排班角色”中完成排班的设置。 Global 通知管理 通知管理为用户创建通知实例,通知实例包含通知场景及匹配规则条件等,当出现一个事件单时,通知模块会启动场景匹配和
排班下场景单选,场景下角色可多选;个人可多选; 该处为设置需要通知的对象。设置为排班时,通知模块会自动获取当前排班下人的列表,给对应的人发送通知;设置为个人时,直接会给对应的人发送通知; 通知规则 / / 举例:如A规则设置了a值,若事件单中A规则对应的是a值,不考虑其他匹配规则
件。 用户已经开通组织(Organizations)或已经加入到一个组织中,可到组织的服务页面查看。 图1 组织服务 用户所在组织将COC设置为可信服务,可到组织页面的可信服务查看。 图2 可信服务 当前执行跨账号运维操作的账号是组织管理员或者是组织管理员所委派的委托管理员。 图3
补丁基线不生效? 在使用补丁管理扫描或修复功能前,请确认创建的补丁基线已经设置为默认基线并且使用场景正确。 父主题: 补丁管理常见问题
排班下场景单选,场景下角色可多选;个人可多选; 该处为设置需要通知的对象。设置为排班时,通知模块会自动获取当前排班下人的列表,给对应的人发送通知;设置为个人时,直接会给对应的人发送通知; 通知规则 / / 举例:如A规则设置了a值,若事件单中A规则对应的是a值,不考虑其他匹配规则
资源运维权限和授权项说明 如果您需要对您所拥有的COC的资源运维操作进行精细的权限管理,您可以使用统一身份认证服务(Identity and Access Management,简称IAM),如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,不影响您使用ECS服务的其它功能。
审计与日志 审计 云审计服务(Cloud Trace Service,CTS),是华为云安全解决方案中专业的日志审计服务,提供对各种云资源操作记录的收集、存储和查询功能,可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。 用户开通云审计服务并创建和配置追踪器后,CT
固定班次:对人员进行固定排班管理,直接为排班角色设置相应的人员。 轮班(周一 -- 周日):对人员进行轮班管理,可根据轮班规则,按照时间生成对应的排班 排班维度:排班的影响范围,可选择“应用排班”和“全局排班”。 全局排班:排班不考虑您创建的应用,即设置的排班与应用无关 应用排班:排班需按照应用创建,不同应用排班不同
选择需要扫描的CCE实例 设置分批策略。 分批策略: 自动分批:用户选择的待执行机器,会根据默认规则,分成多批。 手动分批:用户可以根据自身需要,将待执行的机器,分成若干批,控制机器所在的批次。 不分批:用户所有待执行的机器会全部在同一批次。 图9 选择分批策略 设置熔断策略。 熔断阈值
单击“+添加任务”,为步骤添加任务。任务添加完成后,单击“完成”。所有任务添加完成后,单击“确定”。 图11 添加任务 单击“+操作类型”,设置当前任务的操作类型,操作类型分为云服务API、控制、自定义脚本三种。 云服务API:包含ECS相关操作原子、执行API和等待API调用结果。ECS操作详见:ECS操作。
若选择高风险,入库人工审核默认开启。 设置时区,当选中单次执行时,选择单次触发定时任务的时间,当选中周期执行时,会弹出“简单周期”和“Corn表达式”选项,帮助用户自定义执行周期,该定时任务会根据用户自定义的执行周期循环执行,直到规则结束时间,如表2所示。 图5 定时设置 表2 参数说明 参数名称
查看资源详情 提供用户查看资源详情的操作。 操作场景 通过Cloud Operations Center查看已关联应用的资源详情。 操作步骤 登录COC。 在左侧菜单栏选择“资源管理 > 应用资源管理”,进入“应用资源管理”页面,选择“应用管理”页签,在“弹性云服务器ECS”模块
故障发生时间”及“故障恢复时间”。此处填写的业务中断时间计入对应应用的SLO中断记录。 图1 清除告警-业务中断 生成SLO中断记录需要先设置对应的SLA规则、SLO规则,并且该告警存在对应的SLA记录。 输入备注,单击“确定”,清除告警。 备注可以包含中文字符、英文字母、数字及特殊字符组成,长度不超过100个字符。
演练任务 操作场景 管理混沌演练任务,查看演练记录。 创建演练任务 登录COC。 在左侧菜单栏选择“韧性中心 > 混沌演练”页面,选择“演练任务”页签。 单击“创建演练任务”,进入创建演练任务页面,也可以通过演练规划接单功能进入创建演练任务页面,具体步骤可以参考演练规划章节。 图1
概述 随着传统IT基础设施运维向云服务运维方式的转变,传统的运维手段面临服务间调用复杂、应用迭代速度快、海量运维对象、复杂系统非线性等挑战。业务的停机都会给公司带来巨大的经济损失和声誉影响。 在运维过程中引入混沌工程,通过定期进行演练的方式,可以在现网问题发生前识别系统的薄弱点(
全旅程混沌工程方案 实践场景 某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对
执行自定义脚本 功能介绍 执行脚本 脚本入参、超时时间、执行用户、资源受限 脚本入参支持20个。 单次下发的机器支持200个。 单次批次内机器数量最大10个。 最大批次数量为20批。 脚本输出的日志总量只支持1MB。 URI POST /v1/job/scripts/{script_uuid}
“手动安装UniAgent”页面 UniAgent安装完成后,单击 “返回自动安装”。 单击“设置安装机”,设置刚才完成UniAgent安装的机器为安装机。 图4 设置安装机 在弹框中填写设置安装机相关信息,单击“确认”。 图5 确定安装机 父主题: 资源管理常见问题