检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
设置“脚本内容”。 脚本类型:可选择脚本类型“Shell”、“Python”、“Bat”。 脚本内容:录入脚本内容。 脚本内容首行自动添加的解释器,例如#!/usr/bin/python需要用户的机器让有python的软链接,若缺乏软链接,需要用户自行修改解释器,适配为机器可执行的解释器。
运维中心”,最大会话持续时长推荐选择“12小时”; 点击页面最下方的“完成”,即完成委托创建,之后点击弹窗中的“立即授权”,进入委托授权页面; 图8 完成信任委托创建 在授权列表右上角搜索步骤3-5中创建的策略的名称,选中,点击确定,即完成授权。 图9 委托授权 执行账号委托 以
可以选择排班或个人进行审批。 暂停 可以用来暂停作业,需要在工单详情中手动点击“继续”才能继续执行。 睡眠 可以用来睡眠作业,达到设置的睡眠时间后工单继续执行。 自定义脚本 执行命令 可以用来执行特定的命令。支持“Shell”、“Python”、“Bat”三种命令类型,支持自定义命令内容和命令入参。
在“待我处理”页签,选择需要处理的问题单,单击问题单标题。 单击右上方“现网实施”。 设置“现网实施”。 若区域涉及变更,点击操作列关联变更单并进行变更实施。变更单相关操作请参考变更中心。 若区域不涉及变更,点击操作列的“不涉及变更”。 支持添加区域和删除已有区域。 单击“实施完成”。 完成问题单现网实施,问题单状态为“待验证”。
应用资源管理”。 单击左上方“应用管理”。 单击左侧“创建应用”。 设置“创建应用”。 每个层级的必填字段填写完成需要点击“保存”进入下个层级,所有层级的必填字段填写完毕后,才可以点击“创建”按钮创建应用。 表1 创建应用参数说明 参数 说明 示例 应用结构类型 请根据应用结构的复杂类型选择。
应用韧性评估”。 单击操作列“查看报告”。 查看最新的评估报告详情。 1. 评估报告详情中,给出了识别到的风险项,并给出优化建议。 2. 若您认为部分风险项可以不进行优化,则可在查看评估报告详情中,点击“忽略风险”按钮,将其忽略。 父主题: 应用韧性评估
故障模式和演练任务的关系? 故障模式是对云应用进行评估,识别风险,是混沌演练的前提,演练任务将不同的攻击场景组合起来,使用故障注入来模拟对应的故障模式。 父主题: 韧性中心常见问题
器 ECS、裸金属服务器 BMS、Flexus应用服务器L实例三种云资源。 自定义脚本 自定义脚本是由用户自定义创建并管理,脚本支持“Shell”、“Python”、“Bat”三种命令,支持全局参数和关联参数仓库。 脚本内容大小限制1M。 单个租户账号下所有子账号最多支持创建200个脚本。
操作场景 当汇聚告警生成后,用户可以通过云运维中心将指定汇聚告警转为事件。转为事件后会生成相应的事件单,在关联事件单号列显示生成的实际单号。点击事件单号查看事件单详情,可以对事件单进行受理、驳回、转单、处理等操作。 注意事项 只有责任人可以将当前告警转为事件。 操作步骤 登录云运维中心。
案进行应对。 COC混沌演练为用户提供一站式的自动化演练能力,覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端演练流程。承载华为云SRE在混沌演练上多年的最佳实践,使客户能对云上应用主动地进行风险识别、消减和风险验证,持续提升云应用的韧性。 镜像与武器版本支持声明 COC
概述 改进管理主要是故障处理过程识别到一些产品、运维或管理改进事项,可通过改进单进行跟踪闭环。运维改进事项如某应用未配置某个场景的告警规则,需补充告警规则及时发现软件产品异常。改进单来源包含事件、Warrroom、混沌演练、PRR评审。 图1 改进管理流程 父主题: 改进管理
查看报告:提供应用的评估结果,展示评估过程中的涉及到的评估项以及存在的风险项,并给出优化建议。 使用前提 使用应用韧性评估需要您对服务进行授权,授权步骤请参考MAS。 支持场景 创建应用韧性评估任务,在评估时会自动关联应用下的资源进行分析并给出评估报告。在评估报告中会给出识别到的风险和优化建议。 1. 当前应用韧性评
另外: 故障处理过程中如果需要增加相关成员并拉入群组,请参考与会成员操作。 故障处理过程中如果需要发布通告将故障处理进展及时同步给相关人员,请参考进展通告操作。 故障处理过程中如果识别到一些产品、运维或管理改进事项,可以创建改进单,并通过改进管理处理。 前提条件 需要有正在处理
作业,需先执行作业;若是变更指导书,按照变更指导书步骤实施变更。 图1 变更实施 变更结束后,点“变更结束”,并填写变更结果。 图2 填写变更结果 回填完变更结果,点击“关单”关闭变更单,变更结束。 图3 关闭变更单 父主题: 变更中心
编辑审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,点击操作列的“编辑”,修改审批配置信息。 图3 修改审批配置 删除审批配置 登录COC。 在左侧菜单栏选择“变更管理 > 变更配置”页面,点击操作列的“删除”,删除审批配置信息。 图4 删除审批配置 父主题: 变更管理
某电商企业的新应用已经部署生产环境,计划正式启动接入和引流,其传统运维模式日常运维工作以被动救火为主,缺乏主动运维理念和工具能力;应用上线前无有效途径识别可用性问题,上线后可用性现状无法精确掌握,运维团队缺少故障应急能力和实战经验;希望通过混沌演练对应用在生产环境的架构韧性进行一次引流前的“
故障模式是指应用在运行过程中可能出现的特定类型的问题或失效状态。构建丰富的故障模式库,制定相应的预防和恢复措施,有助于设计更加高可用的应用系统。通过识别潜在的故障,可以针对该故障进行日常演练,验证故障恢复措施和故障影响是否符合预期,为更好地应对各种挑战做好准备。您可以对应用可能发生的故障点
快速配置中心 如果“总览”页面,没有显示快速配置中心部分(图1显示的部分),点击顶部“快速配置中心”展开快速配置中心部分 图2 快速配置中心入口 点击卡片,进入对应场景的配置页面。 进入快速配置中心页面,点击不同类型配置任务的“前往配置”按钮进行配置。 图3 选择场景前往配置 云服务配置
的“Region”,点击“一键配置”,点击“确认”,完成Config服务开通。 AK/SK所对应的账号需添加Action。 创建策略:进入“IAM”服务,选择“策略”,点击“创建策略”,选择服务“EC2”,筛选操作并勾上“DescribeRegions”,点击“添加更多权限”,选
列出组织的根 organizations:roots:list 跨账号场景下,查询当前组织的root 修改或删除委托权限 若开通COC后,识别到存在委托权限过大或权限不足的情况,可以前往统一身份认证服务中修改委托策略。 如果需要修改委托的权限、持续时间、描述等,可以在委托列表中,单击委托右侧的“修改”,修改委托。